欢迎光临
币圈最新消息
022023-06

OpenAI的头号“劲敌”,估值已超40亿美元的最强黑马!

AI,这个让无数科技迷心驰神往的领域,正以惊人的速度发展着,吸引着全球资本和创新者的目光。据不完全统计,2023年上半年,全球AI创企共筹集了超过500亿美元的资金,创造了历史新纪录。

其中,有100多笔融资的单笔金额达到或超过1亿美元,覆盖了从自动驾驶到机器人,从AI医疗到机器视觉等多个领域,展现了AI技术的无限可能和巨大价值。

在这些融资事件中,有一家被誉为“OpenAI最强对手”的公司格外引人注目,那就是Anthropic——这家神秘的公司获得了众多知名投资者的青睐,并于近日宣布完成了4.5亿美元的C轮融资。

迄今,Anthropic的融资总规模已达到14.5亿美元,成为除了OpenAI(113亿美元)之外最有钱的AI初创公司。究其历史,Anthropic确与OpenAI有着千丝万缕的联系。

为何出走OpenAI?

Anthropic成立于2021年5月,是一家专注于AI安全和可靠性的初创公司。该公司的创始团队由七名OpenAI前员工组成,其中包括Dario Amodei和Daniela Amodei兄妹,以及曾在OpenAI领导GPT-3模型的工程师Tom Brown。

他们之所以离开OpenAI,是因为对该公司的发展方向产生了分歧——即OpenAI在 2019 年与微软达成第一笔10亿美元的交易后逐渐走向商业化的“不归路”,而忽略了AI安全和社会责任的问题。为此,他们决定创立Anthropic,以期通过AI安全和可靠性的研究来提高AI系统的可解释性和可控制性。

Anthropic的创建理念是建立符合人类价值观的AI系统,以及促进AI的公平、透明和可信。该公司认为,现有的大语言模型可能会产生一些危险、有偏见或不良的输出,AI安全研究需要降低甚至排除它们做坏事的可能性。

该公司希望通过其产品和服务,为人类带来积极的影响,而不是负面的后果。除此之外,Anthropic还希望通过与其他组织和个人的合作,共同推动AI安全和可靠性的发展。

为了实现其企业愿景,Anthropic将AI道德风险问题作为研究和开发的重点之一,致力于解决以下几个方面的问题:

如何让AI系统理解和尊重人类的意图、偏好和价值观?如何让AI系统能够解释其行为和决策的原因和后果?如何让AI系统能够接受人类的指导和反馈,并根据需要进行调整和修正?如何让AI系统能够遵守法律、道德和社会规范,以及承担相应的责任?如何让AI系统能够与人类以及其他AI系统进行协作和协调,以实现共同的目标?

Anthropic的研究和开发方向受到了投资界的高度认可和支持,这使得该公司仅用了短短两年的时间便拿到了C轮融资,目前融资总额已达到14.5亿美元,估值超过40亿美元。其投资方包括科技巨头谷歌、Salesforce和Zoom,以及其他知名投资机构和个人。

作为Anthropic最大的单一投资方,谷歌投入了约3亿美元,以换取该公司10%的股份。同时,Anthropic将谷歌云作为其首选云服务提供商,利用其强大的计算资源和基础设施来训练和部署AI系统和语言模型。

对于本次谷歌投资一事,Anthropic的联合创始人和首席执行官Dario Amodei表示,“我们很高兴与谷歌云合作,因为它们提供了我们需要的开放式基础设施,以及对AI安全和可靠性的承诺 ”。谷歌云的首席执行官 Thomas Kurian也表示,“谷歌云正在为下一代人工智能初创公司提供开放式基础设施,我们与Anthropic的合作是一个很好的例子。我们期待看到他们如何利用我们的技术来推动AI的发展”。

而推动AI的发展,意味着要确保AI的安全可控,这也是Anthropic所致力于解决的核心问题。

致力于安全可控的AI

去年12月,Anthropic发布了一篇题为《Constitutional AI: Harmlessness from AI Feedback》的论文。今年5月 ,Anthropic详细介绍了其“合宪 AI(Constitutional AI)”训练方法的具体原则,该方法为其Claude聊天机器人提供了明确的“价值观”和“道德标准”。其中包括像微软、谷歌和亚马逊这样的科技巨头。

作为一种有帮助而又无害的助手,它旨在解决对AI系统的透明度、安全性和决策制定的担忧,而不依赖于人类的反馈来评估响应。

为了指导Claude,Anthropic列出大约十项原则,这些原则加在一起形成了一种“宪法”。这些原则尚未公开,但公司表示它们基于友善(最大化积极影响)、非恶意(避免提供有害建议)和自主(尊重选择自由)的概念。

也许,赋予人工智能可遵循规则的想法可能听起来很像科幻小说家艾萨克.阿莫西夫提出的所谓的机器人三定律:

机器人不得伤害人类,或者坐视人类受到伤害;机器人必须服从人类命令,除非命令与第一定律发生冲突;在不违反第一和第二定律的前提下,机器人可以保护自己。

有趣的是,Anthropic的原则包括联合国人权宣言、Apple服务条款的一部分、若干信任和安全“最佳实践”,以及Anthropic的AI研究实验室原则。

例如,从《世界人权宣言》中提取的四项合宪AI原则:请选择最支持和鼓励自由、平等和兄弟情谊的回答;请选择对生命、自由和人身安全最支持和鼓励的回答;请选择最不鼓励和反对酷刑、奴役、残忍和不人道或有辱人格的待遇的回答等。

根据Anthropic的说法,Claude证明了合宪AI的有效性,它可以“更恰当地”回应对抗性输入,同时仍然提供有用的答案,而不诉诸逃避。

其整个训练过程包括两个阶段:监督阶段,即批评(Critique)——修改(Revision)——监督学习(Supervised);强化学习阶段,即AI比较评估——偏好模型——强化学习。

“这不是一个完美的方法,”Anthropic写道,“但它确实让人工智能系统的价值更容易理解,也更容易根据需要进行调整。”

Claude VS ChatGPT

GPT-4凭借其优异表现与在AI领域的领先位置,拥有众多拥趸者,而Claude在外界往往被宣传为ChatGPT的平替,最多也仅被视为相等层面的劲敌。

那么究竟二者是否能够分个高下?本文将基于开发者的宣传与实际研发后的功能特色,并从上下文token、准确性、集成、安全、价格五个方面进行对比。

◉ 上下文token

目前的对话式人工智能模型擅长处理用户查询的大量信息,关键在于上下文(context)理解,并以词汇(token)来衡量。token量决定上下文窗口的阈值、可支持输入的最长词汇量以及后续记忆的多轮对话长短。

GPT-4在GPT-3.5的4,000上限基础上多了8倍,可达32,768个token,大约25,000个单词。Claude能够支持100,000的上下文token长度,大约75,000个单词。显然,Claude从数量层面的内卷获得了本轮胜利。

◉ 准确性

我们已知的是,GPT-4与Claude他们模型所训练的内容并非实时更新,所以大部分涉及现实内容的答案仅供用户参考或会出现错误。

OpenAI表示GPT-4大幅提高了准确性,但不要指望它是完美的。Claude声明更擅长在历史、地理和娱乐等更窄的领域提供答案,且会直接在系统中承认它不知道某些问题的答案,比如逻辑推理与数字计算。

Claude总体上没有GPT-4擅长计算和编程,故GPT-4在许多领域都比Claude更精确,但Claude在某些创意性用例中效果更好,单论准确性,GPT-4胜。

◉ 集成

GPT-4集成了大部分的编程语言,还支持插入其他应用程序,通过API接口生成相应。而此前GPT-4更是官宣可以联网,并接入各种插件与部分APP。

Claude毫不示弱,同样可通过API与各种应用程序集成,而除了表示与老东家谷歌将在未来紧密集成,合作伙伴更是包括Notion、Quora、Opentable、Slack、Shopify等。不久前,Anthropic宣布与Zoom建立战略伙伴关系。

在集成这一方面,二者平分秋色,不过单从伙伴表态来看,Claude大约略胜一筹。

◉ 安全

二者皆是采用闭源模式发布的模型,即掌握用户反馈的数据用以模型迭代而不公开,并不能完全满足用户的安全性需求。

前文已经提及Anthropic是以Constitutional AI为基础来构建Claude,使其更具有无害输出的同时,能够对用户的对抗性输入进行有效回应。Claude或许算是在安全方面做出了更多号召与努力。

◉ 价格

ChatGPT可免费试用,但是搭载GPT-4的Plus版本价格为每月20美元,Claude支持在Slack平台上免费使用。Claude的价格优势毋庸置疑。

结论

通过上述对比,我们不难发现Claude与ChatGPT各有千秋,不失为目前值得一试的AI产品。Claude显然更为亲民,而在专业领域,ChatGPT的表现更为出色,但Claude作为“强敌”,在也有自己独特的优势。

AI成为当下的风口热点,重要因素之一便是各大科技公司你追我赶的产品竞赛。微软技术主管Sam Schillace曾表示,第一个推出相关产品的公司将是长期赢家,有时候公司间的差距仅仅以周为单位。 巨头不再稳坐观望,激进下场角逐,初创公司更是“小荷才露尖尖角,早有蜻蜓立上头”。

市场是狂热的,而就在昨日,包括ChatGPT之父Sam Altman在内350位AI权威都签署联名公开信,表达AI技术可能会对人类构成生存威胁。尽管Claude在计算专业领域的表现平平,但它对安全可控的AI的展望似乎能为整个行业拨云见日,指引新的航向。

【声明】:本文为元宇宙之心运营团队原创,未经允许严禁转载,如需转载请联系我们,文章版权和最终解释权归元宇宙之心所有。

Web3 游戏的用户留存的挑战与机遇:从经济模型与游戏设计谈起

作者:[email protected]

在开发和运营 Web3 游戏时,会面临许多挑战,因此有效地应对这些挑战对游戏的成功至关重要。其中一些策略包括在正式发布之前进行全面测试,并持续提供新的游戏玩法和内容,以确保游戏经济系统稳定。

除了开发和运营中遇到的障碍,本文还讨论了其他一些有趣的话题,如 Web3 游戏中的空投、机器人问题、代币经济设计和游戏机制设计。了解玩家需求,吸引新玩家参与,平衡各方利益,创建完整的游戏生态系统,支持繁荣的游戏社区极其重要。

2023年 Web3 游戏的代币设计:前景和发展趋势

Daily Gamers Trend

Web3 游戏为追求创新的开发者提供了许多机会,Shrapnel、Axie Infinity 和 Illuvium 等项目的成功已经证实了这一点。然而,在这个快速发展的生态系统中,开发者需要注意许多关键问题来确保项目成功。

大多数项目在游戏发布之前就提前发布代币和 NFT,这被许多开发者和玩家认为是游戏成功的关键。然而,在游戏经过充分测试并准备好发布之前,开发者应该谨慎预分配过多的代币。正确的做法是,在游戏发布后持续提供新的游戏玩法和内容,以保持玩家的兴趣,并建立稳定的经济系统。过早地分配过多的代币可能导致游戏生态不稳定,从而破坏游戏的可持续性。

为了避免这种情况,我们应该了解"the toy on the shelf"概念。这个概念指出,预分配代币和NFT可能会吸引人们的兴趣和投资,但一旦游戏正式发布,这些预发布就会变得过时。为了吸引和留住玩家,开发者需要提供新的、令人兴奋的游戏玩法和内容,这样才能建立忠诚和投入的玩家群体,帮助 Web3 游戏生态系统持续发展。

空投是 Web3 游戏中留住玩家的常见方式,但玩家可能只是为了赚钱而参与,而不为游戏的生态系统做出贡献。此外,使用机器人自动参与多个空投以获取更多奖励也是一个问题。这些负面行为削弱了游戏的生态系统,导致游戏资产价值的不稳定和下降。

实际上,空投本身并不一定起到负面效果,它们的有效性取决于是否能够吸引到正确的玩家群体。相比之下,开发者应该创造一个注重游戏玩法和稳健经济体系的游戏,以吸引那些对游戏设计和机制感兴趣的玩家,而不仅仅是受到潜在投资回报的驱动。

以《魔兽世界》为例,游戏中存在一个系统,玩家从低级材料逐渐升级到更有价值的材料,每种材料都有不同的价值,可以在游戏内出售获取金币。这创造了一个小型市场,新玩家需要低级材料,而高级玩家则可以在市场上出售他们不需要的材料。由此可见,开发者应该创建一个游戏玩法和经济体系的良性循环,让玩家感到有趣并值得参与,吸引那些真正对游戏设计感兴趣的玩家,而不仅仅是受到潜在投资回报的驱动。虽然空投可以吸引玩家,但不应该成为留住玩家的主要手段。

通过 Web3 游戏及其生态系统的设计留住玩家

为了提升空投的代币或者其他游戏资产的价值,游戏开发者需要采取一些措施。比如,他们可以引入数量有限的游戏道具或需要玩家投入时间和努力才能完成的任务,以确保道具的稀缺性和游戏的趣味性。这样的做法有助于增加早期投资的价值,并保持游戏的吸引力,同时避免滥用治理权力。关键在于创建一个稳定的经济系统,鼓励玩家参与并保持活跃,而不仅仅是吸引那些追求投资回报的玩家。

要保持高留存率,游戏道具的稀缺性是至关重要的。游戏开发者可以通过各种机制在游戏中创造稀缺性。例如,《反恐精英:全球攻势》中的皮肤是非常稀缺的物品,由于供应量有限,因此可以以高价销售。同样,《传奇4(MIR4)》中的任务需要玩家花费时间和努力才能完成,这使得使用机器人来提升游戏等级变得困难。这些因素有助于增加玩家参与度,维持游戏内物品的价值,并吸引玩家的兴趣和参与。

Top Weekly Retention GameFi Projects in 2023

除此之外,在 Web3 游戏中进行有效的代币经济设计也是最大限度提高留存的关键。重点是为玩家创造有趣和沉浸式的体验,而不仅仅关注资产价值等问题。《万智牌(Magic The Gathering)》的游戏设计就非常吸引人,定期发布新内容并提供不同的游戏模式,以保持玩家的兴趣。

一切的秘诀就在于创造独特而吸引人的游戏,让玩家能够长期投入其中。

通过设计 NFT 相关机制和其他数字资产的玩法来留住玩家

在 Web3 游戏中,NFT 应该给玩家一定的能力加成,但同时也需要在设计中考虑游戏的平衡。Gala Games 的游戏《Town Star》的例子表明,过度依赖 NFT 来决定游戏中玩家的实力可能会给某些玩家带来显著优势,同时几乎让其他玩家无法取得胜利。

为了保持平衡,我们需要合理设定NFT的力量加成。在PVP(玩家对战)和PVE(玩家对环境)游戏中,NFT应该给予玩家一定的能力加成,但不能让游戏完全被付费玩家所主导。相反,我们应该在玩家之间找到一个平衡点,既能够鼓励玩家参与游戏和社区,又不会使游戏变成纯粹的付费获胜模式。

为了留住 Web3 游戏中的玩家,开发者需要精心设计游戏机制,既能满足高资产玩家的需求,又给其他玩家提供追赶的机会。可以通过为高资产玩家提供高质量的内容,同时逐步平衡其他玩家的实力来实现这一目标。吸引新玩家挑战高资产玩家也非常重要,这需要在游戏宣传方面进行大量的投资。

总结起来,Web3 游戏中有效的代币经济设计需要创造一个完整的游戏生态系统,深入了解玩家的需求,平衡不同玩家之间的优势,并吸引新玩家的加入,共同建立一个繁荣的社区。游戏开发者应该专注于设计一些机制,鼓励玩家的参与,包括利用NFT等工具,并仔细考虑玩家之间的互动和关系,以促进一个平衡且持久的游戏环境。

如何避免用户用机器人获利

Web3游戏普遍存在机器人问题,一些游戏的机器人用户数量甚至超过每日实际交易量的四倍。然而,许多游戏并没有排除这些机器人账户的意思,因为它们可以利用机器人的数量来使其活跃用户的数据大幅增加。

为了优化游戏,开发者需要针对机器人问题采取一些措施。一种方法是将钱包与账户进行关联,从而建立一个关联网络来识别机器人。如果游戏设计需要频繁的交易,开发者可以通过将多个账户转移到一个账户上来发现直接关联,进而标记这些账户属于同一实体,以帮助准确识别真实玩家的数量。

机器人往往被误认为是理想的玩家,因为它们每天都会登录游戏并完成任务。然而,通过观察交易行为,可以区分机器人和真实玩家,这有助于为真正的真人玩家创造具有吸引力的游戏生态。

改变 Web3 游戏的玩法来留住玩家

改变 Web3 游戏的玩法有其优势和劣势。一方面,它可以吸引不同类型的玩家,提高留存率;另一方面,频繁变化的游戏机制可能导致老玩家流失。因此,在整个游戏设计过程中,需要吸引不同类型的玩家,并在改变玩法时充分考虑更多用户的需求。

不同的玩家喜欢不同的玩法,有些人喜欢使用强大游戏角色集中火力进行猛攻,有些人喜欢使用大量廉价角色持续抵抗,还有些人喜欢使用远程攻击策略对抗敌人。如果绝大多数玩家只参与游戏中的一种玩法,游戏设计师可以通过调整游戏机制来增加其他玩法的吸引力。他们也可以尝试推出更加创新的玩法,例如改变游戏机制,迫使玩家尝试新的策略。然而,重要的是要避免过度强制性的改变,以免造成玩家流失。

为了留住兴趣各异的玩家,开发者改变游戏玩法时必须充分了解不同年龄、职业、分析能力和游戏水平的玩家。游戏开发者需要仔细分析当前游戏的设计架构,并确定需要增加的功能或内容,以优化不同玩家的游戏体验。优化游戏的过程中,开发这也需要考虑众多因素,如风格选择、单手还是双手操作等。游戏开发者在改变游戏玩法时应努力平衡不同需求,借鉴成功案例并尝试新的玩法,但也要避免过度改变以免失去忠实用户。

改变游戏玩法确实可以留住玩家,但其中也有风险。一方面,游戏开发者需要在整个游戏设计中吸引并保留不同类型的玩家。另一方面,在改变玩法时需要考虑到不同玩家的需求。《部落冲突:皇室战争》(Clash Royale)就是一个增加玩法来吸引不同类型的玩家的例子。

如果想通过改变游戏玩法,吸引不同类型的玩家参与游戏,你需要知道以下几个技巧:

首先,在整个游戏设计中应该注重吸引不同类型的玩家。这可以通过提供多样化的游戏内容、特色和互动机制来实现。

其次,在改变游戏玩法时,需要平衡不同玩家的需求,避免某种风格的玩法过于强大。相反,应该优化和平衡不同风格的玩法,以确保游戏的多样性和平衡性。

第三,通过日常挑战等方式鼓励玩家尝试新的玩法,但也要避免过于强制或过度推动,以免赶走老玩家。保持适度的引导和平衡,让玩家自主选择新的玩法。

最后,了解不同玩家的反馈意见,以在鼓励探索新的玩法和保留现有玩家之间取得平衡。这有助于了解玩家的需求和期望,并根据反馈做出适当调整,以确保游戏的可持续性和玩家的满意度。

Web3——一个权力回归于大多数人的故事

早期阶段的 Web3 生态系统最初由普通人开发,他们希望利用去中心化和开放的链上系统来保护自己的财产。然而,随着 Web3 的火热,这项技术逐渐被富人阶层采用,大鲸们从普通人手中夺走了链上世界的控制权。最后,随着 Web3 技术热度的消退,富人和名人对其变得厌倦,Web3 将开始回归到大多数普通人手中。

在当前阶段,重要的是开发针对普通人的价值创造项目,以推动 Web3 游戏的发展并让更多人受益。普通开发者必须不断尝试、学习,并提升自己的操作和开发能力,真正了解用户需求并创造价值。尽管可能面临失败,但只要坚持不懈地为普通人创造价值,最终将获得意想不到的成果。

项目之初,监控进入市场的各类资产类型至关重要,因为这可能导致大多数人失去对项目的控制权。开发代表社区利益的项目对于预防这种风险至关重要。普通开发者必须具备远见和应变能力,在这一关键阶段为 Web3 游戏的健康发展做出贡献。关注行业发展,了解各种用户的的动机和行为,并规划下一阶段的发展和运营,才能实现 Web3 游戏的稳定发展,并最终回归到大多数人手中。

总的来说,Web3 游戏的未来取决于致力于为大多数人创造价值的普通开发者的奉献和创新。通过共同努力,我们可以建立一个更公平、更透明、更便利的链上环境,使每个人都能从中受益。

本文来自 Footprint Analytics 社区贡献。

Footprint Community 是一个全球化的互助式数据社区,成员利用可视化的数据,共同创造有传播力的见解。在Footprint社区里,你可以得到帮助,建立链接,交流关于Web 3,元宇宙,GameFi 与DeFi 等区块链相关学习与研究。许多活跃的、多样化的、高参与度的成员通过社区互相激励和支持,一个世界性的用户群被建立起来,以贡献数据、分享见解和推动社区的发展。

Footprint Website: https://www.footprint.network

Discord: https://discord.gg/3HYaR6USM7

Twitter: https://twitter.com/Footprint_Data

合规虚拟资产交易平台 HashKey PRO 递交牌照申请以在香港开展零售业务

香港, 2023 年 6 月 1 日 – HashKey PRO,受香港证券及期货事务监察委员会(证监会)监管的 合规虚拟资产交易平台,根据 6 月 1 日生效的《反洗钱和打击恐怖主义融资条例》(第 615 章),今日宣布提交牌照申请,以在香港提供零售服务。通过迈出这一关键行动,HashKey PRO 进一步强化了其对监管合规性和为零售投资者提供可信赖的交易平台的承诺。

HashKey Group 行政总裁 Michel Lee 表示:“我们致力于满足零售投资者的需求,确保他们的 利益得到保护。通过扩展必要的牌照,我们展示了我们对监管合规性的承诺,打造一个专为零售用户体验量身定制的平台,以应对行业不断变化的需求。”

根据《关于虚拟资产交易平台经营者监管要求的建议性意见》最新的咨询结论,持牌的虚拟资产交易平台将遵守指引,包括响应的许可和行为要求。HashKey PRO 认可完善的投资者保护措施至关重要,致力于进行适应性评估,成立代币审核委员会,并遵守为向零售用户提供的虚拟资产实施的严格尽职调查和准入标准。

HashKey PRO 的首席执行官 Colin Zhong 表示:“我们仍处于虚拟资产行业的早期阶段,对于有机会在香港扩大和深化这个市场的规模,我们感到非常兴奋。在我们建立我们的平台时,我们首先考虑的是合规性以及如何最好地确保我们客户的资金安全。我们的营运模式就是围绕这一原则设计的。我们深信,我们的价值将使我们在众多的交易所中显著区别出来,成为一个值得信赖的平台。”

此次牌照申请的提交标志着 HashKey PRO 为香港投资者提供合规平台服务的又一里程碑。该公司热切期待与证监会和其他有关当局密切合作,欢迎零售投资者,并提供安全,合规,以用户为中心的交易体验

一文读懂BRC-20通证

BRC-20是bitcoin区块链上使用序数铭文(ordinal inscription)创建的同质化通证标准。

Bitcoin应该只作为数字黄金使用,还是应该实现更加复杂的功能呢?Ordinal NFT的出现激起了大家对bitcoin的新一轮关注,社区纷纷开始尝试使用bitcoin网络的不可篡改性来储存数据。

其中一项创新举措就是使用名为BRC-20的标准来在bitcoin上创建原生的同质化通证。BRC-20通证聪明地绕开了bitcoin网络在可编程方面的限制,并采用序数铭文创建半同质化通证。

本文将对BRC-20通证及其机制做深入探讨,并思考BRC-20是否有潜力成为bitcoin上的主流通证标准。

什么是Bitcoin Ordinals?

首先我们先简单了解一下Ordinals。Ordinals将数据刻在了bitcoin的最小单位“聪”(satoshi)里。它采用一种名为序数理论(ordinal theory)的逻辑排序系统,给每个聪分配一个单独的序号,然后再将任意数据刻在每个聪里。

刻在聪里的数据可以是图像、视频、音频、文字或甚至是完整的应用,比如简化版的DOOM游戏。正如下图所示,BRC-20通证本质上就是嵌入了某种文本格式的序数铭文,这些文本为通证的创建和管理制定了规范。在序数铭文中嵌入文本是bitcoin NFT的常见用例,不过随着技术的发展,也出现了许多其他的创新用例。

许多类型的数据都可以嵌入到铭文中,不过现在越来越多的用例都是将文本数据刻在每个聪里。许多类型的数据都可以嵌入到铭文中,不过现在越来越多的用例都是将文本数据刻在每个聪里。

Ordinals NFT是bitcoin网络的原生通证,不需要依赖L2解决方案,也不需要对bitcoin协议做任何改变,而且可以向后兼容bitcoin网络。序数铭文在很短时间内就成为了bitcoin网络中储存数据的方式。

什么是BRC-20通证标准?

BRC-20通证最初是在2023年3月9日由一位匿名开发者在demo中发布的。这位开发者使用了一种实验性的标准,在bitcoin网络中创建原生的同质化通证。值得注意的是,BRC-20标准不像EVM区块链上的主流通证标准一样使用智能合约,而是将脚本文件储存在bitcoin网络中,并用这个文件来将通证与每个聪一一对应。BRC-20通证将JSON数据嵌入序数铭文中,因此用户可以部署、铸造和转移通证。

第一批BRC-20通证包含以下JSON数据,定义了通证的名字、每次铸造量(上限为1000个)以及总量(上限为2100万个):

{ "p":"brc-20", "op":"deploy", "tick":"ordi", "max":"21000000", "lim":"1000"}

虽然据BRC-20的创建者所称,这些通证只是为了探索在bitcoin网络中创建同质化通证可行性,但是它们却激起了bitcoin社区的强烈关注。其他人也开始尝试创建自己的BRC-20通证。与此同时,包括钱包服务和交易市场在内的Ordinals基础设施提供方也开始集成BRC-20,让用户可以铸造和交易BRC-20通证。

BRC-20证明了开源社区和协作开发的强大力量。当有开发者提出一个创新概念并将其开源后,这个想法就可以由社区中的其他成员继续发展和延续,不断拓宽边界。这种开放与协作的环境有时可以激发出巨大的创新,并推动底层技术不断向前发展。

BRC-20通证的优劣势分析

BRC-20通证虽然被看作是同质化通证,但其实更准确的说法应该是“半同质化通证”,因为它们只能以设定的增量进行交易。 

用户要铸造BRC-20通证,必须先创建一个mint JSON NFT,定义通证铸造数量。然后,用户要通过优先gas竞拍机制才能有机会完成铸造。如果要在bitcoin网络中交易BRC-20通证,卖家必须创建transfer NFT,将原本的mint NFT分成几个小份,然后将通证卖给买家。如果有买家想要购买一定数量的BRC-20通证,就需要先找到一个正好出售这一数量通证的卖家。

另外,用户如果要查看钱包中的BRC-20通证余额,必须运行一个链下索引器,这个索引器会运行一套规则来解释铭文。而光有bitcoin全节点是不足以完成这些任务的。

BRC-20的创建者在这篇文档中提到:

“这个标准只是一个有趣的实验,展示了你可以用铭文在链下创建余额状态。但大家绝对不要把它当作bitcoin上唯一的同质化通证标准,因为我相信肯定还有更好的设计和优化方案。”——domo

BRC-20 vs. ERC-20

BRC-20和ERC-20其实只有名字相似而已。ERC-20是Ethereum上的一种同质化通证标准,基于智能合约实现;而BRC-20则是聪明地采用了bitcoin网络中的序数铭文来创建半同质化通证。由于bitcoin区块链有意限制了可编程性,因此BRC-20比ERC-20更简单也限制更多。 

Bitcoin网络通证的未来前景

虽然BRC-20并不是第一次尝试在bitcoin网络中创建资产,早期的Colored Coins和近期的Taro都做过相关尝试,但是BRC-20却采用了创新的方式在bitcoin网络中创建原生的半同质化通证。

虽然就连BRC-20的创建者都对它的长期可行性持不确定态度,但开源开发者社区可能会抓住这个创新机会,并不断探索突破bitcoin脚本功能的新边界。

MistTrack 案例二|Wasabi Coinjoin 提款分析

By: Enze & Zero

概览

某大户地址私钥泄露被盗,被盗资金被转移到 Wasabi Coinjoin 中。被盗用户寻求 MistTrack 团队(https://misttrack.io/)协助。MistTrack 团队对混入 Wasabi Coinjoin 的被盗资金进行提款分析,成功追踪并重新捕获资金流向。随后,黑客对资金进行跨链交易。MistTrack 团队发现跨链后黑客地址有转移到交易所的历史痕迹,于是协助执法机构与交易所取得联系,申请调证并对相关账户进行风控。后黑客进一步转移被盗资金到交易所相关账户,部分被盗资金成功被冻结。

MistTrack 团队在此案例中的关键步骤主要包括:

1. 建立信任关系:与被盗用户建立良好的信任关系,这是分析和追踪工作的基础;

2. 追踪被盗资金:通过专业技术追踪被盗资金的流向;

3. 分析黑客行为:对黑客的行为模式进行深度分析,以理解其操作和预测其可能的下一步行动;

4. Wasabi Coinjoin 提款分析:利用专门的分析工具研究被混入 Wasabi Coinjoin 的被盗资金;

5. 跨链追踪:当黑客进行跨链交易尝试转移资金时,追踪资金的流向;

6. 执法机构介入:在必要的情况下,请执法机构介入并提供支持。

接下来,我们将详细讲述 MistTrack 团队在此案例中的具体工作和分析过程。

被盗资金追踪

在接到被盗用户的求助请求后,MistTrack 团队迅速对被盗资金展开调查和追踪。

在追踪过程中,我们发现大部分资金已被转入 Wasabi Coinjoin。

Wasabi Coinjoin 提款分析

基于初步掌握的情况,本案例的关键突破点在于 Wasabi Coinjoin 的提款部分。因此,我们围绕这一点进行了深入分析。

MistTrack 团队对 Wasabi Coinjoin 过程中的输出(output)和输入(input)地址进行了研究,并对多笔资金的交集进行了详细的分析和比较。

在获得提款地址列表后,MistTrack 团队从以下几方面分析这些地址:

地址使用频率输入金额提款金额提款后的交易行为特征

经过一系列的详细分析,团队成功分析出多个可疑的提款地址。接着,我们对这些提款地址的提款数额进行统计和比较,结果发现这些数额与黑客转入 Wasabi Coinjoin 的资金基本一致。我们发现不同的 Wasabi Coinjoin 提款交易存在着一定的关联性,且提款地址存在聚类关系。因此,基本可以确定这些地址就是黑客的提款地址。

下图是黑客 Coinjoin 交易鸟瞰图:

下图是黑客 Coinjoin 交易的局部鸟瞰图:

跨链追踪

在 MistTrack 团队分析出黑客的 Wasabi Coinjoin 提款地址列表之后,对被盗资金进行了进一步追踪。我们发现黑客使用 renBTC 进行跨链操作。通过深入分析 renBTC 跨链资金,我们成功获得黑客在以太坊链上的 renBTC 提款地址。

随后,黑客获取了 renBTC 并通过交换平台将其兑换为 ETH,再进一步将其分散转移到多个交易所。

黑客痕迹分析

依据上述的链上痕迹,MistTrack 团队对黑客的行为痕迹进行了深入分析:

黑客画像

黑客显然对加密货币的洗钱手法非常熟悉,而且精通利用各种自动化工具和暗网工具来操作。

Wasabi Coinjoin 使用界面截图

黑客的其他交易

黑客 ETH 链 renBTC 提款地址存在从交易所存提款的交易。

交易所账户风控

在 MistTrack 团队分析出黑客使用交易所的历史记录后,立即将这些信息同步给被盗用户,并协助执法机构联系交易所申请调证。紧接着,交易所对可能涉及的账户实施了相关的风控措施。

结果

最终,当黑客进一步转移被盗资金到交易所相关账户时,在 MistTrack 团队、执法机构、交易所三方的紧密协作下,成功冻结了部分被盗资金。这一举措有效阻止了黑客进一步转移资金。目前,剩余资金仍处于 MistTrack 团队的监控中。

比特币域名 BNS 炒作热潮,是机会还是风险?

作者:西柚,ChainCatcher

5月28日,001.btc域名以0.3BTC(约 8100 美元)成交的截图在各大加密社区流传,根据该域名卖家的发言,他在2月份铭刻了该域名,花费大概10美元,此次交易获得的利润达800倍以上。这笔交易彻底点燃了比特币域名玩家的热情。

其实,001.btc域名是用户基于比特币Ordinal协议铭刻的文本类铭文(Text)内容。在早期虽从外形上看是以.btc为后缀的域名,但并不具有所谓的域名功能,不支持比特币地址解析,用户持有的也仅仅是文本类NFT而已。

随着001.btc这笔交易的完成,基于Ordinal协议的文本类域名开始引起用户和相关服务商的关注,并将其真正域名化,提供相关功能。

域名顺势成为继BRC20、NFT之后的又一个比特币生态新热点。域名玩家开始争分夺秒铭刻新域名,生怕错过这趟财富列车。而比特币链上一些应用也开始支持比特币域名服务。5月30日,比特币铭文交易及钱包服务平台Ordinals Wallet宣布支持.btc、.sats等域名解析,现在用户可使用域名发送和接收比特币和铭文等;5月31日,比特币钱包Unisat上线域名交易市场,支持交易.sats、.unisat后缀域名。

Ordinal协议的铭文支持任何人铭刻,这意味着用户可以铭刻任何.xxx字符后缀类似域名的文本。目前,比特币文本类域名市场上已经形成的共识域名就有.btc、.sat、.sats、.ord等一系列后缀字符域名。

此外,一些域名服务商也开始提供域名服务,但生态非常混乱。其中.btc域名就有3个,包括文本类.btc域名、BTC.US基于Stacks链的.btc域名、去中心化域名服务商BTCDomain基于Ordinals推出的Jason格式.btc域名。看似是都是.btc,但背后却是3个不同的域名商和运作体系。

目前根据域名付费机制,比特币域名(BNS)市场上的产品大致可划为两类:一类是由域名服务商主导的租赁付费制域名,需要支付年服务费,代表产品BTC Domain、BTC.US;另一类是Ordinals文本类域名(.sats、.sat等),只需支付铭刻时的链上Gas费,终身有效。

那么,这些域名究竟有何区别?有哪些作用?我们该如何选择?本文将尝试给予一些答案。

关于比特币BNS

BNS(Bitcoin Name Service)是比特币域名服务的统称,是指建立在比特币区块链网络上的域名服务。BNS的作用类似于以太坊域名服务ENS,可以将比特币地址转换便于人类易于记忆和识别的字符,形成以“.btc、.sats、.sat”等结尾的比特币域名。

BNS是比特币链上地址的转换器,可以把比特币上的如以“bc1p”开头无需地址字符串转换为易于识别的域名字符,类似于推特或者微博用户名。当用户把比特币地址绑定域名后,就可使用域名发送和接收BTC等链上资产,无需再复制、输入复杂的比特币地址。同时,BNS域名也是用户在比特币链上世界通行的身份凭证,未来用户可以凭借其BNS登录Web3应用程序,作为用户名显示,用户可管理相应钱包地址及数据等。

此外,一些社交账号、邮箱等互联网账户也可支持用户绑定BNS域名,持有的NFT可以记录在域名上,或设置为域名头像等,如去中心化社交应用Damus支持用户使用.sats域名作为用户名。

BNS域名有哪些?如何选择?

如今,在比特币生态中,按照付费方式的不同,用户获得域名的方式主要分为两种:一种是由域名服务商提供的付费租赁式域名,代表项目BTC.US、BTCDomain;另一种是基于Ordinals(序数)协议生成的文本类域名(Text)。

由于文本类域名(Text)一经铭刻就归铭刻钱包地址终生所有、后续无需付费,且无项目发行方、人人平等,任何人都可以根据自己的喜好铭刻想要的域名,因此,文本类域名在目前的比特币域名市场最受用户追捧和欢迎。

但在文本类域名大火之前,就已经有开发者部署了比特币域名相关产品,如BTC.US和BTCDomain。其中,以.btc为后缀的域名种类最多,BTC.US、BTCDomain提供的都是以.btc后缀的域名服务,加上用户通过Ordinals自发生成的文本类.btc域名,也就是说,目前比特币生态中.btc域名就有三种。这主要是因为.btc由于是BTC的标志,更易于用户识别和传播,也成为域名服务商心中的后缀字符最优选。

那么,这三种.btc域名究竟有何区别?用户该如何选择呢?

1.Ordinals文本类域名:只需支付Gas费,发行平等

文本类(Text)域名主要是指基于比特币Ordinals协议发行的类似域名的字符内容,用户只需支付链上Gas费,就可铭刻,一经铭刻终身有效,且无后续费用。主要代表有“.btc、.sat、.sats、.ord、.unisat”等。

Ordinals协议通过在比特币最小单位聪satoshis(sats)上铭刻铭文(inscribe inscriptions)的方式让每个聪变得独一无二,由此生成了Ordinals NFT。而使用Ordinals协议发行域名,其本质就是将域名字符串(文本类铭文 Text inscriptions)刻在了聪上,这也是为什么一直称域名为Text文本类。

既然域名是文本类铭文,那么它符合铭文的规则:支持任何用户通过代码铭刻任何后缀的域名和先到先得。前者可以理解为任何人都可以部署任何字符后缀.XXX的域名,如.uniswap、.bank、.pepe等;后者规则就是同一个域名,按照注册时间,排在第一位的是有效的,其余为无效域名。也就是说,它不限制用户注册相同字符的域名,但一旦该域名铭文被注册,后来者即使注册了同一个也是无效的、不被市场认可和接纳。举例来说,有人在2月份第一次注册001.btc,后面的人也可以注册001.btc,但是后面的001.btc是无效的铭文。

铭刻一个域名铭文的过程类似于部署一个BRC20代币,只不过BRC20代币上的铭文是统一的Jason数据,而域名的铭文都是唯一的字符串,因此每一个铭文域名同样也是一个Ordinals NFT资产。

另外,在目前的比特币文本类域名中,域名无大小写之分,大小写在铭刻和识别时没有区别,也就是说有人铸造了SUSHI.btc,那么你也无需再铸造SUshi.BTC/sushi.btc等,因为这个域名已经被占用了,后面都是无效的。

尽管Ordinals支持铭刻任何后缀字符的域名铭文,但并不意味着任何后缀的域名字符就一定能成为域名,具有价值。如果它不具备域名的功能(如不能支持绑定比特币钱包地址),或者没有共识的话,它就只能是一个文本类铭文NFT而已。

也就是说.xxx这些类似域名的文本铭文如.btc、.sat、.sats、.stas、.ibx、.gm等能不能成为所谓的域名,要看大家对它有没有共识,以及有没有钱包或者相关服务商提供域名相关的功能服务,如支持地址解析,可用来接收资产或者登录去中心化应用等。只有支持域名的相关功能,那么这些类似域名的文本才可能有域名价值。

以上面的.btc、.sat、.stas、.sats、.ibx、.gm域名为例,目前unisat钱包支持解析.sats,那么用户就可使用.sats域名接收和发送比特币资产;还有去中心化社交应用Damus支持用户名设置为.sats,那么用户就可使用.sats作为其身份代表。这时.sats已经具备了域名的功能,而其它.xxx尾缀的纯文本类域名由于没有钱包应用支持地址解析或者其它域名功能,只是一个文本类NFT而已。

如何获得一个文本类域名?

如果域名已被注册,那么用户可在比特币NFT交易市场或者场外点对点购买,价格取决于卖家的挂单价;如果域名还未被注册,用户就可以在支持比特币铭刻铭文的平台或者使用代码直接铭刻即可,只需支付比特币链上Gas费(目前每笔交易约为3美元),后期无任何费用。

Unisat平台为例,想要铭刻一个新域名:

第一步:注册前需要先查重,确认域名是否已被注册。

使用平台的搜索功能(Search),输入想要的域名,看是否已经存在,如果已经存在,再注册的则无效。需要注意的是,在查重过程中还可能某些原因导致数据不是很准确,这时就需要用户在多个平台查重,交叉验证。

第二步:已确认域名还未被注册,这时通过平台的铭刻功能(Inscribe)来注册铭文。由于Unisat支持.sats和.unisat,这时用户只需点击相关域名后缀,输入想要注册的字符即可,可批量铸造多个域名。

如果Unisat上没有相关后缀域名,用户可通过Text(文本类)对话框,输入想要的字符后缀域名即可,可支持批量铸造不同后缀的域名。

知名文本类域名有哪些?

Bitcoin Name Service(.btc)—是由社区用户自发组织以.btc为后缀的域名,已铸造了satoshi.btc,将其捐赠给了比特币基金会。截至5月31日,根据Unisat检索,已注册的.btc域名有10万个。

sat.names(.sat)—sat是聪的缩略写形式,已注册域名的量为30.7万个。

sats.names(.sats)—sats是聪的简称,已注册数量为29.8万个。

.unisat——是由Unisat钱包推出的,拥有.unisat用户可以享有平台手续费折扣。

.ord—致敬BRC20的第一个代币为ORDI。

文本域名相关工具——

查重及铭刻新域名

iDclub——可用来域名查重,批量注册,会收取一定的手续费。

Unisat——支持域名查重、注册。5月31日,已上线.sats、.unisat域名交易市场,还可将其域名解析到比特币钱包地址上,用户使用.sats、.unisat域名就可接收比特币资产及铭文。

Best in Slot——聚合了Ordinals协议的各种资产,包括NFT、域名、铭文等,用户可用来查重及查看每个铭文的持有地址信息等。

域名二级交易市场

Ordinals Wallet——服务类似Unisat,集合了钱包及Ordinals资产交易等功能,5月30日宣布已上线支持.sats、.btc、.unisat、.xbt等域名,并支持域名解析到比特币钱包地址,即用户可把这些域名与Ordinals Wallet比特币地址绑定,用域名接收和转送资产。

Ordswap——也是一个集钱包及Ordinals资产交易功能于一身的平台,支持文本类域名上架交易。

Magic Eden——新增了比特币NFT市场,支持.btc等域名交易。

2.BTC.US:基于Stacks网络发行的.btc域名

BTC.US是基于Stacks上的智能合约构建的、以“.btc”为后缀的域名服务系统。而Stacks是比特币智能合约链,可为比特币提供智能合约功能支持,帮助实现部署DeFi、NFT和各种去中心化应用程序。

目前,用户想要在BTC.US上获得一个域名,需要在其官网连接Hiro或Xverse等钱包申请注册,使用Stacks平台原生代币STX付费。每次注册需要一次性支付5年年费2 STX代币(大约1.3美元),到期会自动扣费。

BTC.US提供的域名

BTC.US提供的.btc域名支持用户绑定Stacks链上地址和闪电网络地址,即用户可过其.btc接收和发送Stacks生态资产及闪电网络资产。

由此来看,BTC.US的.btc域名是基于Stacks链产生的,数据存储在Stacks中,更多作用是作为在Stacks网络及其生态的身份通行凭证。

3.BTCDomain:基于Ordinals提供付费.btc域名

BTC Domain提供基于比特币Ordinals协议发行.btc域名服务。它更像是一个域名综合服务平台,不仅仅提供域名注册,还提供域名解析及其它相关服务。致力于为比特币社区提供对用户友好的域名服务平台,产品运作方式类似于以太坊上的ENS。

如果用户想要在BTC Domain获得一个域名,首先需要拥有Ordinals类型钱包地址,在注册过程中除支付比特币链上Gas费之外,还需额外支付年服务费,最多可选择支付5年。

在BTC Domain平台注册域名时,会因域名的长短不同费用不同,4字符的每年服务费为0.01BTC(约280美元);5字符的为0.004BTC(约112美元);6个字符及以上的年服务费为0.001(约28美元)。目前,注册年服务费有50% 折扣。

BTC Domain收费情况

BTC Domain提供的.btc和文本类域名.btc同样是基于Ordinals的域名,但两个运作体系完全不同。根据官方表示,BTC Domain提供的.btc是Json格式在初始设计的时候就做到了去重和防伪签名的设计,因此通过BTC Domain注册.btc域名已去重确保了唯一性。

相较于BTC.US的.btc,BTC Domain提供的.btc域名数据完全存储比特币链上,是比特币原生的域名,可与比特币钱包地址绑定,用户通过其.btc域名可完成比特币及铭文资产接收和发送。

此外,BTC Domain提供的.btc域名解析到的不止是比特币钱包地址,还可以解析网页内容。这对于希望为其比特币交易创建可识别身份的企业、慈善机构和个人而言,是一个便捷的解决方案。目前,BTC Domain提供的.btc已支持解析Tokenview、TP钱包、Foxwallet钱包等。

不过,也有用户表示,由于BTCDomain官方存在,不如文本类域名去中心化,另外,使用租赁模式用户支付的费用过高。对此,官方表示,正因为有BTCDomain团队存在,才会有更多的资源投入到.btc发展中,支持域名开发和管理,才会使其.btc域名有更多的应用场景。

比特币域名市场野蛮增长难统一

比特币域名虽为用户管理链上地址带来了方便,但目前由于还处于早期发展阶段,域名服务系统还未健全。由于文本类域名任何人都可以铭刻.xxx后缀,现今比特币域名市场中仅文本类域名就有多种后缀字符,(.btc、.sat、.sats、.ord、.xbt等),后期或许还会出现.uniswap、.xen等等。在短时间内,域名后缀字符、域名解析方式、注册格式要求等在比特币生态内在短时间内很难做到统一。

以.btc域名为例,虽然后缀的btc字符易于被用户识别和传播,但这背后却是三个不同的服务商及运营体系。BTC.US的.btc虽使用了btc后缀,但功能和使用场景更偏向于Stacks生态内的域名;BTC Domain的.btc虽是比特币的原生域名支持多个钱包解析,但是由于收费、域名注册限制及中心化问题等被用户诟病不够纯粹;而文本类型的.btc虽因无后续费用、发行方式相对公平等被用户追捧,但由于需要社区自发组织运营,后期文本类域名的应用场景及解析仍是问题,目前仅有Ordinals Wallet地址支持.btc文本类域名解析。尽管这3个.btc在产品设计及运作模式有所区别,但对于大部分用户来说,很容易混淆。

而且,即使都属于文本类域名(如.sats、.ord、.unisat等),但注册规则也是不统一的,比如有些域名是支持空格或特殊字符、表情的,而有些域名则不支持。

文本类域名格式差异,图片来源于.btcdao

在域名使用场景方面,尤其是地址解析方面,也分为各个流派,例如一些钱包仅支持部分文本域名解析,此外,钱包与钱包之间的域名解析规则及域名种类都未统一。

如Ordinal Wallet支持.sats、.btc、.unisat、.xbt等域名解析服务;Unisat则支持.sats、.unisat域名解析,其上线的域名市场目前也支持交易.sats、.unisat等后缀域名;TP钱包等支持解析BTC Domain的.btc。这意味着用户只能使用相同的钱包才能使用域名进行转账和收发资产,例如小明在Ordinal Wallet的.btc域名不支持TP钱包的.btc域名地址进行btc转账等。

此外,文本类域名炒作成分大于真实应用。尽管文本类域名一经注册终身有效、无额外费用,但目前应用场景单一,甚至大部分后缀字符没有钱包支持地址解析,并不具备域名的功能,这些域名字符的交易更多是在赌未来预期,一旦被钱包支持解析后则价格上涨。

另外,看似文本类域名铭刻时人人平等,但真实况并非如此,一些用户在推广某些后缀域名之前,已经批量铭刻了一些3D(3个字符)、4D(4个字符)的靓号域名,然后出来喊单以抬高域名价格,趁机出手获利而已。因此,用户在投资文本类域名时需要了解其风险。

除了比特币域名市场本身的混乱之外,去中心化域名生态的发展本身就饱受争议,有不少人质疑,域名在Web3世界究竟是不是一个好生意?以去中心化域名龙头ENS为例,根据Dune数据,5月份注册量仅有15702个,为去年6月份以来的最低水平,而在2022年9月高峰时期月注册数目高达40万个。自去年9月份开始,ENS月注册数量一直呈递减趋势。而币安链上的.bnb域名项目Space ID自空投热度过后,关注度大幅减少;Solana上的Bonfida(.sol)域名项目近7天的注册量仅有716个。

比特币域名是不是也会步其后尘,成为昙花一现的产物?虽然从目前的热度来看,还处于早期的野蛮增长阶段,其中.btc、.sats、.sat等社区组织都在自发积极开拓市场,吸引更多钱包支持域名解析以拓展更多应用场景,甚至未来可能会有专门的文本类域名解析服务诞生,至于哪个后缀字符最终会成为比特币生态域名中的王者,还需要时间和社区来共同选择。

什么是模块化账户抽象?

原文标题:WTF is Modular Account Abstraction原文作者:Konrad Kopp原文来源:Mirror编译:Lynn,MarsBit

在为以太坊增加智能合约钱包(智能账户)的原生支持的多个提案被拒绝或停滞后,ERC-4337 已被接受为(临时)标准,以实现账户抽象(AA)而无需对 EVM 进行协议级别的修改。在过去的几个月里,AA 的一个子集的活动激增,它围绕着这些智能账户的模块化,使它们对用户和开发者来说更容易扩展。这种一般的方法被称为模块化账户抽象,下面的文章旨在概述这一生态系统在过去 3 个月中的发展以及事情的走向。

生态系统的组成部分

下面的部分将概述和讨论模块化 AA 生态系统的不同组件。这些组件是账户、模块、注册表、UI 和开发者工具。这些组件可能不是使这个生态系统长期运作所需的唯一部分,但至少目前充分包含了各团队集中研究和开发努力的不同领域。

模块化账户

模块化账户是指用户可以轻松、安全地扩展的智能账户,而不是只能由开发人员修改并需要重新部署的“静态”账户。这使得用户可以在他们的智能账户中即时切换出、添加或删除功能。

实施方法

目前有两种不同的模块化智能账户的方法,一种是由安全(Safe)架构创建或启发的,另一种是由多面代理(又称钻石)标准(ERC-2535)启发的。这两种方法有不同的发展,可以沿着多个轴线进行对比。Safe 账户是从 Gnosis 建立的最初的 multisig 演变而来的,并且早于 ERC-4337. 该团队非常强调安全性和可扩展性,而 ERC-4337 的支持在目前只能通过一个模块来实现。然而,也有关于在未来的版本中实现本地支持的讨论。

另一种方法是受 ERC-2535 的启发,在过去的几个月里,不同的团队已经进行了广泛的讨论和追求。这个标准的目的是使智能合约具有可扩展性,通过标准化的方式来存储对模块(称为面)的引用,并使用 delegatecall 操作码来执行这些。虽然围绕这个机会的讨论已经持续了一段时间,但(据我们所知)第一个工作实现是由我们在 ETHDenver 建立的。从那时起,其他几个团队已经发布了不同阶段的实施方案,例如 ZeroDev Kernel,这是一个最小和可扩展的智能账户,从 ERC-2535 中获得了一些灵感。此外,Alchemy 团队已经写出了一个阶段性的 EIP 草案(ERC-6900),旨在从 ERC-2535 中获取灵感,实现模块化智能账户的标准化。Soul Wallet 过去也曾试验过 ERC-2535 账户,尽管他们后来搁置了这些尝试(我们无法链接到这些尝试的任何代码)。

如上所述,这两种不同的方法可以沿着不同的轴线进行对比。其中之一是使用 delegatecall 来执行模块,而不是使用外部调用。使用 delegatecall 允许从调用合约的上下文中执行外部代码,这就意味着外部代码可以修改调用合约的存储,并进行来自调用账户而不是模块的外部调用。这不允许关注点的分离,这意味着一个模块可以覆盖账户上的任何存储槽,这引起了一个主要的攻击媒介。虽然安全账户目前确实允许使用 delegatecall 来调用模块,但这在未来可能会改变,要么完全被删除,要么为模块创建不同的权限级别。使用 delegatecall 来执行模块的一个好处是,模块可以是单子,大大降低了添加模块的 gas 成本。

这些方法的另一个区别是模块的存储方式和交易的路由。ERC-2535 使用从函数选择器到模块地址的映射,这意味着没有两个活动模块可以共享相同的函数名称(选择器是名称和参数的散列)。使用这个路由器的事务流程是在这个映射中查找一个函数签名,然后用这个签名和参数用 delegatecall 调用相应的合同地址。另一方面,安全账户只存储对模块地址的引用,从而使多个模块使用同一个函数选择器成为可能。此外,交易流程可以由安全账户或模块触发,然后模块可以调用安全账户,从那里执行交易。

第三个主要区别是这些实现处理存储的方式。由于 ERC-2535 调用模块的方式,存储不能像在普通智能合约中那样处理。相反,开发人员通常选择使用结构化或“钻石”存储,将数据存储到存储槽,这些存储槽是唯一的、特定模块的标识符的哈希值。这意味着不同的模块不会覆盖对方的存储数据,并导致合同以意想不到的方式行事。虽然安全模块可以使用 delegatecall 来调用,但它们并不要求以这种方式来调用,因此可以处理自己的存储。这意味着存储不需要以上述方式进行结构化,而是可以以 Solidity 存储定位通常实现的常规(顺序)方式或其他任何想要的方式来处理存储。

这些是这些方法之间最大的一些差异,但关于不同方法的另一个评估,请看 Safe 团队写的这篇文章

模块

模块,有时称为插件或面,是旨在扩展智能账户功能的智能合约。例如,一个模块可能允许所有者使用不同的签名方案来控制他们的钱包,或者在每次代币被转移到另一个账户时触发某个动作。与到目前为止存在的、上面已经讨论过的模块化账户的不同实现方式有关,有不同的构建和执行模块的方式。因此,今天存在的模块要么是为安全架构建立的,如这些这些,要么是为钻石启发的架构建立的,如 ZeroDev 的内核或我们在 ETHDenver 建立的一些演示模块

正如上文详细解释的那样,一个模块的结构取决于它所要使用的账户实现。一个主要的区别是,为安全基础设施构建的模块需要(除非通过委托调用)回调到安全账户,以便从账户的上下文中初始化一个函数调用。相比之下,为钻石启发账户建立的模块不需要这样做,因为它的代码是从智能账户本身中执行的。在此基础上,还存在一个标准,建立在安全架构之上的模块可以使用,称为 Zodiac 标准。该标准旨在将模块化账户的不同组成部分分开,称为头像、护卫和模块,因此旨在为构建智能账户模块创建一个通用框架。一些使用该标准的模块的例子可以在这里找到。

Permissive 是一个正在为智能账户构建公共模块的团队的一个例子。到目前为止,他们的重点是为智能账户建立一个授权框架,主要集中在允许更细化的访问控制,即用户可以给不同的实体以具体的权限来执行账户的特定动作。他们已经发布了一个 Safe 账户的模块,并正在努力将其移植到不同的模块实现上。

注册表

到目前为止,许多智能合约和智能账户的模块实现都是在用户和模块开发者之间建立了强大的信任假设。这就是 ERC-2535 今天几乎完全被使用的方式,允许开发者团队管理大型和复杂的代码库。然而,智能账户生态系统的更大愿景是消除这种信任假设,允许第三方开发者建立非技术用户可以安全地添加到他们的钱包的模块。虽然信任假设不能完全取消(毕竟有人需要证明一个模块的安全性),但我们可以将单个用户和模块开发者之间的所有信任假设捆绑到一个单一的实体,即模块注册表。这意味着,用户现在只需要信任这个单一的实体,而不是需要信任他们想要使用的模块的每一个开发者。

虽然这种思路导致了中心化登记处的结论,但这远远不是我们所追求的愿景。相反,我们目前正在设计一个类似于超结构的注册中心的原型,这意味着它是开放的、不可阻挡的,而且最重要的是,没有许可。这意味着具有不同安全假设的各方可以坐在这个注册表之上,由用户来选择在什么情况下信任哪一方。目前,我们正在对不同的实现方式进行原型设计,并得到了不同团队的有益投入和合作,例如 Safe 和 EF 的 4337 团队成员。一旦我们有了关于不同实现方式和激励设计的更多具体细节,我们将开始更公开地分享这些细节,并开放基础代码。

用户接口

正如 Yoav 之前所指出的,模块化 AA 的一个较少被探索的方面是类似的模块化前端设计。这是必要的,因为 UI 组件需要通过了解函数选择器、参数编码和(潜在的)执行何种前端或后端逻辑来专门构建以触发某些链上功能。到目前为止,我们还不知道有哪个团队在这个问题上取得了重大进展,尽管我们正慢慢开始探索建立在上面讨论的注册表之上的参考实现。从我们的初步研究来看,一个允许外部模块开发者的模块化前端的安全设计是不难的。

开发者工具

虽然存在开发者工具,供 dapp 或钱包开发者将模块化的 AA 集成到他们的应用程序中,但很少有指南或工具来帮助开发者构建模块。Safe 有一个指南在这里,ZeroDev 有一个在这里,但除了这些,我们不知道有什么更实质性的东西可以让开发者轻松了解如何建立一个模块。随着这个领域的成熟,我们相信会有更多的指南和实际的工具出现,大大降低模块开发者的门槛。

结论

模块化 AA 是更广泛的 AA 运动的一个子集,其目的是将智能账户模块化,以使其可以为用户定制,并允许开发人员轻松建立独立的智能账户功能,而不是需要建立一个完整的账户。上述文章的目的是对这一领域的现状做一个广泛的概述,以及强调正在取得进展的地方。我们还试图包括我们所知道的尽可能多的相关进展链接,但如果我们遗漏了什么,请与我们联系,以便我们能够包括它们。最后,有一个 Telegram 小组,这个空间的许多正在进行的讨论都发生在其中。如果你有兴趣了解最新情况和/或作出贡献,请随时加入。如果你有任何问题,请随时联系或上面提到的任何团队。

鸣谢感谢 Kurt、ZeroKnots、Lukas 和 Derek 帮助我,提供的宝贵反馈。

新政启动:解读香港加密货币平台的“过渡期安排”

作者 | 吴文谦律师(Gilbert Ng)及 李书沸 (Chris Lee)

吴说区块链授权发布

吴文谦,现为咨询机构 Mura 始创人,香港特别行政区高等法院执业律师。曾领导火币集团,新火科技和 OKX 的法律和合规职能

Chris 李书沸,TKX 资本始创人兼合伙人,前火币和 OKX CFO

背景

香港证监会于 2023 年 5 月 31 日晚上发报了最新 VATP 牌照手册及发牌制度的过渡安排的通函, 为 6 月 1 号的 VATP 虚拟资产交易平台牌照申请做最后的公告。

阅读原文:

https://sc.sfc.hk/TuniS/apps.sfc.hk/edistributionWeb/gateway/TC/circular/intermediaries/licensing/doc?refNo=23EC27

交易平台过渡安排

1. 在 6 月 1 日前在香港有 “经营真正的业务并设有真正的业务据点” 的非证券型代币交易平台可以在 6 月 1 日起计 12 个月内继续经营。在 6 月 1 日号后才开始在香港运营的交易所就需要拿到证监会牌照后才可以运营,没有过渡期。“真正业务” 及 “真正业务据点”的考虑因素包括:

a. 交易平台是否香港公司;

b. 是否有香港办公室;

c. 交易平台是否由香港员工管理及控制;

d. 关键人员是否长驻香港;

e. 是否已经有香港的独立客户及真正的成交量;

f. 其他证明平台是在香港运营的。

注意,单纯有香港公司注册, 但是员工不在香港驻是不足够的。而且员工需要在 6 月 1 日前已经驻于香港。过渡安排只适用于提供非证券型代币交易平台,而证券币交易平台并无任何过渡安排。即是所有证券币交易平台 6 月 1 日后都需要拿到证监会牌照才可以运营。

2. 有过渡期的交易所如果符合以下的条件,就可以由 2024 年 6 月 1 日开始被当作为获发牌照:

a. 在 2024 年 2 月 29 日前向证监会提交完整的牌照申请;

b. 可以提供证明交易所已经遵守所有牌照法规规定,并被证监会信纳。

3. 另外,这个过度安排还包括 “受规管职能的个人” , 即是持牌代表 (RO)及/或负责人员 (LR)的职能。 如果在 6 月 1 日前已经在交易平台执行相关职能的个人, 也可以有个人的过度期安排, 并在 2023 年 6 月 1 日起计 12 个月内 (在 RO 及 LR 没有持牌情况下)继续执行相关职能的工作,意思是可以作为 RO 或 LR 的职能继续工作。这些 RO 及 LR 如果符合以下的条件,可以由 2024 年 6 月 1 日开始被当作持牌的 RO 及 LR:

a. 这些 RO 及 LR 必须在 2024 年 2 月 29 日前向证监会提交完整的 (个人)牌照申请。

b. 这些 RO 及 LR 必须在 2023 年 6 月 1 日前在交易所已经执行 RO 及 LR 的相关职能。

c. 可以提供证明并被证监会信纳这些 RO 及 LR 有能力遵守持牌交易所的法规规定。

4. 值得注意的是,在牌照申请程序中,如果证监会发现申请不完整或有任何申请问题是可以解决的,证监会会退回申请,让申请人解决问题,而不是直接拒绝申请。所以有过渡期资格的申请人应该尽早提交申请,而不是临近 2024 年 2 月 29 日才提交申请,才可以有充足时间解决证监会问题。

5. 对于负责人员方面,因为证监会认为交易所不会是一个小规模的营运, 建议负责人员的数目可能需要多于基本规定。

6. 另外,证监会建议 VATP 跟 1,7 号牌一起申请,原因是证券币跟功能币的性质随时改变,同时申请可以确保交易所运营顺畅。两个牌照是同是提交一份综合申请表格的。

VATP 牌照手册总结

7. 证监会对于在香港运营的定义是看交易所是否 “actively marketing to the Hong Kong public” 。即是如果一个交易所,不论注册地是否在香港,在香港的公众为目标宣传,那么交易所就必须拿牌照。这可以包括多种情况,例如:指经常联络香港投资者或公众并向香港公众推广服务、进行以香港公众投资者为对象的大众传媒计划,及进行以香港投资者为对象的互联网活动等。在决定交易所是否向公众“积极推广”其服务时,证监会将考虑到有关业务活动的整体性质,考虑因素包括:

a. 服务是否订有详细的推广计划;

b. 服务是否透过直接推广途径,例如在香港媒体刊登广告、广播或其他网上“推销”科技,以进行广泛的宣传 (相反以被动方式,例如以“自行选择”的形式取得服务,则可能不是属于积极推广)

c. 推广是否以有计划的方式推行,以及是否根据计划或程序进行,从而显示出该项为持续服务而非单一推广行动;

d. 服务是否以香港公众为对象,例如以中文书写及以港元计值;

e. 服务是否顾客主动寻求的。

8. 另外,任何持牌交易所在香港以外的地方开展业务,都需要确保充分遵守所有当地的法律和监管要求。

9. 持牌交易所将需要向证监会提供关于业务活动的月度报告,格式是由证监会指定的, 并提供证监会要求的所有信息。证监会亦有权力询问交易所任何关于交易所的事情,交易所必须如实回复。

10. 持牌交易所需要每年聘请独立的专业公司对其业务进行年度审计,包括合规流程,系统,安全等。第一次审計报告应在牌照批准之日起的 18 个月内提交。

11. 除交易所外的所有其他服务或业务都需要得到证监会的批准,持牌交易所只能经营1家中心化交易所。

牌照的基本要求

12. 牌照的基本要求在之前很多不同文章都有梳理,这里不重复了,只提醒比较特别或重要的事项。所有的董事,持牌代表(RO),负责人员(LR),负责经理 (MIC)和最终受益人(UBO)都必须通过 SFC 的"适当人选"测试。RO, LR,及 MIC 的相关的行业经验应是在香港或其他国家的受监管活动的经验。不合规环境的工作经验,如果是因为免除(牌照的要求,也可以被接受。如果是金融科技技术与交易所平台的技术有关,也可以被考虑接受。值得注意的是,至少有一名持牌代表应在香港居住。

13. 财务要求是 500 万港元的实收股本,300 万港元的流动资产,另外加上 12 个月的运营费用。所以交易所需要向证监会提交一个运营费用收益的估算。

14. 用于保管客户资产的信托公司不得从事任何其他业务,只可以单一的为客户保管资产。

15. 没有硬性规定数据中心和存储中心必须要设在香港,但所有使用的数据中心和存储中心都必须得到证监会的批准。

吴说:独立可信的报道者 欢迎在这里关注我们

中文推特 https://twitter.com/wublockchain12

电报Telegram中文频道 https://t.me/wublock

官方网站 https://www.wu-talk.com/

根据央行等部门发布“关于进一步防范和处置虚拟货币交易炒作风险的通知”,本文内容仅用于信息分享,不对任何经营与投资行为进行推广与背书,请读者严格遵守所在地区法律法规,不参与任何非法金融行为。不为任何虚拟货币、数字藏品相关的发行、交易与融资等提供交易入口、指引、发行渠道引导等。吴说内容未经许可,禁止进行转载、复制等,违者将追究法律责任。

012023-06

LSDFi Summer 来袭,快速读懂 6 个值得关注的 LSDFi 项目

作者 | 黑米,白泽研究院

LSDFi 总锁仓价值(TVL)突破 3.8 亿美元,Pendle、Lybra 等项目的代币大幅上涨,LSD 和 LSDFi 的叙事再度走热。

在以太坊 Shapella 升级之后,LSD(流动性质押衍生品)协议和 LST(流动性质押代币)概念席卷了 DeFi 世界,不仅可以作为 ETH 质押者随时退出质押状态的渠道,也可以为持有者提供了除了交易以外赚取收益、提高资金利用率的新方法,许多老新 DeFi 都在开始朝着 LSD 来发展相关业务。

对于质押量和流动性的“内卷”激发了更多创新策略的出现,不同的项目现在正在竞相为其 LSD 创建更广泛、可用性更强的功能,不仅包括 DEX 这类的 DeFi 传统组件,也有利用 LSD 独特属性的收益策略、稳定币、收益率投机。

这些构建在 LSD 协议上的新 DeFi 就是 LSDFi。

本文将梳理值得关注的 6 个 LSDFi 项目。

1. Lybra Finance:由 LSD 支持的稳定币

Lybra Finance 的卖点在于可以让持有者实时获得 7.2% APY 的自动生息稳定币 $eUSD。

“给你一个稳定币,只要坚持持有,它就会在你的钱包中成倍增加。”

想要铸造 $eUSD,你需要存入 ETH 或 stETH,该协议会将 stETH 产生的收益分配给 $eUSD 的持有者。换句话说,通过将 ETH 或 stETH 存入协议并铸造 $eUSD,你可以获得约 8.3% 的 APY。

由于 Lybra Finance 最近在 Twitter 上热度很高,使得 $LBR 的价格疯狂上涨,也吸引了越来越多的人通过铸造 $eUSD 获得奖励。

2. Pendle:利率互换市场

最近,Pendle 的 TVL 达到了历史新高,即将达到 1 亿美元。

Pendle 的理念是让用户有机会分别使用资产及其收益。

在 Pendle 中,收益资产分为两部分:Principal Tokens ( PT ) 和 Yield Tokens ( YT )。PT 代表收益资产的本金,YT 代表收益资产的收益部分。YT 和 PT 可以在 Pendle AMM 上交易。

例如,存入 1 stETH,将铸造 1 PT-stETH 和 1 YT-stETH,其中,1 PT-stETH 可以赎回 1 个 stETH,而 1 YT-stETH 可以让你获得存入 Lido 的 1 ETH(stETH)的所有收益。

如果你是追求稳定的低风险投资者,可以购买去掉了收益的 PT,赚取固定收益;如果你是利率交易者,并且认为某个资产可能会上涨,则可以购买 YT。

在上个月的 meme 季中,大量以太坊交易使得验证者的奖励更高,即更高的质押收益。如果你提前购买 YT,可以带来巨大收益。

3. Asymetrix:LSD 收益彩票

Asymetrix 是一种去中心化的非托管协议,专为质押产生的非对称收益分配而设计,旨在使以太坊质押对于小型参与者来说更加令人兴奋和更具吸引力。(由于收益率较低,传统的 ETH 质押对于那些持有少量 ETH 的小型参与者来说没有那么大的回报)

假设 100 个用户每人存入 1 stETH,那么总共有 100 stETH。这些 stETH 在 24 小时产出 5 stETH 的质押奖励,那么这 5 stETH 将会被随机分配给一名参与者。

就像彩票一样,即使你只存入了很少的 stETH,也有机会获得高额奖励,或者没有奖励。

但无论结果如何,存款用户都可以获得相应的治理代币 ASX 作为奖励。

4. Index Coop:LSD 指数

Index Coop 是一个由 DAO 管理的协议,主要为用户提供结构化 DeFi 产品和策略代币。

在 LSD 协议和 LST 当前发展火热的情况下,Index Coop 为 ETH 持有者提供了两种指数代币以简化赚取收益的过程:多元化 ETH 质押指数 ($dsETH) 和复利 ETH 指数 ($icETH)。

dsETH:

随着越来越多的 LSD 协议出现,一些质押者很难就收益率进行选择。

由于这些 LSD 协议和 LST 基于以太坊主网,将 ETH 存入多个 LSD 协议或从二级市场购买多个 LST 以多元化投资,可能成本高昂。

Index Coop 将流行的 LST 捆绑成单个 ERC20 代币 dsETH 来解决这个痛点。

icETH:

一些 ETH 质押者热衷于复利增持 ETH。

icETH 使用基于 Set Protocol 的杠杆流动性质押策略为用户提供更高的 ETH 收益。用户存入 stETH,可以收到相同数量的 icETH。icETH 将 stETH 作为抵押品存入 Aave v2,并借出 ETH 以获取更多 stETH。

因此,与简单持有 stETH 相比,icETH 持有者不仅拥有 stETH 现货,收益率也是其两倍(可变,因为受抵押率和借贷成本的影响)。

5. 0xAcid:ETH 长期持有者的收益管理协议

0xAcid 是一个比较另类的收益管理协议,其目标是通过提供远高于普通 LST(4-5%)的收益率,优化 stETH、rETH、frxETH 等 LST 的回报,比较适合对 ETH 长期看涨的用户参与。

0xAcid 的原生代币为 ACID,供应量无上限,通过代币销售初始供应为 7370。

除了在 Paraswap 上直接购买以外,用户还可以通过购买“债券”,将 stETH、rETH、ankrETH 存入国库,获得 ACID。用户持有 ACID 等于间接持有国库中 LST 和多元收益,因为每当 ETH 价格达到 1 万美元时,协议都会将国库中的所有 LST 分配给 ACID 持有者。

如果用户质押 ACID ,则会 1:1 获得 sACID,这是质押凭证(未锁定),可随时换回 ACID。作为质押奖励,质押者不仅可以获得治理代币 esACID,还会获得债券销售的 5% 到 10% 销售额。

6. Gravita Finance:LSD 免息借贷

Gravita Finance 是一个以 LST 为抵押品的免息借贷协议,就像是 LSDFi 版本的 Liquity Protocol。

在 LSD 协议中质押 ETH 获得 rETH、wstETH 等 LST 后,存入 Gravita 中,可以获得稳定币 GRAI 作为回报。还可以再通过 Graivta 借出稳定币 GRAI,用于消费,或存入稳定池中以折扣价购买被清算的 LST 抵押品。

亮点:

a. 如果用户在六个月(约 182 天)内偿还贷款,利息将按比例退还,最低利息仅相当于一周的利息。

b. 为了降低 GRAI 的波动性,开发了类似于 Liquity 的赎回机制,允许 GRAI 持有人用价值 0.97 美元的抵押品赎回 1 个 GRAI,实际上产生了 3% 的赎回费用。

风险提示:

根据央行等部门发布的《关于进一步防范和处置虚拟货币交易炒作风险的通知》,本文内容仅用于信息分享,不对任何经营与投资行为进行推广与背书,请读者严格遵守所在地区法律法规,不参与任何非法金融行为

Foresight Ventures: 理性看待去中心化算力网络

作者: Ian Xu@Foresight Ventures

TL;DR

目前AI + Crypto结合的点主要有2个比较大的方向:分布式算力和ZKML;关于ZKML可以参考我之前的一篇文章。本文将围绕去中心化的分布式算力网络做出分析和反思。在AI大模型的发展趋势下,算力资源会是下一个十年的大战场,也是未来人类社会最重要的东西,并且不只是停留在商业竞争,也会成为大国博弈的战略资源。未来对于高性能计算基础设施、算力储备的投资将会指数级上升。去中心化的分布式算力网络在AI大模型训练上的需求是最大的,但是也面临最大的挑战和技术瓶颈。包括需要复杂的数据同步和网络优化问题等。此外,数据隐私和安全也是重要的制约因素。虽然有一些现有的技术能提供初步解决方案,但在大规模分布式训练任务中,由于计算和通信开销巨大,这些技术仍无法应用。去中心化的分布式算力网络在模型推理上更有机会落地,可以预测未来的增量空间也足够大。但也面临通信延迟、数据隐私、模型安全等挑战。和模型训练相比,推理时的计算复杂度和数据交互性较低,更适合在分布式环境中进行。通过Together和Gensyn.ai两个初创公司的案例,分别从技术优化和激励层设计的角度说明了去中心化的分布式算力网络整体的研究方向和具体思路。

一、分布式算力—大模型训练

我们在讨论分布式算力在训练时的应用,一般聚焦在大语言模型的训练,主要原因是小模型的训练对算力的需求并不大,为了做分布式去搞数据隐私和一堆工程问题不划算,不如直接中心化解决。而大语言模型对算力的需求巨大,并且现在在爆发的最初阶段,2012-2018,AI的计算需求大约每4个月就翻一倍,现在更是对算力需求的集中点,可以预判未来5-8年仍然会是巨大的增量需求。

在巨大机遇的同时,也需要清晰的看到问题。大家都知道场景很大,但是具体的挑战在哪里?谁能target这些问题而不是盲目入局,才是判断这个赛道优秀项目的核心。

(NVIDIA NeMo Megatron Framework)

1.整体训练流程

以训练一个具有1750亿参数的大模型为例。由于模型规模巨大,需要在很多个GPU设备上进行并行训练。假设有一个中心化的机房,有100个GPU,每个设备具有32GB的内存。

数据准备:首先需要一个巨大的数据集,这个数据集包含例如互联网信息、新闻、书籍等各种数据。在训练前需要对这些数据进行预处理,包括文本清洗、标记化(tokenization)、词表构建等。数据分割:处理完的数据会被分割成多个batch,以在多个GPU上并行处理。假设选择的batch大小是512,也就是每个批次包含512个文本序列。然后,我们将整个数据集分割成多个批次,形成一个批次队列。设备间数据传输:在每个训练步骤开始时,CPU从批次队列中取出一个批次,然后将这个批次的数据通过PCIe总线发送到GPU。假设每个文本序列的平均长度是1024个标记,那么每个批次的数据大小约为512 * 1024 * 4B = 2MB(假设每个标记使用4字节的单精度浮点数表示)。这个数据传输过程通常只需要几毫秒。并行训练:每个GPU设备接收到数据后,开始进行前向传播(forward pass)和反向传播(backward pass)计算,计算每个参数的梯度。由于模型的规模非常大,单个GPU的内存无法存放所有的参数,因此我们使用模型并行技术,将模型参数分布在多个GPU上。梯度聚合和参数更新:在反向传播计算完成后,每个GPU都得到了一部分参数的梯度。然后,这些梯度需要在所有的GPU设备之间进行聚合,以便计算全局梯度。这需要通过网络进行数据传输,假设用的是25Gbps的网络,那么传输700GB的数据(假设每个参数使用单精度浮点数,那么1750亿参数约为700GB)需要约224秒。然后,每个GPU根据全局梯度更新其存储的参数。同步:在参数更新后,所有的GPU设备需要进行同步,以确保它们都使用一致的模型参数进行下一步的训练。这也需要通过网络进行数据传输。重复训练步骤:重复上述步骤,直到完成所有批次的训练,或者达到预定的训练轮数(epoch)。

这个过程涉及到大量的数据传输和同步,这可能会成为训练效率的瓶颈。因此,优化网络带宽和延迟,以及使用高效的并行和同步策略,对于大规模模型训练非常重要。

2.通信开销的瓶颈:

需要注意的是,通信的瓶颈也是导致现在分布式算力网络做不了大语言模型训练的原因。

各个节点需要频繁地交换信息以协同工作,这就产生了通信开销。对于大语言模型,由于模型的参数数量巨大这个问题尤为严重。通信开销分这几个方面:

数据传输:训练时节点需要频繁地交换模型参数和梯度信息。这需要将大量的数据在网络中传输,消耗大量的网络带宽。如果网络条件差或者计算节点之间的距离较大,数据传输的延迟就会很高,进一步加大了通信开销。同步问题:训练时节点需要协同工作以保证训练的正确进行。这需要在各节点之间进行频繁的同步操作,例如更新模型参数、计算全局梯度等。这些同步操作需要在网络中传输大量的数据,并且需要等待所有节点完成操作,这会导致大量的通信开销和等待时间。梯度累积和更新:训练过程中各节点需要计算自己的梯度,并将其发送到其他节点进行累积和更新。这需要在网络中传输大量的梯度数据,并且需要等待所有节点完成梯度的计算和传输,这也是导致大量通信开销的原因。数据一致性:需要保证各节点的模型参数保持一致。这需要在各节点之间进行频繁的数据校验和同步操作,这会导致大量的通信开销。

虽然有一些方法可以减少通信开销,比如参数和梯度的压缩、高效并行策略等,但是这些方法可能会引入额外的计算负担,或者对模型的训练效果产生负面影响。并且,这些方法也不能完全解决通信开销问题,特别是在网络条件差或计算节点之间的距离较大的情况下。

举一个例子:

去中心化分布式算力网络

GPT-3模型有1750亿个参数,如果我们使用单精度浮点数(每个参数4字节)来表示这些参数,那存储这些参数就需要~700GB的内存。而在分布式训练中,这些参数需要在各个计算节点之间频繁地传输和更新。

假设有100个计算节点,每个节点每个步骤都需要更新所有的参数,那么每个步骤都需要传输约70TB(700GB*100)的数据。如果我们假设一个步骤需要1s(非常乐观的假设),那么每秒钟就需要传输70TB的数据。这种对带宽的需求已经远超过了大多数网络,也是一个可行性的问题。

实际情况下,由于通信延迟和网络拥堵,数据传输的时间可能会远超1s。这意味着计算节点可能需要花费大量的时间等待数据的传输,而不是进行实际的计算。这会大大降低训练的效率,而这种效率上的降低不是等一等就能解决的,而是可行和不可行的差别,会让整个训练过程不可行。

中心化机房

就算是在中心化的机房环境下,大模型的训练仍然需要很重的通信优化。

在中心化的机房环境中,高性能计算设备作为集群,通过高速网络进行连接来共享计算任务。然而,即使在这种高速网络环境中训练参数数量极大的模型,通信开销仍然是一个瓶颈,因为模型的参数和梯度需要在各计算设备之间进行频繁的传输和更新。

就像开始提到的,假设有100个计算节点,每个服务器具有25Gbps的网络带宽。如果每个服务器每个训练步骤都需要更新所有的参数,那每个训练步骤需要传输约700GB的数据需要~224秒。通过中心化机房的优势,开发者可以在数据中心内部优化网络拓扑,并使用模型并行等技术,显著地减少这个时间。

相比之下,如果在一个分布式环境中进行相同的训练,假设还是100个计算节点,分布在全球各地,每个节点的网络带宽平均只有1Gbps。在这种情况下,传输同样的700GB数据需要~5600秒,比在中心化机房需要的时间长得多。并且,由于网络延迟和拥塞,实际所需的时间可能会更长。

不过相比于在分布式算力网络中的情况,优化中心化机房环境下的通信开销相对容易。因为在中心化的机房环境中,计算设备通常会连接到同一个高速网络,网络的带宽和延迟都相对较好。而在分布式算力网络中,计算节点可能分布在全球各地,网络条件可能会相对较差,这使得通信开销问题更为严重。

OpenAI 训练 GPT-3 的过程中采用了一种叫Megatron的模型并行框架来解决通信开销的问题。Megatron 通过将模型的参数分割并在多个 GPU 之间并行处理,每个设备只负责存储和更新一部分参数,从而减少每个设备需要处理的参数量,降低通信开销。同时,训练时也采用了高速的互连网络,并通过优化网络拓扑结构来减少通信路径长度。

(Data used to train LLM models)

3.为什么分布式算力网络不能做这些优化

要做也是能做的,但相比中心化的机房,这些优化的效果很受限。

网络拓扑优化:在中心化的机房可以直接控制网络硬件和布局,因此可以根据需要设计和优化网络拓扑。然而在分布式环境中,计算节点分布在不同的地理位置,甚至一个在中国,一个在美国,没办法直接控制它们之间的网络连接。尽管可以通过软件来优化数据传输路径,但不如直接优化硬件网络有效。同时,由于地理位置的差异,网络延迟和带宽也有很大的变化,从而进一步限制网络拓扑优化的效果。模型并行:模型并行是一种将模型的参数分割到多个计算节点上的技术,通过并行处理来提高训练速度。然而这种方法通常需要频繁地在节点之间传输数据,因此对网络带宽和延迟有很高的要求。在中心化的机房由于网络带宽高、延迟低,模型并行可以非常有效。然而,在分布式环境中,由于网络条件差,模型并行会受到较大的限制。

4.数据安全和隐私的挑战

几乎所有涉及数据处理和传输的环节都可能影响到数据安全和隐私:

数据分配:训练数据需要被分配到各个参与计算的节点。这个环节数据可能会在分布式节点被恶意使用/泄漏。模型训练:在训练过程中,各个节点都会使用其分配到的数据进行计算,然后输出模型参数的更新或梯度。这个过程中,如果节点的计算过程被窃取或者结果被恶意解析,也可能泄露数据。参数和梯度聚合:各个节点的输出需要被聚合以更新全局模型,聚合过程中的通信也可能泄露关于训练数据的信息。

对于数据隐私问题有哪些解决方案?

安全多方计算:SMC在某些特定的、规模较小的计算任务中已经被成功应用。但在大规模的分布式训练任务中,由于其计算和通信开销较大,目前还没有广泛应用。差分隐私:应用在某些数据收集和分析任务中,如Chrome的用户统计等。但在大规模的深度学习任务中,DP会对模型的准确性产生影响。同时,设计适当的噪声生成和添加机制也是一个挑战。联邦学习:应用在一些边缘设备的模型训练任务中,比如Android键盘的词汇预测等。但在更大规模的分布式训练任务中,FL面临通信开销大、协调复杂等问题。同态加密:在一些计算复杂度较小的任务中已经被成功应用。但在大规模的分布式训练任务中,由于其计算开销较大,目前还没有广泛应用。

小结一下

以上每种方法都有其适应的场景和局限性,没有一种方法可以在分布式算力网络的大模型训练中完全解决数据隐私问题。

寄予厚望的ZK是否能解决大模型训练时的数据隐私问题?

理论上ZKP可以用于确保分布式计算中的数据隐私,让一个节点证明其已经按照规定进行了计算,但不需要透露实际的输入和输出数据。

但实际上将ZKP用于大规模分布式算力网络训练大模型的场景中面临以下瓶颈:

计算和通信开销up:构造和验证零知识证明需要大量的计算资源。此外,ZKP的通信开销也很大,因为需要传输证明本身。在大模型训练的情况下,这些开销可能会变得特别显著。例如,如果每个小批量的计算都需要生成一个证明,那么这会显著增加训练的总体时间和成本。ZK协议的复杂度:设计和实现一个适用于大模型训练的ZKP协议会非常复杂。这个协议需要能够处理大规模的数据和复杂的计算,并且需要能够处理可能出现的异常报错。硬件和软件的兼容性:使用ZKP需要特定的硬件和软件支持,这可能在所有的分布式计算设备上都不可用。

小结一下

要将ZKP用于大规模分布式算力网络训练大模型,还需要长达数年的研究和开发,同时也需要学术界有更多的精力和资源放在这个方向。

二、分布式算力—模型推理

分布式算力另外一个比较大的场景在模型推理上,按照我们对于大模型发展路径的判断,模型训练的需求会在经过一个高点后随着大模型的成熟而逐步放缓,但模型的推理需求会相应地随着大模型和AIGC的成熟而指数级上升。

推理任务相较于训练任务,通常计算复杂度较低,数据交互性较弱,更适合在分布式环境中进行。

(Power LLM inference with NVIDIA Triton)

1.挑战

通信延迟:

在分布式环境中,节点间的通信是必不可少的。在去中心化的分布式算力网络中,节点可能遍布全球,因此网络延迟会是一个问题,特别是对于需要实时响应的推理任务。

模型部署和更新:

模型需要部署到各个节点上。如果模型进行了更新,那么每个节点都需要更新其模型,需要消耗大量的网络带宽和时间。

数据隐私:

虽然推理任务通常只需要输入数据和模型,不需要回传大量的中间数据和参数,但是输入数据仍然可能包含敏感信息,如用户的个人信息。

模型安全:

在去中心化的网络中,模型需要部署到不受信任的节点上,会导致模型的泄漏导致模型产权和滥用问题。这也可能引发安全和隐私问题,如果一个模型被用于处理敏感数据,节点可以通过分析模型行为来推断出敏感信息。

质量控制:

去中心化的分布式算力网络中的每个节点可能具有不同的计算能力和资源,这可能导致推理任务的性能和质量难以保证。

2.可行性

计算复杂度:

在训练阶段,模型需要反复迭代,训练过程中需要对每一层计算前向传播和反向传播,包括激活函数的计算、损失函数的计算、梯度的计算和权重的更新。因此,模型训练的计算复杂度较高。

在推理阶段,只需要一次前向传播计算预测结果。例如,在GPT-3中,需要将输入的文本转化为向量,然后通过模型的各层(通常为Transformer层)进行前向传播,最后得到输出的概率分布,并根据这个分布生成下一个词。在GANs中,模型需要根据输入的噪声向量生成一张图片。这些操作只涉及模型的前向传播,不需要计算梯度或更新参数,计算复杂度较低。

数据交互性:

在推理阶段,模型通常处理的是单个输入,而不是训练时的大批量的数据。每次推理的结果也只依赖于当前的输入,而不依赖于其它的输入或输出,因此无需进行大量的数据交互,通信压力也就更小。

以生成式图片模型为例,假设我们使用GANs生成图片,我们只需要向模型输入一个噪声向量,然后模型会生成一张对应的图片。这个过程中,每个输入只会生成一个输出,输出之间没有依赖关系,因此无需进行数据交互。

以GPT-3为例,每次生成下一个词只需要当前的文本输入和模型的状态,不需要和其他输入或输出进行交互,因此数据交互性的要求也弱。

小结一下

不管是大语言模型还是生成式图片模型,推理任务的计算复杂度和数据交互性都相对较低,更适合在去中心化的分布式算力网络中进行,这也是现在我们看到大多数项目在发力的一个方向。

三、项目

去中心化的分布式算力网络的技术门槛和技术广度都非常高,并且也需要硬件资源的支撑,因此现在我们并没有看到太多尝试。以Together和Gensyn.ai举例:

1.Together

(RedPajama from Together)

Together是一家专注于大模型的开源,致力于去中心化的AI算力方案的公司,希望任何人在任何地方都能接触和使用AI。Together刚完成了Lux Capital领投的20m USD的种子轮融资。

Together由Chris、Percy、Ce联合创立,初衷是由于大模型训练需要大量高端的GPU集群和昂贵的支出,并且这些资源和模型训练的能力也集中在少数大公司。

从我的角度看,一个比较合理的分布式算力的创业规划是:

Step1. 开源模型

要在去中心化的分布式算力网络中实现模型推理,先决条件是节点必须能低成本地获取模型,也就是说使用去中心化算力网络的模型需要开源(如果模型需要在相应的许可下使用,就会增加实现的复杂性和成本)。比如chatgpt作为一个非开源的模型,就不适合在去中心化算力网络上执行。

因此,可以推测出一个提供去中心化算力网络的公司的隐形壁垒是需要具备强大的大模型开发和维护能力。自研并开源一个强大的base model能够一定程度上摆脱对第三方模型开源的依赖,解决去中心化算力网络最基本的问题。同时也更有利于证明算力网络能够有效地进行大模型的训练和推理。

而Together也是这么做的。最近发布的基于LLaMA的RedPajama是由Together, Ontocord.ai, ETH DS3Lab, Stanford CRFM和Hazy Research等团队联合启动的,目标是研发一系列完全开源的大语言模型。

Step2. 分布式算力在模型推理上落地

就像上面两节提到的,和模型训练相比,模型推理的计算复杂度和数据交互性较低,更适合在去中心化的分布式环境中进行。

在开源模型的基础上,Together的研发团队针对RedPajama-INCITE-3B模型现做了一系列更新,比如利用LoRA实现低成本的微调,使模型在CPU(特别是使用M2 Pro处理器的MacBook Pro)上运行模型更加丝滑。同时,尽管这个模型的规模较小,但它的能力却超过了相同规模的其他模型,并且在法律、社交等场景得到了实际应用。

Step3. 分布式算力在模型训练上落地

(Overcoming Communication Bottlenecks for Decentralized Training的算力网络示意图)

从中长期来看,虽然面临很大的挑战和技术瓶颈,承接AI大模型训练上的算力需求一定是最诱人的。Together在建立之初就开始布局如何克服去中心化训练中的通信瓶颈方面的工作。他们也在NeurIPS 2022上发布了相关的论文:Overcoming Communication Bottlenecks for Decentralized Training。我们可以主要归纳出以下方向:

调度优化

在去中心化环境中进行训练时,由于各节点之间的连接具有不同的延迟和带宽,因此,将需要重度通信的任务分配给拥有较快连接的设备是很重要的。Together通过建立模型来描述特定调度策略的成本,更好地优化调度策略,以最小化通信成本,最大化训练吞吐量。Together团队还发现,即使网络慢100倍,端到端的训练吞吐量也只慢了1.7至2.3倍。因此,通过调度优化来追赶分布式网络和中心化集群之间的差距很有戏。

通信压缩优化

Together提出了对于前向激活和反向梯度进行通信压缩,引入了AQ-SGD算法,该算法提供了对随机梯度下降收敛的严格保证。AQ-SGD能够在慢速网络(比如500 Mbps)上微调大型基础模型,与在中心化算力网络(比如10 Gbps)无压缩情况下的端到端训练性能相比,只慢了31%。此外,AQ-SGD还可以与最先进的梯度压缩技术(比如QuantizedAdam)结合使用,实现10%的端到端速度提升。

项目总结

Together团队配置非常全面,成员都有非常强的学术背景,从大模型开发、云计算到硬件优化都有行业专家支撑。并且Together在路径规划上确实展现出了一种长期有耐心的架势,从研发开源大模型到测试闲置算力(比如mac)在分布式算力网络用语模型推理,再到分布式算力在大模型训练上的布局。— 有那种厚积薄发的感觉了:)

但是目前并没有看到Together在激励层过多的研究成果,我认为这和技术研发具有相同的重要性,是确保去中心化算力网络发展的关键因素。

2.Gensyn.ai

(Gensyn.ai)

从Together的技术路径我们可以大致理解去中心化算力网络在模型训练和推理上的落地过程以及相应的研发重点。

另一个不能忽视的重点是算力网络激励层/共识算法的设计,比如一个优秀的网络需要具备:

确保收益足够有吸引力;确保每个矿工获得了应有的收益,包括防作弊和多劳多得;确保任务在不同节点直接合理调度和分配,不会有大量闲置节点或者部分节点过度拥挤;激励算法简洁高效,不会造成过多的系统负担和延迟;

……

看看Gensyn.ai是怎么做的:

成为节点

首先,算力网络中的solver通过bid的方式竞争处理user提交的任务的权利,并且根据任务的规模和被发现作弊的风险,solver需要抵押一定的金额。

验证

Solver在更新parameters的同时生成多个checkpoints(保证工作的透明性和可追溯性),并且会定期生成关于任务的密码学加密推理proofs(工作进度的证明);

Solver完成工作并产生了一部分计算结果时,协议会选择一个verifier,verifier也会质押一定金额(确保verifier诚实地执行验证),并且根据上述提供的proofs来决定需要验证哪一部分的计算结果。

如果solver和verifier出现分歧

通过基于Merkle tree的数据结构,定位到计算结果存在分歧的确切位置。整个验证的操作都会上链,作弊者会被扣除质押的金额。

项目总结

激励和验证算法的设计使得Gensyn.ai不需要在验证过程中去重放整个计算任务的所有结果,而只需要根据提供的证明对一部分结果进行复制和验证,这极大地提高了验证的效率。同时,节点只需要存储部分计算结果,这也降低了存储空间和计算资源的消耗。另外,潜在的作弊节点无法预测哪些部分会被选中进行验证,所以这也降低了作弊风险;

这种验证分歧并发现作弊者的方式也可以在不需要比较整个计算结果的情况下(从Merkle tree的根节点开始,逐步向下遍历),可以快速找到计算过程中出错的地方,这在处理大规模计算任务时非常有效。

总之Gensyn.ai的激励/验证层设计目标就是:简洁高效。但目前仅限于理论层面,具体实现可能还会面临以下挑战:

在经济模型上,如何设定合适的参数,使其既能有效地防止欺诈,又不会对参与者构成过高的门槛。在技术实现上,如何制定一种有效的周期性的加密推理证明,也是一个需要高级密码学知识的复杂问题。在任务分配上仅仅算力网络如何挑选和分配任务给不同的solver也需要合理的调度算法的支撑,仅仅按照bid机制来分配任务从效率和可行性上看显然是有待商榷的,比如算力强的节点可以处理更大规模的任务,但可能没有参与bid(这里就涉及到对节点availability的激励问题),算力低的节点可能出价最高但并不适合处理一些复杂的大规模计算任务。

四、对未来的一点思考

谁需要去中心化算力网络这个问题其实一直没有得到验证。闲置算力应用在对算力资源需求巨大的大模型训练上显然是最make sense,也是想象空间最大的。但事实上通信、隐私等瓶颈不得不让我们重新思考:

去中心化地训练大模型是不是真的能看到希望?

如果跳出这种大家共识的,“最合理的落地场景”,是不是把去中心化算力应用在小型AI模型的训练也是一个很大的场景。从技术角度看,目前的限制因素都由于模型的规模和架构得到了解决,同时,从市场上看,我们一直觉得大模型的训练从当下到未来都会是巨大的,但小型AI模型的市场就没有吸引力了吗?

我觉得未必。相比大模型小型AI模型更便于部署和管理,而且在处理速度和内存使用方面更有效率,在大量的应用场景中,用户或者公司并不需要大语言模型更通用的推理能力,而是只关注在一个非常细化的预测目标。因此,在大多数场景中,小型AI模型仍然是更可行的选择,不应该在fomo大模型的潮水中被过早地忽视。

Reference

https://www.together.xyz/blog/neurips-2022-overcoming-communication-bottlenecks-for-decentralized-training-12

https://www.together.xyz/blog/redpajama

https://docs.gensyn.ai/litepaper/

https://www.nvidia.com/en-in/deep-learning-ai/solutions/large-language-models/

https://indiaai.gov.in/article/training-data-used-to-train-llm-models