风险提示:理性看待区块链,提高风险意识!
BuidlerDAO x KNN3:大型语言模型使用经验
首页 > 业界 > 区块链 2023-05-05 08:47
摘要
大型语言模型是利用海量的文本数据进行训练海量的模型参数 。
币界网报道:

作者:@於方仁 @Caroline Sun

编排:@黑羽小斗

LLM

大型语言模型(LLM, Large Language Model)是利用海量的文本数据进行训练海量的模型参数。大语言模型的使用,大体可以分为两个方向:

A. 仅使用

B. 微调后使用

仅使用又称 Zero-shot,因为大语言模型具备大量通用的语料信息,量变可以产生质变。即使 Zero-shot 也许没得到用户想要的结果,但加上合适的 prompt 则可以进一步获取想要的知识。该基础目前被总结为 prompt learning。

大语言模型,比较流行的就是 BERT 和 GPT。从生态上讲 BERT 与 GPT 最大的区别就是前者模型开源,后者只开源了调用 API ,也就是目前的 ChatGPT。

两个模型均是由若干层的 Transformer 组成,参数数量等信息如下表所示。

目前生态上讲,BERT 多用于微调场景。因为微调必须在开源模型的基础上,GPT 仅开源到 GPT2 的系列。且相同模型参数量下 BERT 在特定场景的效果往往高于 GPT,微调需要调整全部的模型参数,所以从性价比而言,BERT 比 GPT 更适合微调。

而 GPT 目前拥有 ChatGPT 这种面向广大人民群众的应用,使用简单。API 的调用也尤其方便。所以若是仅使用 LLM,则 ChatGPT 显然更有优势。

ChatGPT Prompt

下图是 OpenAI 官方提出对于 ChatGPT 的 prompt 用法大类。

Figure 1. Prompt Categories by OpenAI 

每种类别有很多具体的范例。如下图所示:

Figure 2. Prompt Categories Examples by OpenAI

除此以外,我们在此提出一些略微高级的用法。

高级分类

这是一个意图识别的例子,本质上也是分类任务,我们指定了类别,让 ChatGPT 判断用户的意图在这

Figure 3. Prompt Examples

实体识别与关系抽取

利用 ChatGPT 做实体识别与关系抽取轻而易举,例如给定一篇文本后,这么像它提问。

Figure 4. Example Text Given to ChatGPT

这是部分结果截图:

Figure 5. Partial Output from given Text on ChatGPT

之后可以追问给他们的关系,例如:

Figure 6.Asking relationship on ChatGPT

这样,一个大型的知识图谱便可轻松建立。

分析任务

如下图所示,我对 ChatGPT 提出了分析我目前需求的问题。

Figure 7. Result for needs request on ChatGPT

甚至还能让它给定分数。

Figure 8. Scoring to evaluate the identified needs

除此以外还有数不胜数的方式,在此不一一列举。

组合Agent

另外,我们在使用 ChatGPT 的 API 时,可以将不同的 prompt 模板产生多次调用产生组合使用的效果。我愿称这种使用方式叫做,组合 Agent。例如 Figure 1 展示的是一个大概的思路。

Figure 9.  The Paradigm of the Combination Agent

具体说来,例如是一个辅助创作文章的产品。则可以这么设计,如 Figure 10 所示。

Figure 10. Agent combination for assisting in creation

假设用户输入一个请求,说“帮我写一篇伦敦游记”, 那么 Intent Recognition Agent 首先做一个意图识别,意图识别也就是利用 ChatGPT 做一次分类任务。假设识别出用户的意图是文章生成,则接着调用 Article Generate Agent。

另一方面,用户当前的输入与历史的输入可以组成一个上下文,输入给 Chat Context Analyze Agent。当前例子中,这个 agent 分析出的结果传入后面的 AI Reply Agent 和 Phase Control Agent的。

AI Reply Agent 就是用来生成 AI 回复用户的语句,假设我们的产品前端并不只有一个文章,另一个敌方还有一个框用来显示 AI 引导用户创作文章的语句,则这个 AI Reply Agent 就是用来干这个事情。将上下文的分析与文章一同提交给 ChatGPT,让其根据分析结果结合文章生成一个合适的回复。例如通过分析发现用户只是在通过聊天调整文章内容,而不知道 AI 还能控制文章的艺术意境,则可以回复用户你可以尝试着对我说“调整文章的艺术意境为非现实主义风格”。

Phase Control Agent 则是用来管理用户的阶段,对于 ChatGPT 而言也可以是一个分类任务,例如阶段分为[文章主旨,文章风格,文章模板,文章意境]等等。例如 AI 判断可以进行文章模板的制作了,前端可以产生几个模板选择的按钮。

使用不同的 Agent 来处理用户输入的不同任务,包括意图识别、Chat Context 分析、AI 回复生成和阶段控制,从而协同工作,为用户生成一篇伦敦游记的文章,提供不同方面的帮助和引导,例如调整文章的艺术意境、选择文章模板等。这样可以通过多个 Agent 的协作,使用户获得更加个性化和满意的文章生成体验。 

Prompt 微调

LLM 虽然很厉害,但离统治人类的 AI 还相差甚远。眼下有个最直观的痛点就是 LLM 的模型参数太多,基于 LLM 的模型微调变得成本巨大。例如 GPT-3 模型的参数量级达到了 175 Billion ,只有行业大头才有这种财力可以微调 LLM 模型,对于小而精的公司而言该怎么办呢。无需担心,算法科学家们为我们创新了一个叫做 prompt tuning 的概念。

Prompt tuning 简单理解就是针对prompt进行微调操作,区别于传统的 fine-tuning,优势在于更快捷, prompt tuning 仅需微调 prompt 相关的参数从而去逼近 fine-tuning 的效果。

Figure 11. Prompt learning

什么是 prompt 相关的参数,如图所示,prompt tuning 是将 prompt 从一些的自然语言文本设定成了由数字组成的序列向量。本身 AI 也会将文本从预训练模型中提取向量从而进行后续的计算,只是在模型迭代过程中,这些向量并不会跟着迭代,因为这些向量于文本绑定住了。但是后来发现这些向量即便跟着迭代也无妨,虽然对于人类而言这些向量迭代更新后在物理世界已经找不到对应的自然语言文本可以表述出意思。但对于 AI 来讲,文本反而无意义,prompt 向量随着训练会将 prompt 变得越来越符合业务场景。

假设一句 prompt 由 20 个单词组成,按照 GPT3 的设定每个单词映射的向量维度是12288,20个单词便是245760,理论上需要训练的参数只有245760个,相比175 billion 的量级,245760这个数字可以忽略不计,当然也会增加一些额外的辅助参数,但同样其数量也可忽略不计。

问题来了,这么少的参数真的能逼近 fine tuning 的效果吗,当然还是有一定的局限性。如下图所示,蓝色部分代表初版的 prompt tuning, 可以发现 prompt tuning 仅有在模型参数量级达到一定程度是才有效果。虽然这可以解决大多数的场景,但在某些具体垂直领域的应用场景下则未必有用。因为垂直领域的微调往往不需要综合的 LLM 预训练模型,仅需垂直领域的 LLM 模型即可,但是相对的,模型参数不会那么大。所以随着发展,改版后的 prompt tuning 效果可以完全取代 fine-tuning。下图中的黄色部分展示的就是 prompt tuning v2 也就是第二版本的 prompt tuning 的效果。

Figure 12. Prompt learning parameters

V2 的改进是将原本仅在最初层输入的连续 prompt 向量,改为在模型传递时每一个神经网络层前均输入连续 prompt 向量,如下图所示。

Figure 13. Prompt learning v2

还是以 GPT3 模型为例,GPT3 总从有96层网络,假设 prompt 由20个单词组成,每个单词映射的向量维度是12288,则所需要训练的参数量 = 96 * 20 * 12288 =23592960。是175 billion 的万分之1.35。这个数字虽不足以忽略不计,但相对而言也非常小。

未来可能会有 prompt tuning v3, v4 等问世,甚至我们可以自己加一些创新改进 prompt tuning,例如加入长短期记忆网络的设定。(因为原版的 prompt tuning v2 就像是一个大型的 RNN, 我们可以像改进RNN 一般去改进prompt tuning v2)。总之就目前而言,prompt tuning 使得微调 LLM 变得可行,未来一定会有很多垂直领域的优秀模型诞生。

总结

Large Language Models (LLMs) 和 Web3 技术的整合为去中心化金融(DeFi)领域带来了巨大的创新和发展机遇。通过利用 LLMs 的能力,应用程序可以对大量不同数据源进行全面分析,生成实时的投资机会警报,并根据用户输入和先前的交互提供定制建议。LLMs 与区块链技术的结合还使得智能合约的创建成为可能,这些合约可以自主地执行交易并理解自然语言输入,从而促进无缝和高效的用户体验。

这种先进技术的融合有能力彻底改变 DeFi 领域,并开辟出一条为投资者、交易者和参与去中心化生态系统的个体提供新型解决方案的道路。随着 Web3 技术的日益普及,LLMs 创造复杂且可靠解决方案的潜力也在扩大,这些解决方案提高了去中心化应用程序的功能和可用性。总之,LLMs 与 Web3 技术的整合为 DeFi 领域提供了强大的工具集,提供了有深度的分析、个性化的建议和自动化的交易执行,为该领域的创新和改革提供了广泛的可能性。


参考文献

发表评论
发表评论
暂无评论
    相关阅读
    币界百科
    币界资讯
    以下 3 个关键事件可能有助于 Ripple(XRP)成为全球领先的跨境交易力量。
    区块链
    2025-05-25 17:46:00
    以下是柴犬(SHIB)在两年内达到0.01美元的三种方法。但这种方法需要强大的奉献精神和投入。
    区块链
    2025-05-25 15:46:04
    HYPE 的势头目前看来已不可阻挡。
    区块链
    2025-05-25 15:00:03
    尽管狗狗币在过去 24 小时内有所下跌,但该 meme 币在过去一周表现强劲。
    区块链
    2025-05-25 11:39:18
    超过3000名投资者已注册迪拜的旗舰房地产代币化项目。迪拜土地局高级主管Mahmoud AlBurai
    区块链
    2025-05-25 06:10:54
    2025年Meme币市场热度持续飙升,带来了众多惊喜。Luce代币自上线后价格猛涨,从0.00009033美元的发行价涨至0.05美元,最高涨幅接近千倍,还引发了数十个仿盘项目。MUSK币24小时内暴涨240%,最高触及0.037美元,马斯克家族的介入或成其下一轮爆发催化剂。此外,华尔街Pepe预售金额超5000万美元,XBIT交易所也重塑了Meme币交易生态。
    区块链百科
    2025-03-07 17:38:16
    在加密货币市场蓬勃发展的2025年,全球十大加密货币交易所备受关注。币安作为全球最大的数字货币交易所,拥有超2亿活跃用户,交易对丰富、费用低且安全措施强大。Coinbase是美国受欢迎且监管严格的平台,界面友好、合规性高,适合新手。FTX凭借创新产品和先进工具吸引众多机构客户。火币是老牌交易所,交易量大、支持多币种。OKX交易功能强大、币种选择丰富、界面友好。此外,还有Gate.io、Kraken、KuCoin、Crypto.com、Bitfinex、Bittrex等各具特色的交易所。这些交易所共同构成了加密货币交易的多元格局,投资者需DYOR,谨慎选择适合自己的平台。
    区块链书籍
    2025-03-07 14:52:44
    在加密货币的世界里,WELF杠杆和PALM交易所官网成为众多投资者关注的焦点。WELF杠杆以其独特的交易机制,为投资者提供了放大交易规模的机会,当然,这也伴随着一定的风险。而PALM交易所官网,作为交易的重要入口,有着其自身的特点和优势。PALM币是在以太坊网络上创建的代币,支持机器人开发等。它上架了抹茶交易所、XT网、Uniswap V2等。如果你想了解WELF杠杆的运用技巧,或是想知晓PALM交易所官网的具体功能与安全性,本文将为你提供深度的分析与解读,帮助你在加密交易中做出更明智的决策。DYOR,谨慎前行,一同探索加密货币交易的新可能。
    区块链百科
    2025-03-07 13:55:00
    在加密货币的浪潮中,WZRDs永续合约和PHIL交易所官网备受关注。WZRDs永续合约作为加密合约交易的潜力选手,设计注重用户体验与风险控制,链上数据显示其交易所净流量稳定,巨鲸地址也有关注,反映出潜在市场价值。而PHIL币相关信息受投资者探寻,虽未提及PHIL交易所官网详细信息,但对加密爱好者而言,了解WZRDs永续合约与PHIL交易所官网,是把握加密领域动态的重要一环,DYOR,深入探索加密世界的无限可能。
    区块链书籍
    2025-03-07 13:01:47
    在虚拟币的世界里,哪些币最具价值备受关注。2024年全球十大最值钱的虚拟币排名新鲜出炉。比特币作为加密货币先驱,市值超1万亿美元居榜首;以太坊凭借智能合约平台,市值超5000亿美元紧随其后。还有币安币、泰达币等也都在榜单之中,各有其独特优势和市场定位,下面为你详细介绍这十大虚拟币。
    矿业百科
    2025-03-07 14:28:58
    MUSK币作为一个新兴的加密货币项目,目前在市场上备受关注。截至2025年3月2日22:33:25,MUSK币价格为¥ 0.0010,约$0.00014,24小时涨幅0.93%。其总市值为¥0.00 ,24H最高¥0.0010 ,24H最低价¥0.00100 ,24H成交量63.74万,24H成交额¥661.53 ,24H换手率1.85%。MUSK币目前还处于起步阶段,发行总量为10亿枚,但流通数量暂时为零,项目可能还在初期开发或筹备阶段。尽管如此,其旨在打造去中心化金融生态系统的目标明确,未来发展值得期
    区块链知识
    2025-03-03 20:02:17
    在加密货币领域,新的交易模式和平台不断涌现,ANYONE杠杆和ASTR交易所成为了备受关注的焦点。ANYONE杠杆为投资者提供了独特的交易体验,让市场的波动有了更多的操作空间。而ASTR交易所作为一个具有潜力的交易平台,其背后的ASTR币凭借区块链的全球互联特性,在跨境支付与汇兑、供应链金融等领域有着重要应用。ASTR币不仅是Astar网络的实用代币,还支持多重签名等安全功能,为投资者的资产安全保驾护航。同时,Astar Network的创新功能也为开发者提供了更多的激励和选择。深入了解ANYONE杠杆与
    币种知识
    2025-03-03 19:38:33
    近期,狗狗币在加密货币市场中掀起了轩然大波,其价格大幅飙升。在周末狗狗币保持强劲的看涨势头,上涨31%,价格推至0.28美元,达2021年11月以来的最高。模因币价值翻倍,飙升155%,上周涨幅也高达86%。埃隆·马斯克的相关活动及美国政权更迭等因素推动了此次激增。同时,狗狗币市值飙升超350亿美元,已翻转XRP市值。其跟踪期货的未平仓合约利率接近历史最高,还推动了相关模仿代币上涨。未来狗狗币走势如何,又将给加密市场带来怎样的影响,值得我们持续关注和深入探讨。
    矿业知识
    2025-03-03 17:19:24
    在当今的加密货币领域,AXEL交易所与艾达币平台备受瞩目。AXEL致力于通过灵活易用的技术方案,为用户提供真正的数据所有权,其发布的全球去中心化网络AXEL.Network更是助力用户向去中心化计算迁移。艾达币作为Cardano项目的原生加密货币,用途广泛,涵盖支付交易费用、治理网络等。然而,加密市场变幻莫测,艾达币价格也经历着显著波动,其价格下降时交易量上升的现象值得关注。AXEL交易所和艾达币平台在加密市场中有着各自的特色与发展路径,投资者需DYOR,深入了解其背后的技术、市场动态等信息,以更好地把握
    钱包知识
    2025-03-04 10:22:41
    中美之间的谈判将于本周末在瑞士启动,这可能会成为市场的主要驱动力。
    比特币新闻
    2025-05-12 12:31:38
    推荐专栏
    热门币种
    更多
    币种
    美元价格
    24H涨跌幅
    BTC比特币
    109,810.24 USDT
    ¥787,207.64
    +1.82%
    ETH以太坊
    2,559.09 USDT
    ¥18,345.60
    +2.52%
    USDT泰达币
    1.00 USDT
    ¥7.17
    +0.02%
    XRP瑞波币
    2.35 USDT
    ¥16.82
    +1.51%
    BNB币安币
    671.73 USDT
    ¥4,815.49
    +1.16%
    SOL
    176.54 USDT
    ¥1,265.57
    +2.81%
    USDC
    0.99940 USDT
    ¥7.16
    0%
    DOGE狗狗币
    0.22710 USDT
    ¥1.63
    +2.34%
    ADA艾达币
    0.76190 USDT
    ¥5.46
    +3.32%
    TRX波场币
    0.27240 USDT
    ¥1.95
    +1%
    热搜币种
    更多
    币种
    美元价格
    24H涨跌幅
    柚子
    0.771 USDT
    ¥5.61
    +7.01%
    比特币
    109810.24 USDT
    ¥799,418.55
    +1.82%
    Filecoin
    2.821 USDT
    ¥20.54
    +1.31%
    Shiba Inu
    1.453E-5 USDT
    ¥0.00
    +1.89%
    Mask Network
    1.6961 USDT
    ¥12.35
    +1.73%
    Solana
    176.54 USDT
    ¥1,285.21
    +2.81%
    Uniswap
    6.1988 USDT
    ¥45.13
    +2.94%
    dYdX
    0.6132 USDT
    ¥4.46
    -1.02%
    币安币
    671.73 USDT
    ¥4,890.19
    +1.16%
    波场
    0.2724 USDT
    ¥1.98
    +1%
    以太坊
    2559.09 USDT
    ¥18,630.18
    +2.52%
    Horizen
    9.7361 USDT
    ¥70.88
    +4.85%
    最新快讯
    更多
    币界网晨间分析:索拉纳SOL价格行情预测
    2025-05-26 10:00:00
    数据:5月至今Hyperliquid累计收取手续费5540万美元
    2025-05-26 09:56:01
    JamesWynn疑似宣布退出合约交易,累计盈利2500万美元称“带着胜利离场”
    2025-05-26 09:52:52
    巨鲸JamesWynn发文暗示近期将不再参与合约交易
    2025-05-26 09:50:10
    离岸人民币兑美元升破7.17关口,现报7.1645
    2025-05-26 09:42:31
    某用户遭受交易历史记录污染攻击,损失超84万美元
    2025-05-26 09:33:36
    赵长鹏:BSC和SOL不存在竞争,应一起把行业做大
    2025-05-26 09:32:12