风险提示:理性看待区块链,提高风险意识!
MetaAI研究人员提出长语境LLM:超越GPT-3.5-Turbo-16k的性能
首页 > 快讯 2023-10-08 11:32:04
币界网报道:据 MarkTechPost 10 月 7 日报道,Meta AI 研究人员提出了一种构建长语境 LLM 的方法,这种方法优于所有现有的开源模型。该方法围绕 LLAMA2 检查点进行持续的预训练,并利用额外的 4000 亿个 token 形成广泛的训练序列。这些序列旨在捕捉长语境理解的本质。此外,这项工作提供了一系列模型变体,包括使用 32,768 个 token 序列训练的较小的 7B/13B 模型和使用 16,384 个 token 序列训练的较大的 34B/70B 模型。与研究基准上的 LLAMA 2 相比,该方法在长语境任务中取得了显著改进,而在标准短语境任务中则略有提高。这些改进在编码、数学问题解决和知识相关任务中尤为明显。此外,该团队还探索了一种简单而经济高效的程序,用于在没有人类标注数据的情况下对持续预训练的长模型进行指令微调。结果是,在一系列长语境基准测试中,聊天模型的性能超过了 gpt-3.5-turbo-16k 模型。
上一篇: Paxos高管:CBDC可以使没有银行账户的人能够获得数字金融服务,并促进银行交易
下一篇: 金色晨讯|10月6日隔夜重要动态一览
推荐专栏
Boss Wallet Web3 Econom Pass
专注币圈最新资讯
通俗浅显地聊透Web3大事小情
读懂区块链生态与未来,尽在币界网!
热门币种
更多
币种
美元价格
24H涨跌幅
BTC比特币
62,118.24 USDT
¥443,344.09
-1.09%
ETH以太坊
2,905.29 USDT
¥20,735.34
-1.3%
BNB币安币
570.96 USDT
¥4,074.99
-3.47%
USDT泰达币
1.02 USDT
¥7.24
-0.1%
SOL
144.24 USDT
¥1,029.45
-3.72%
USDC
1.00 USDT
¥7.15
+0.01%
XRP瑞波币
0.50700 USDT
¥3.62
-1.19%
TON
7.03 USDT
¥50.19
-0.87%
DOGE狗狗币
0.14570 USDT
¥1.04
-3.45%
ADA艾达币
0.42830 USDT
¥3.06
-2.99%
热搜币种
更多
币种
美元价格
24H涨跌幅
比特币
61990.14 USDT
¥448,132.92
-1.11%
Solana
143.79 USDT
¥1,039.47
-3.36%
Arweave
41.1489 USDT
¥297.47
+2.37%
Livepeer Token
17.3929 USDT
¥125.74
-1.48%
Shiba Inu
2.31E-5 USDT
¥0.00
-2.37%
狗狗币
0.1457 USDT
¥1.05
-3.57%
字节元
0.01492 USDT
¥0.11
-2.56%
火币积分
0.5059 USDT
¥3.66
+29.02%
NEAR Protocol
6.9773 USDT
¥50.44
-4.94%
Filecoin
5.3892 USDT
¥38.96
-3.57%
dYdX
1.8888 USDT
¥13.65
-3.95%
Yield Guild Games
0.7322 USDT
¥5.29
-5.11%
最新快讯
更多
268750枚MBA已被铸造
2024-05-15 13:26:13
成都警方破获138亿元地下洗钱案
2024-05-15 13:20:08
德根链恢复运营
2024-05-15 13:14:32
中国日报推出其首个NFT“福”
2024-05-15 13:11:30
Ripple和Metaco的合作关系依然强劲,Metaco分享了Ripple机构级托管解决方案的最新消息
2024-05-15 13:02:36
接受比特币养老?MichaelSaylor说是的!
2024-05-15 13:02:07
Pepe标志着一个新的ATH;以下是本月PEPE价格上涨的下一步行动
2024-05-15 13:01:16
下载币界网APP