风险提示:理性看待区块链,提高风险意识!
最佳开源模型刷新多项SOTA,首次超越Mixtral Instruct!「开源版GPT-4」家族迎来大爆发
首页 > 业界 > 区块链 2024-01-19 15:31:00
币界网报道:

原文来源:新智元

图片来源:由无界 AI生成

Mixtral 8x7B模型开源后,AI社区再次迎来一大波微调实践。来自Nous Research应用研究小组团队微调出新一代大模型Nous-Hermes 2 Mixtral 8x7B,在主流基准测试中击败了Mixtral Instruct。

Mixtral 8x7B开源模型的诞生,正如Llama一样,为开源社区了带来曙光。

前段时间,Mixtral刚刚发布了8x7B模型的论文。在基准测试结果中,其性能达到或超过 Llama 2-70B和GPT-3.5。

甚至,Mixtral在数学、代码生成和多语言理解任务方面表现亮眼。

最近,一个开源研究小组Nous Research推出了新一代旗舰大模型Nous-Hermes 2 Mixtral 8x7B。

这是首个通过RLHF训练的模型,并在主流基准测试中超越Mixtral Instruct,成为最佳开源模型。

此外,Nous Research团队发布的SFT和SFT+DPO模型,以及DPO适配器将为用户提供更多选择。

在所有的基准测试中,Nous-Hermes 2 Mixtral 8x7B模型也略不逊色。

目前,这些模型同样在Hugging Face上开源上线。

最佳开源模型诞生

据介绍,最新模型是在Mixtral 8x7B MoeLLM微调训练而来。

具体来说,Nous-Hermes 2 Mixtral 8x7B是在1,000,000个条目进行了训练(主要是GPT-4生成的数据),以及整个AI领域开放数据集等其他高质量数据集。

研究人员同时还发布了SFT Only版本,以及SFT+DPO版本。

模型演示

那么,Nous Research团队最新的模型能力有多强?

编写可视化数据代码完全是小菜一碟。

它还能写赛博朋克的迷幻诗。

可以执行反向翻译,从输入文本中创建提示信息。

基准测试

与Mixtral基础模型相比,Mixtral 8x7B上的Nous-Hermes 2在以下基准测试中取得了全面提升,也是MistralAI首次击败旗舰型号Mixtral Finetune。

在GPT4All中,Nous-Hermes Mixtral 8x7B(SFT+DPO)拿下了75.7分,位列榜单第三。

在AGIEval的排行中,Nous-Hermes Mixtral 8x7B(SFT+DPO)拿下了46.05的成绩。

此外,在BigBench Reasoning Test中,Nous-Hermes 2 Mixtral 8x7B(SFT+DPO)霸榜第一。

背后团队






成立于2023年,Nous Research是一个在大模型领域发布开源研究而闻名的私人应用研究小组。

去年12月,这个研究团队成员曾发布了一款轻量的视觉语言模型——Nous Hermes 2 Vision。

这个模型以希腊神使赫尔墨斯的名字命名。它通过用户上传的图像数据,通过自然语言提供详细的答案。

就在前几天,Nous Research宣布了一轮520万美元的种子融资,涉及了多位天使投资人。

到目前为止,Nous Research已经发布了40多个开源模型,包括Hermes、YaRN、Capybara、Puffin和Obsidian系等系列。

Mixtral模型,会将成为开源版GPT-4




继2023年年初Llama发布之后,一系列羊驼家族瞬间爆发。年底,Mixtral的开源MoE发布,更是为开源年做了一个完美的收尾。

有网友表示,Mixtral或将有实力将于今年接管GPT-4。

在Chatbot Arena排行榜上,Mixtral成为(继GPT-4、Claude和Mistral Medium之后)唯一能打的开源模型,也是仅有7B参数的最小模型,甚至比谷歌的Gemini Pro还要好!

而且它是开源的!任何人可以获取该模型,并将其部署到自己的设备,而且可以对其进行微调,可以随心所欲地使用它。

现在,在Mixtral-7B上进行微调、部署的模型案例,也是非常的多。

比如,有网友用树莓派在本地跑起了Phi-2、Mistral和LLaVA等模型。

还有人出了一款APP,名为Offline Chat:Private AI,能够在iPhone上离线跑Mistral 7B模型。

这样一来,模型生成的内容,可以保障安全和隐私。

还有人用直接偏好微调了Mistral-7B模型。

具体来说,研究人员将使用一种类似RLHF的技术:直接偏好优化(DPO)对OpenHermes-2.5进行微调,从而创建NeuralHermes-2.5。

为此,他们还引入了一个偏好数据集,描述DPO算法的工作原理,并将其应用到模型中。我们将看到它显著提高了OpenLLM排行榜上基本模型的性能。

有网友进行的海底捞针实验中, Mistral-7B-Instruct-v0.2在80000 token情况下,召回率下降。

相信未来,Mixtral模型会向羊驼家族一样,迎来大爆发。

参考资料:

https://twitter.com/NousResearch/status/1746988416779309143

上一篇: Bankless:以太坊现货 ETF 能通过吗?
下一篇: Blast上线测试网并推出激励计划 参与地址短时破10万
推荐专栏
Boss Wallet Web3 Econom Pass
专注币圈最新资讯
通俗浅显地聊透Web3大事小情
读懂区块链生态与未来,尽在币界网!
热门币种
更多
币种
美元价格
24H涨跌幅
BTC比特币
63,661.76 USDT
¥454,360.34
+3.62%
ETH以太坊
3,124.04 USDT
¥22,296.58
+2.36%
BNB币安币
590.97 USDT
¥4,217.81
+2.8%
USDT泰达币
1.02 USDT
¥7.25
-0.37%
SOL
147.35 USDT
¥1,051.65
+3.19%
XRP瑞波币
0.53560 USDT
¥3.82
+2.57%
USDC
1.00 USDT
¥7.14
-0.04%
DOGE狗狗币
0.16520 USDT
¥1.18
+20.06%
TON
5.70 USDT
¥40.70
+5.02%
ADA艾达币
0.46760 USDT
¥3.34
+0.86%
热搜币种
更多
币种
美元价格
24H涨跌幅
比特币
63662.43 USDT
¥460,744.10
+3.66%
Solana
146.26 USDT
¥1,058.53
+3.28%
狗狗币
0.1651 USDT
¥1.19
+20.34%
Arweave
34.8032 USDT
¥251.88
-3.31%
Filecoin
6.1376 USDT
¥44.42
+1.79%
字节元
0.019468 USDT
¥0.14
+19.51%
以太经典
27.0615 USDT
¥195.85
+2.61%
Shiba Inu
2.562E-5 USDT
¥0.00
+7.96%
Yield Guild Games
0.8244 USDT
¥5.97
+1.39%
NEAR Protocol
6.8405 USDT
¥49.51
+3.57%
柚子
0.8219 USDT
¥5.95
-0.4%
奇亚
33.5622 USDT
¥242.90
+1.62%
最新快讯
更多
Solana(SOL)价格在900万美元清算后反弹,目标升至160美元
2024-05-04 23:10:33
巴菲特:伯克希尔的主要投资将永远在美国
2024-05-04 23:06:11
主要加密货币交易所涉嫌数据泄露:已收到回应!以钱币名称和符号为特色
2024-05-04 23:04:53
以下是您应该密切关注这2种加密货币的原因
2024-05-04 23:03:40
MakerDAO在发布季前推出NewStable和NewGovToken
2024-05-04 23:03:01
比特币矿工应对奖励下降
2024-05-04 23:02:19
最新指标分析显示,比特币(BTC)前景可能逆转
2024-05-04 23:01:55
下载币界网APP