最佳开源模型刷新多项SOTA，首次超越Mixtral Instruct！「开源版GPT-4」家族迎来大爆发

首页 > 业界 > 区块链 2024-01-19 15:31:00

币界网报道：

原文来源：新智元

图片来源：由无界 AI生成

Mixtral 8x7B模型开源后，AI社区再次迎来一大波微调实践。来自Nous Research应用研究小组团队微调出新一代大模型Nous-Hermes 2 Mixtral 8x7B，在主流基准测试中击败了Mixtral Instruct。

Mixtral 8x7B开源模型的诞生，正如Llama一样，为开源社区了带来曙光。

前段时间，Mixtral刚刚发布了8x7B模型的论文。在基准测试结果中，其性能达到或超过 Llama 2-70B和GPT-3.5。

甚至，Mixtral在数学、代码生成和多语言理解任务方面表现亮眼。

最近，一个开源研究小组Nous Research推出了新一代旗舰大模型Nous-Hermes 2 Mixtral 8x7B。

这是首个通过RLHF训练的模型，并在主流基准测试中超越Mixtral Instruct，成为最佳开源模型。

此外，Nous Research团队发布的SFT和SFT+DPO模型，以及DPO适配器将为用户提供更多选择。

在所有的基准测试中，Nous-Hermes 2 Mixtral 8x7B模型也略不逊色。

目前，这些模型同样在Hugging Face上开源上线。

最佳开源模型诞生

据介绍，最新模型是在Mixtral 8x7B MoeLLM微调训练而来。

具体来说，Nous-Hermes 2 Mixtral 8x7B是在1,000,000个条目进行了训练（主要是GPT-4生成的数据），以及整个AI领域开放数据集等其他高质量数据集。

研究人员同时还发布了SFT Only版本，以及SFT+DPO版本。

模型演示

那么，Nous Research团队最新的模型能力有多强？

编写可视化数据代码完全是小菜一碟。

它还能写赛博朋克的迷幻诗。

可以执行反向翻译，从输入文本中创建提示信息。

基准测试

与Mixtral基础模型相比，Mixtral 8x7B上的Nous-Hermes 2在以下基准测试中取得了全面提升，也是MistralAI首次击败旗舰型号Mixtral Finetune。

在GPT4All中，Nous-Hermes Mixtral 8x7B（SFT+DPO）拿下了75.7分，位列榜单第三。

在AGIEval的排行中，Nous-Hermes Mixtral 8x7B（SFT+DPO）拿下了46.05的成绩。

此外，在BigBench Reasoning Test中，Nous-Hermes 2 Mixtral 8x7B（SFT+DPO）霸榜第一。

背后团队

成立于2023年，Nous Research是一个在大模型领域发布开源研究而闻名的私人应用研究小组。

去年12月，这个研究团队成员曾发布了一款轻量的视觉语言模型——Nous Hermes 2 Vision。

这个模型以希腊神使赫尔墨斯的名字命名。它通过用户上传的图像数据，通过自然语言提供详细的答案。

就在前几天，Nous Research宣布了一轮520万美元的种子融资，涉及了多位天使投资人。

到目前为止，Nous Research已经发布了40多个开源模型，包括Hermes、YaRN、Capybara、Puffin和Obsidian系等系列。

Mixtral模型，会将成为开源版GPT-4

继2023年年初Llama发布之后，一系列羊驼家族瞬间爆发。年底，Mixtral的开源MoE发布，更是为开源年做了一个完美的收尾。

有网友表示，Mixtral或将有实力将于今年接管GPT-4。

在Chatbot Arena排行榜上，Mixtral成为（继GPT-4、Claude和Mistral Medium之后）唯一能打的开源模型，也是仅有7B参数的最小模型，甚至比谷歌的Gemini Pro还要好！

而且它是开源的！任何人可以获取该模型，并将其部署到自己的设备，而且可以对其进行微调，可以随心所欲地使用它。

现在，在Mixtral-7B上进行微调、部署的模型案例，也是非常的多。

比如，有网友用树莓派在本地跑起了Phi-2、Mistral和LLaVA等模型。

还有人出了一款APP，名为Offline Chat：Private AI，能够在iPhone上离线跑Mistral 7B模型。

这样一来，模型生成的内容，可以保障安全和隐私。

还有人用直接偏好微调了Mistral-7B模型。

具体来说，研究人员将使用一种类似RLHF的技术：直接偏好优化(DPO)对OpenHermes-2.5进行微调，从而创建NeuralHermes-2.5。

为此，他们还引入了一个偏好数据集，描述DPO算法的工作原理，并将其应用到模型中。我们将看到它显著提高了OpenLLM排行榜上基本模型的性能。

有网友进行的海底捞针实验中， Mistral-7B-Instruct-v0.2在80000 token情况下，召回率下降。

相信未来，Mixtral模型会向羊驼家族一样，迎来大爆发。

参考资料：

https://twitter.com/NousResearch/status/1746988416779309143

上一篇： Bankless：以太坊现货 ETF 能通过吗？

下一篇： Blast上线测试网并推出激励计划参与地址短时破10万

推荐专栏

Boss Wallet

Boss Wallet Web3 Econom Pass

关注

币圈最前线

专注币圈最新资讯

关注

Web3掘金者

通俗浅显地聊透Web3大事小情

关注

浑水区块链

读懂区块链生态与未来，尽在币界网！

关注

热门币种

币种

美元价格

24H涨跌幅

Bitcoin

BTC比特币

63,661.76 USDT

¥454,360.34

+3.62%

Ethereum

ETH以太坊

3,124.04 USDT

¥22,296.58

+2.36%

BNB

BNB币安币

590.97 USDT

¥4,217.81

+2.8%

Tether USDt

USDT泰达币

1.02 USDT

¥7.25

-0.37%

Solana

SOL

147.35 USDT

¥1,051.65

+3.19%

XRP

XRP瑞波币

0.53560 USDT

¥3.82

+2.57%

USDC

1.00 USDT

¥7.14

-0.04%

Dogecoin

DOGE狗狗币

0.16520 USDT

¥1.18

+20.06%

Toncoin

TON

5.70 USDT

¥40.70

+5.02%

Cardano

ADA艾达币

0.46760 USDT

¥3.34

+0.86%

热搜币种

币种

美元价格

24H涨跌幅

BTC

比特币

63662.43 USDT

¥460,744.10

+3.66%

SOL

Solana

146.26 USDT

¥1,058.53

+3.28%

DOGE

狗狗币

0.1651 USDT

¥1.19

+20.34%

Arweave

34.8032 USDT

¥251.88

-3.31%

FIL

Filecoin

6.1376 USDT

¥44.42

+1.79%

CKB

字节元

0.019468 USDT

¥0.14

+19.51%

ETC

以太经典

27.0615 USDT

¥195.85

+2.61%

SHIB

Shiba Inu

2.562E-5 USDT

¥0.00

+7.96%

YGG

Yield Guild Games

0.8244 USDT

¥5.97

+1.39%

NEAR

NEAR Protocol

6.8405 USDT

¥49.51

+3.57%

EOS

柚子

0.8219 USDT

¥5.95

-0.4%

XCH

奇亚

33.5622 USDT

¥242.90

+1.62%