风险提示:理性看待区块链,提高风险意识!
苹果开源OpenELM,大模型开源领域再迎一巨头!
首页 > 业界 > 区块链 2024-04-25 14:00:03
币界网报道:

文章来源:AIGC开放社区


图片来源:由无界AI生成


4月24日,苹果开源了大语言模型OpenELM。这与微软刚开源的Phi-3 Mini类似,是一款专门针对手机等移动设备的模型。

OpenELM有指令微调和预训练两种模型,一共有2.7亿、4.5亿、11亿和30亿4种参数,提供生成文本、代码、翻译、总结摘要等功能。

虽然最小的参数只有2.7亿,但苹果使用了1.8万亿tokens的数据进行了预训练,这也是其能以小参数表现出超强性能的主要原因之一。

值得一提的是,苹果还把训练OpenELM模型的深度神经网络库CoreNet也开源了,仅1天多的时间Github就超过1100颗星。苹果的MobileOne、CVNets、MobileViT、FastVit等知名研究都是基于CoreNet完成的。


开源地址:https://huggingface.co/collections/apple/openelm-instruct-models-6619ad295d7ae9f868b759ca?ref=maginative.com

CoreNet地址:https://github.com/apple/corenet?ref=maginative.com

论文地址:https://arxiv.org/abs/2404.14619



目前,大模型领域主要分为开源和闭源两大阵营,国内外知名闭源的代表企业有OpenAI、Anthropic、谷歌、Midjourney、Udio、百度、科大讯飞、出门问问、月之暗面等。

开源阵营有Meta、微软、谷歌、百川智能、阿里巴巴、零一万物等。苹果作为手机闭源领域的领导者,本次却罕见地加入开源大模型阵营,可能在效仿谷歌的方式先通过开源拉拢用户,再用闭源产品去实现商业化营利。

不管咋说,苹果选择开源对于开发者、中小企业来说都是一个不错的福利。因为,与以往只提供模型权重和推理代码的做法不同,苹果发布了完整的训练、评估框架等

主要内容包括数据准备、模型训练、微调以及评估流程,同时提供了多个预训练检查点和训练日志,可以让我们深度了解全球顶级科技公司的技术思想和开发流程。


OpenELM架构简单介绍

OpenELM采用了无编码器的transformer架构,并在多个方面进行了技术创新。OpenELM的使用了一种“层级缩放”策略,使得模型能够跨各个转换器层更有效地分配参数,能以最少的训练数据取得了更好的性能,同时极大提升准确率。

例如,11亿参数的OpenELM,比12亿参数的OLMo模型的准确率高出2.36%,而使用的预训练数据却只有OLMo的一半



此外,OpenELM不使用任何全连接层中的可学习偏置参数,采用RMSNorm进行预归一化,并使用旋转位置嵌入编码位置信息。

OpenELM还通过分组查询注意力代替多头注意力,用SwiGLU FFN替换了传统的前馈网络,并使用了Flash注意力来计算缩放点积注意力,能以更少的资源来进行训练和推理。


训练流程与数据集

在训练流程中,苹果采用了CoreNet作为训练框架,并使用了Adam优化算法进行了35万次迭代训练。

苹果使用了批量大小为4096的小批量随机梯度下降进行模型参数更新,并设置了适当的学习率和权重衰减。



预训练数据集方面,OpenELM使用了包括RefinedWeb、去重的PILE、RedPajama的子集和Dolma v1.6的子集在内的公共数据集,一共约1.8万亿tokens数据。

此外,苹果使用了动态分词和数据过滤的方法,实现了实时过滤和分词,从而简化了实验流程并提高了灵活性。还使用了与Meta的Llama相同的分词器,以确保实验的一致性。

这次苹果真的是很有诚意的开源,一开到底所有内容都贡献出来了,家大业大就是敢玩。这也表明苹果进军大模型领域的决心,以后开源领域更热闹啦~

本文素材来源OpenELM论文,如有侵权请联系删除

END

上一篇: 机器竞技场公测版首次推出新的可开采资产
下一篇: 美国以太坊ETF延迟-香港如何在竞争中领先
推荐专栏
Boss Wallet Web3 Econom Pass
专注币圈最新资讯
通俗浅显地聊透Web3大事小情
读懂区块链生态与未来,尽在币界网!
热门币种
更多
币种
美元价格
24H涨跌幅
BTC比特币
63,911.81 USDT
¥456,144.97
+3.04%
ETH以太坊
3,136.09 USDT
¥22,382.58
+2.03%
BNB币安币
589.11 USDT
¥4,204.53
+1.6%
USDT泰达币
1.02 USDT
¥7.24
-0.41%
SOL
147.56 USDT
¥1,053.15
+3.07%
XRP瑞波币
0.54220 USDT
¥3.87
+1.67%
USDC
1.00 USDT
¥7.14
-0.02%
DOGE狗狗币
0.16070 USDT
¥1.15
+14.87%
TON
5.72 USDT
¥40.85
+2.8%
ADA艾达币
0.47260 USDT
¥3.37
+0.64%
热搜币种
更多
币种
美元价格
24H涨跌幅
比特币
63557.25 USDT
¥459,982.89
+2.94%
狗狗币
0.1598 USDT
¥1.16
+14.31%
Solana
146.19 USDT
¥1,058.02
+2.98%
Arweave
36.4064 USDT
¥263.48
+3.27%
Filecoin
6.0834 USDT
¥44.03
+0.58%
字节元
0.019403 USDT
¥0.14
+15.7%
以太经典
27.1011 USDT
¥196.14
+1.51%
Shiba Inu
2.508E-5 USDT
¥0.00
+4.89%
奇亚
33.1938 USDT
¥240.23
-0.86%
NEAR Protocol
6.8876 USDT
¥49.85
+1.77%
柚子
0.8228 USDT
¥5.95
-0.71%
Gala
0.045405 USDT
¥0.33
+1.62%
最新快讯
更多
mfer创始人:没有在friend.tech上,提醒用户有仿冒者
2024-05-05 01:23:35
BTC-E高管承认洗钱罪,司法部指控KuCoin创始人
2024-05-05 01:10:47
揭开真相:ADA鲸鱼揭露Cardano(ADA)FUD错误概念
2024-05-05 01:03:03
沃达丰希望将加密钱包与sim卡集成
2024-05-05 01:02:11
Coinbase的基础提升DeFi性能
2024-05-05 01:01:17
国际比较项目价格预测:国际比较项目能否在下跌中恢复强势?
2024-05-05 01:00:30
爱德华·斯诺登对比特币(BTC)敲响警钟:发布时间敏感加密警告
2024-05-05 01:00:02
下载币界网APP