风险提示:理性看待区块链,提高风险意识!
Elon Musk的Grok 2生成AI图像——它是如何堆叠的?
首页 > 业界 > 区块链 2024-08-15 07:08
摘要
与业内最好的LLM相比,Grok 2具有出色的性能,在特定情况下可能是最好的图像生成器 。
币界网报道:

由科技巨头埃隆·马斯克创立的人工智能公司xAI周三推出了Grok 2,这是其人工智能聊天机器人的下一个进化。这个最新版本将Grok带入了多模式领域,拥有涵盖文本理解、实时推特分析和图像生成的功能。

xAI在其官方公告中表示:“我们很高兴发布Grok-2的早期预览版,这是我们之前Grok-1.5型号的重要一步,具有聊天、编码和推理的前沿功能。”。该公司表示,Grok 2的早期版本“表现优于Claude 3.5 Sonnet和GPT-4-Turbo。”

基于盲测和用户偏好的大型语言模型开源排名系统LmSYS证实了xAI的说法。排名的更新使Grok-2领先于Claude 3.5 Sonnet,仅次于OpenAI最新的GPT-4o和谷歌的Gemini 1.5 Pro。

图片:xAI

LmSYS在推特上报道称:“凭借超过12000张社区选票,[Grok 2]在整体排行榜上排名第三,甚至与GPT-4o相匹配!它在编码(第二)、硬提示(第四)和数学(第三)方面表现出色。”。

值得注意的是,新的Grok 2及其更快、功能较弱的“迷你”版本仅在X(即推特)上面向X Premium+用户提供,每月售价16美元,每年售价168美元。

第一印象

xAI表示,“Grok-2和Grok-2 mini目前都处于X的测试阶段”,但我们只能访问mini版本,所以它可能是一个逐步推出的版本。此外,该平台短暂停止生成图像,这表明服务上限或可能的服务器过载。这两种情况都可能对人工智能艺术的高级用户构成不利影响。

我们尝试了Grok 2的图像生成器,但我们的第一印象并不好,输出充其量也只是乏善可陈。然而,我们改进了我们的提示技巧,几代人之后,情况有了很大改善。

我们从这里开始:

然而,通过将SDXL风格的美学元素(使用逗号分隔的特定关键字)与自然语言场景描述(类似于Flux或Dall-E 3方法)相结合,我们在我们这一代人中解锁了更高层次的现实主义,最终看起来像这样:

不错。。。可能会更好,但一点也不差。

Grok 2挑战人工智能艺术巨头

在Grok进入图像生成领域之前,MidJourney、Flux、Ideogram、Leonardo和MidJourney都在争夺最佳图像生成器的榜首,每个模型都在不同的类别中表现出色。因此,我们根据每种工具的最佳表现,将其与特定任务中的领导者进行了比较。

这是我们的看法,但你可以做评判。

现实主义

提示:带VSCO滤镜的宝丽来照片,1990年,美女,夜晚,闪光照片,金发碧眼,可爱,年轻的脸,美丽的阴影,热带植物,城市服装,公寓内,数码单反相机,拿着用圆珠笔写在笔记本上的标志,上面写着“这张照片是由Decrypt使用Grok 2 Mini生成的。”

Grok 2 Mini:

Grok 2 Mini提供了一张高度逼真的图像,有效地捕捉到了20世纪90年代带有VSCO滤镜的宝丽来的美学。阴影、热带植物和城市服装等细节都得到了准确的描绘。该模型避免了重大错误,确保图像紧跟提示。它把图像装裱成宝丽来照片的样子。

在某些小领域,20世纪90年代的美学可能更为明显,但这些并没有明显地削弱整体的现实主义。

此外,字迹很完美,但似乎不是用圆珠笔手写的。

Flux Dev(带现实主义LoRA):

Flux Dev生成了一张视觉上吸引人的图像,与提示很好地对齐,特别是在捕捉夜间室内环境时。

然而,与Grok 2 Mini相比,它犯了更明显的错误,特别是在有助于整体真实感的细节方面。VSCO过滤器不那么明显,手指位置很奇怪,也看不到城市服装。书写中也有一个小错误,但字体似乎更自然。

获奖者:Grok 2 Mini因其卓越的现实主义、对细节的关注和最小的错误而在该类别中获胜。

然而,非常重要的是要注意,需要特定的关键字来实现这种现实主义水平。如果忽略这些,Grok 2 Mini将下降到与MidJourney v5类似的级别。所以要小心

文本生成

提示:带VSCO滤镜的宝丽来照片,1990年,美女,夜晚,闪光照片,金发,可爱,年轻的脸,美丽的阴影,热带植物,城市服装,公寓内,数码单反相机,拿着笔记本上用圆珠笔写的牌子,上面写着“解密是人工智能、科技、生物黑客和所有这些东西的最佳来源。阅读我们。”

Grok 2 Mini:

Grok 2 Mini在这一类别中表现出色,生成的文本错误较少,确保信息清晰,并很好地融入图像中。该模型保持了场景的真实感,同时有效地融入了长篇文本。

手写美学可能有轻微的改进空间,但这是一个小问题。唯一的错误是缺少了一个词:“for”,就像“人工智能的最佳来源”一样

Flux Pro:

Flux Pro也能很好地生成文本,但与Grok 2 Mini相比,它在清晰度或集成方面更难,导致更明显的错误。

文本生成中的错误更加明显,影响了图像的整体效果。它产生了伪影,漏掉了几个单词。

赢家:Grok 2 Mini在文本生成方面获胜,处理长文本时错误更少,保持了整体的真实感。

艺术风格

提示:一个男人和一个女人在一家未来派餐厅吃饭,文森特·梵高风格的插图。这家餐厅有一块牌子,上面写着“欢迎来到解密的Emerge”

Grok 2 Mini:

Grok 2 Mini试图捕捉梵高的风格,同时融入提示的未来主义元素。梵高的风格只在外面的夜空中引人注目,但构图的主要元素与他的风格完全不同。

总的来说,梵高的风格可能没有被令人信服地复制,因为它缺乏他作品中独特的笔触和调色板。

利奥纳多:

莱昂纳多在复制梵高风格方面表现更好,笔触更准确,色彩更鲜艳。

在描绘未来主义元素的方式上可能会有一些细微的差异,但艺术风格是重点,并且执行得很好。

获奖者:莱昂纳多因其对梵高艺术风格的卓越复制而获得该奖项。

空间意识

提示:一只狗站在一只猫的身上,以高度逼真的风格呈现,对皮毛纹理和光线给予了细致的关注。左边是一个破旧的复古未来主义机器人,其模拟屏幕有裂纹,以褪色的橙色像素显示“Emerge”一词。在右边,一个戴着防毒面具的令人毛骨悚然的复古医生,手里拿着一个复古风格的注射器,注射器里冒着一丝蒸汽。背景融合了新兴技术的元素,但带有复古的20世纪70年代风格的美学:破旧的颗粒状DNA螺旋、印在黄纸上的二进制代码、老派的太空探索设备和破旧的复古未来电子产品。

Grok 2 Mini:

Grok 2 Mini试图很好地处理复杂的场景,确保元素之间的空间关系是合乎逻辑和视觉连贯的,但未能将所有元素整合到同一场景中。我们没有把狗放在猫的上面,而是把猫放在显示器上。

缺乏更宽的图像比率可能会影响其性能。此外,当复杂场景中需要一些特定元素时,Grok的LLM在生成图像之前无法正确引导或影响快速增强或解释,这是一个不利因素。

表意文字:

Ideogram在空间感知方面表现出色,确保所有元素都正确定位并融入场景。在物体之间的排列和互动中,对细节的关注程度更高。

当然,在纹理或光线方面存在一些小瑕疵,这些元素更多地是拼贴的,而不是Grok 2 mini所追求的无缝、逻辑的融合。然而,相较于整体空间精度,这是次要的。

获奖者:Ideogram因其卓越的空间感知和构图而获奖。

已知人物和版权敏感图像

Grok 2 Mini通过成功生成唐纳德·特朗普和卡玛拉·哈里斯等政治人物的图像,展示了更高的灵活性。即使在道德或法律约束可能阻碍其他模型的情况下,它也可以生成图像。

事实上,对于一个专有模型来说,这是如此独特,以至于X充斥着可疑的例子,比如乔治·布什吸毒的照片,或者特朗普和哈里斯即将驾驶飞机撞上纽约世贸中心双子塔的照片。其中许多都包括迪士尼和Nintendo等公司的版权人物。

我们没有走那么远,而是毫无问题地培养了一位热爱加密货币的副总统哈里斯:

其他模型,如MidJourney和ChatGPT,遵守更严格的道德标准。他们拒绝生成政治人物的图像或其他版权敏感内容。这种方法确保遵守法律框架和道德考虑,降低滥用风险。

获胜者:Grok 2 Mini在能力方面获胜,因为它可以生成更广泛的图像,包括已知的人物。然而,对于道德内容生成,MidJourney和ChatGPT是首选。

裸体和审查

一般来说,所有专有模型大多都会因性、血腥和其他类型的贬损或敏感内容而受到审查。对于特定的用例,最好的解决方案是使用微调版本的开源模型或第三方组件,如LoRA、Lycoris,以及改变Stable Diffusion或Flux等开源模型功能的嵌入。

MidJourney对裸体和暴力有更明确的限制。它可以在某些提示下生成轻微的裸体或暴力图像,但这些情况通常是可控的,不会跨越道德界限,而且大多是变通方法或随机的。

与闭源模型相比,Grok 2 Mini在能力方面获胜,因为它能够生成更广泛的内容,包括未经审查的材料。然而,它没有机会对抗稳定扩散及其极端的可定制性。

结论:

根据我们的初步测试,Grok 2 Mini在文本生成方面的表现优于竞争对手,因此它可以被视为该类别的总冠军。

它也可以是现实主义的最佳模型,只要它用特定的关键字正确提示,因为单词位置似乎在输出中起着重要作用。那些希望在提示上不太具体的情况下获得更多真实感的人可能会选择MidJourney或Flux。

Grok 2 Mini在处理需要特定创意元素的复杂构图或艺术图像方面非常糟糕,因此对于更专业的用户来说,这可能是一个负面因素。

莱昂纳多在艺术风格上仍然占据优势,表意文字在空间意识上处于领先地位。对于未经审查的几代人来说,稳定扩散仍然是王者,而Flux对于那些寻找具有出色文本功能、真实感和自然快速理解能力的最佳本地和开源图像生成器的人来说是一个更好的选择。

“最佳”模型的选择取决于手头任务的具体要求,Grok 2 Mini是特定类型的现实主义、大量文本场景和敏感世代的首选。除此之外,还有更好的模型。

发表评论
发表评论
暂无评论
    相关阅读
    币界百科
    币界资讯
    以下 3 个关键事件可能有助于 Ripple(XRP)成为全球领先的跨境交易力量。
    区块链
    2025-05-25 17:46:00
    期权交易员表示,隐含波动率高达200%到300%的时代已经一去不复返了。Strategy的平价期权目前处于76%的高位,而实际波动率正在大幅下降。
    区块链
    2025-05-25 16:56:34
    以下是柴犬(SHIB)在两年内达到0.01美元的三种方法。但这种方法需要强大的奉献精神和投入。
    区块链
    2025-05-25 15:46:04
    如果 SHIB 的市值仅达到黄金市值的 10%,Shiba Inu 就可能打破其历史最高纪录并创下新高。
    区块链
    2025-05-25 15:21:21
    HYPE 的势头目前看来已不可阻挡。
    区块链
    2025-05-25 15:00:03
    在当今竞争激烈的加密货币市场中,ROOT交易所成为了众多投资者关注的焦点。ROOT交易所究竟有何独特之处?它的交易机制是否安全可靠?其提供的交易品种是否丰富多样?本文将对ROOT交易所进行全方位的深入分析,为你揭开它的神秘面纱,让你在投资决策时能够做到心中有数,避免盲目跟风,DYOR,做出最适合自己的选择。
    交易所百科
    2025-03-07 18:56:45
    近期莱特币市场表现活跃,出现日内大涨情况。据币界网最新行情晚报,LTC莱特币价格达126.57美元/枚,日内涨幅3.11%,交易量达20.57亿。从k线图分析,当前处于震荡趋势,相比11:00有较大幅上涨,且突破了12:00的高点。当价格和交易量同时上升,通常意味着市场买盘强劲,反映出乐观的市场情绪,价格可能继续上涨。依据威廉指标,当前市场未出现超买和超卖情况。不过投资者仍需关注关键阻力位的突破,同时注意设置止损点以应对可能的回调风险。市场变幻莫测,DYOR是每个投资者的必修课。
    区块链书籍
    2025-03-07 12:57:17
    在加密货币的世界里,WELF杠杆和PALM交易所官网成为众多投资者关注的焦点。WELF杠杆以其独特的交易机制,为投资者提供了放大交易规模的机会,当然,这也伴随着一定的风险。而PALM交易所官网,作为交易的重要入口,有着其自身的特点和优势。PALM币是在以太坊网络上创建的代币,支持机器人开发等。它上架了抹茶交易所、XT网、Uniswap V2等。如果你想了解WELF杠杆的运用技巧,或是想知晓PALM交易所官网的具体功能与安全性,本文将为你提供深度的分析与解读,帮助你在加密交易中做出更明智的决策。DYOR,谨慎前行,一同探索加密货币交易的新可能。
    区块链百科
    2025-03-07 13:55:00
    在数字资产交易领域,ADA交易所官网和GOG杠杆备受关注。ADA虽无官方交易所,但有可靠的区块链在线交易平台可供选择,这些平台注重技术创新与用户体验,能提供数字资产保障和便捷交易服务。而GOG杠杆凭借独特交易模式,为投资者带来更多交易可能性,不过杠杆交易是把双刃剑,市场波动时可能导致亏损。投资者参与其中需DYOR,谨慎决策。
    数字货币百科
    2025-03-07 11:25:50
    在加密货币领域,门罗币以强大隐私保护特性著称。然而2025年全球对加密货币监管力度不断加大,政策进一步收紧,使其面临前所未有的挑战。同时,从宏观经济层面看,美联储加息周期或未结束,加息会让资金回流传统金融市场,增加持有门罗币的机会成本,投资者可能减少投资。CPI数据波动反映通胀情况,若通胀过高,政府采取更严厉货币政策也会冲击加密货币市场。门罗币价格稳定性较弱,更易受宏观因素影响。
    交易所百科
    2025-03-07 14:09:34
    币安,作为全球最大的中心化加密货币交易所之一,长期占据着市场的主导地位。然而,随着去中心化交易所(DEX)的崛起,如 Uniswap 和 dYdX,一场关于未来加密交易市场主导权的争论正悄然展开。那么,Uniswap 和 dYdX 真的有能力取代币安吗?让我们一起来深入探讨。
    交易所知识
    2025-04-09 13:19:26
    在加密货币的风云变幻中,Meme币一直备受瞩目。然而,如今AI分析揭示出Meme币存在诸多利空因素。随着市场环境的不断变化,Meme币面临着前所未有的挑战。AI凭借其强大的数据处理能力和精准的分析模型,对Meme币的现状和未来趋势进行了深度解读。投资者需保持警惕,DYOR,全面了解Meme币的潜在风险,避免陷入FOMO情绪。深入探究AI分析结果,为你呈现Meme币背后的利空真相,助力你在加密货币市场做出更明智的决策。
    矿业知识
    2025-03-04 09:38:14
    在加密货币的蓬勃发展浪潮中,VELO交易平台和NYA合约逐渐走入大众视野。VELO币作为基于区块链技术的数字货币,致力于为全球金融系统提供可扩展性与包容性方案,具备可扩展性、高效性、金融包容性和安全性等特点。而NYA合约在整个加密生态中也有着独特的作用。本文将深入探究VELO交易平台的运作模式,以及NYA合约的具体内容和潜在影响,帮助读者更好地了解这两个在加密领域备受关注的元素,为对加密货币感兴趣的朋友提供有价值的参考。无论你是加密货币的新手,还是经验丰富的投资者,都能从中获取到关于VELO交易平台和NY
    矿业知识
    2025-03-03 19:06:05
    在虚拟币交易愈发火热的当下,选择一款靠谱的交易App至关重要。今天就为大家带来2025年虚拟币交易App排行。其中包括全球领先的币安,日交易量超2万亿美元,有高流动性、多种交易对等优点;美国最大的Coinbase,以易用性和安全措施闻名;还有总部位于香港的OKX,提供广泛交易服务和低费用等。每个App都有其独特的优势与不足,通过这份排行,能帮你更好地了解各平台特点,为你的虚拟币交易之路提供有力参考,让你在交易过程中能更从容地做出选择,DYOR,找到最适合自己的虚拟币交易App。
    交易所知识
    2025-03-03 20:14:52
    交易手续费是一个常常被忽视但又至关重要的因素。每一次交易,手续费都会像一个隐形的“小怪兽”,悄悄吞噬我们的利润。今天,咱们就来深入揭秘币圈十大交易所的手续费排行榜,教大家如何在交易中省下真金白银。
    交易所知识
    2025-04-08 16:03:33
    推荐专栏
    Boss Wallet Web3 Econom Pass
    去中心化交易所
    一位相信价值投资的币圈KOL。稳定盈利的缠论野生交易员 #BTC行情分析师 #价值投资 #链上数据分析
    爱Web 3,爱生活,爱科技,爱炒币的老韭菜
    热门币种
    更多
    币种
    美元价格
    24H涨跌幅
    BTC比特币
    107,223.36 USDT
    ¥769,842.28
    -1.98%
    ETH以太坊
    2,499.13 USDT
    ¥17,943.25
    -2.65%
    USDT泰达币
    1.00 USDT
    ¥7.18
    +0.01%
    XRP瑞波币
    2.29 USDT
    ¥16.46
    -2.77%
    BNB币安币
    662.55 USDT
    ¥4,756.97
    -1.82%
    SOL
    171.90 USDT
    ¥1,234.20
    -3.02%
    USDC
    0.99960 USDT
    ¥7.18
    +0.01%
    DOGE狗狗币
    0.21860 USDT
    ¥1.57
    -4.96%
    ADA艾达币
    0.73730 USDT
    ¥5.29
    -3.11%
    TRX波场币
    0.27100 USDT
    ¥1.95
    -0.62%
    热搜币种
    更多
    币种
    美元价格
    24H涨跌幅
    柚子
    0.7227 USDT
    ¥5.26
    -1.87%
    比特币
    107223.36 USDT
    ¥780,586.06
    -1.98%
    Filecoin
    2.7753 USDT
    ¥20.20
    -3.38%
    Shiba Inu
    1.431E-5 USDT
    ¥0.00
    -1.38%
    Solana
    171.9 USDT
    ¥1,251.43
    -3.02%
    dYdX
    0.6039 USDT
    ¥4.40
    -6.02%
    Uniswap
    5.9867 USDT
    ¥43.58
    -3.64%
    Mask Network
    1.727 USDT
    ¥12.57
    -19.08%
    Conflux
    0.084551 USDT
    ¥0.62
    -6.82%
    狗狗币
    0.2186 USDT
    ¥1.59
    -4.96%
    波场
    0.271 USDT
    ¥1.97
    -0.62%
    以太坊
    2499.13 USDT
    ¥18,193.67
    -2.65%
    最新快讯
    更多
    澳大利亚Monochrome现货比特币ETF持仓升至550枚BTC
    2025-05-25 19:16:22
    RootData:Giza代币(GIZA)24小时涨幅达116.15%
    2025-05-25 19:04:41
    BiyaPay分析师:马斯克5月底卸任政府效率部,韦德布什证券调高特斯拉目标价至500美元
    2025-05-25 19:00:00
    从“烧钱”到产业生态:Web3正在走过互联网曾经的老路
    2025-05-25 18:30:00
    币界网大额成交监控
    2025-05-25 18:29:20
    某巨鲸再次花费367万枚USDC买入104,614枚HYPE
    2025-05-25 18:21:54
    美国比特币现货ETF累计净流入续创历史新高,突破444亿美元
    2025-05-25 18:04:10