智谱AI开源视觉语言模型CogAgent,支持GUI图形界面问答
币界网报道:据站长之家 12 月 21 日消息,智谱 AI 开源了 CogAgent,它是一个视觉语言模型,拥有 180 亿参数规模。该模型在 GUI(图形用户界面)理解和导航方面表现出色,在多个基准测试上取得了 SOTA 的通用性能。此外,它还支持高分辨率的视觉输入和对话问答,并且可以针对任意 GUI 截图进行问答。
推荐专栏
热门币种
更多
币种
美元价格
24H涨跌幅
热搜币种
更多
币种
美元价格
24H涨跌幅
最新快讯
更多
2024-05-26 22:05:34
2024-05-26 22:04:16
2024-05-26 22:03:32
2024-05-26 22:02:43
2024-05-26 22:01:53
2024-05-26 22:00:56
2024-05-26 22:00:27