AI“百模大战”风向变了？360、美图先后出招视觉大模型上演“神仙打架”

2023-06-22 13:05:31来源：华夏时报

随着AI大模型研发应用热潮持续高涨，记者注意到，赛道内的玩家开始将重心从语言大模型转向视觉大模型。近期，Adobe、Meta、360、美图等多家国内外互联网头部企业纷纷发表大模型成果，为本就火热异常的AI市场再添了一把火。

【资料图】

“人工智能在视频领域的应用越来越受到重视。”中国通信工业协会两化融合委员会副会长吴高斌向《华夏时报》记者表示，这些大型AI模型的发布为企业间的竞争带来了新的动力。企业之间的竞争将促进技术创新和进步，同时也将带来更好的产品和服务。竞争还将促进企业间的合作和共享资源，从而更好地满足市场需求。

海内外视觉大模型“神仙打架”

在鳞次栉比的语言大模型、多模态大模型纷纷涌现之后，“视觉大模型”成为又一个兵家必争之地。日前，美图发布AI视觉大模型MiracleVision，一同发布的还有AI视觉创作工具WHEE、AI数字人生成工具DreamAvatar、美图AI助手RoboNeo等7款产品。

据介绍，MiracleVision具有强大的视觉表现力和创作力，能从绘画、设计、影视、摄影、游戏、3D、动漫等视觉创作场景反推技术演化。与市面上其他大模型不同，它尤其擅长亚洲人像摄影、国风国潮、商业设计等生成方向。

美图公司创始人、董事长兼首席执行官吴欣鸿在接受《华夏时报》记者采访时表示：“美图大模型的核心优势是‘懂美学’，C端用户基础足够大，大模型冷启动的获客成本低，美图目前有2.43亿的月活用户，全球VIP会员数为719万，能在短时间去验证产品成功与否。不同于其他厂商，美图大模型聚焦于美学（画面画质设计等），未来如果非要竞争，会在美学上面去‘卷’。”

无独有偶，360也日前正式发布“360智脑－视觉大模型”。 360创始人周鸿祎表示，大语言模型是构建视觉大模型的基础，多模态能力增强的核心是借助了大语言模型的认知、推理、决策能力。同时，视觉大模型也是“360智脑”的重要能力组成，能够看懂图片，未来还能看懂视频、听懂声音。

海外企业也已经开始在视觉大模型上布局。日前，社交媒体巨头Meta宣布，将向研究人员开放一个名为I-JEPA的“类人”人工智能模型的部分组件，该模型可以比现有模型更准确地分析和完成未完成的图像，而不是像其他生成式人工智能模型那样，只根据附近的像素进行推断。

Meta公司首席人工智能科学家杨立昆曾公开指出，当前的GPT自回归模型存在缺乏规划、推理的能力，未来GPT系统或将被抛弃，并给出了他认为的正确答案——世界模型。据称I-JEPA是第一个基于其愿景关键组成部分的AI模型，能比现有模型更准确地分析和完成未完成的图像。

除此之外，Meta还发布了语音生成AI模型“Voicebox”，支持从文本中生成语音，能够根据仅两秒长的样本匹配音频风格，并将文本样本转换为另一种语言，在给定单独的语音样本的情况下，并能够以说话者的原始语音朗读翻译后的文本内容，目前支持六种语言：英语、法语、德语、西班牙语、波兰语和葡萄牙语。

而早在今年4月，Adobe便将其Adobe Firefly功能（类ChatGPT产品）集成在Premiere Pro、After Effects、Audition、Remix等音视频产品矩阵中，为用户提供一键生成内容、剪辑、调色、更换音乐等功能。

从“语言大模型”到“视觉大模型”

《中国人工智能大模型地图研究报告》显示，从全球已发布的大模型数量及分布来看，中国和美国大幅领先，超过全球总数的80%。同时，欧洲、俄罗斯、以色列等越来越多的研发团队也在投入大模型研发。但值得注意的是，我国在计算机视觉等领域的大模型还较少。

究其原因，北京智源研究院访问首席科学家颜水成向《华夏时报》记者表示：“现在视觉模型发展稍微滞后的主要原因，是因为视觉大模型吃算力吃得比文本要大很多，所以我们也期待芯片更快速的发展，甚至有可能把非GPU其他的芯片融合在一起来做。现在大家见到的模型一般千卡级比较常见，但可能明年就有人会用万卡级来做。”

而在北京智源人工智能研究院院长黄铁军看来，视觉领域是大模型领域下一个浪潮的重点。他指出，视觉大模型和语言大模型背后的思想方法和基本路线是异曲同工的，只是输入的数据变成了图像和视频，训练出来的模型则具有一定的通用视觉语言能力，一种是之前提到的AIGC（人工智能自动生成内容），可以生成图像和艺术品，“还有一种更基本的能力，就是看到世界之后，得首先能把这个世界（万物）分清。”

对于视觉大模型的发展，不少机构也表达出看好的态度。中金研究发布的研报认为，计算机视觉未来有望实现更高程度的自动化、高精度和低功耗，进一步丰富元宇宙的内容生态，降低进入门槛。计算机视觉的进步引领了三维重建和动捕技术快速成熟，并逐渐在各自的领域积累技术进步。计算机视觉未来有望迎来更高程度的自动化、更高的精度，以及更低的功耗，逐渐在移动端实现更好的视觉效果，被应用在大量下游行业，逐渐迈向连接物理世界和数字世界的长期愿景。

中信证券研究也表示，在设计领域，大模型引领数字设计走向智能设计，相关工业设计软件结合GPT等技术，可应用在设计规划、布局优化、插件助手、草图绘制等场景，工业设计软件有望在AI升级的大趋势下迎来新一轮生产力革命。

（文章来源：华夏时报）

标签：

精彩推荐

资讯News

聚焦Policy

图集Picture

广东人，世界上划水最拼的人

“中国天眼”发现迄今轨道周期最短脉冲星双星系统

“3小时高铁圈”，“圈”出几多精彩？天天精选

野外求生类电影 9部震撼野外求生电影推荐

预售13万起星途TX超能四驱版今晚上市_消息

自己建站（怎么自己建站）

委托代理理论是以什么为基础的（委托代理理论）|讯息

中国建筑（601668）6月21日主力资金净卖出577.50万元-环球最新

鸿远电子：6月21日融资买入7660.88万元，融资融券余额2.17亿元

全球简讯:哪些蔬菜不能用金都尔（金都尔除草剂使用禁忌）

上海谊众（688091）：6月21日北向资金增持6.09万股_焦点短讯

中蜂蜂箱批发50到60元价格最低的_中蜂蜂箱批发世界快消息

graduated怎么读_graduate 当前短讯

windows（media player10）

周刚山东科技大学_周刚

全球微速讯：洋务运动的教训是什么_洋务运动的历史教训介绍

地面沉降原因_地面下沉的原因是什么通讯

A股再现减持神操作！实控人前妻拟套现逾22亿，一半回借给公司|世界快讯

查扣9.17吨废机油，警方跨省捣毁“黑窝点”

东西问｜段崇智：为何融会中国与西方是大学的使命？|当前观察

当好农民工的“护薪人”

“通讯录里所有人都知道我欠钱了”——网贷乱象调查

大连宝马车撞人案肇事司机被判死刑

医院财务迷上网络赌博输光5000万元公款

辊环车削雕琢毫厘

北京交警严查超标电动自行车挪用“白牌”

寒潮来袭北方气温普降10℃以上

北京多种蔬菜价格降幅达五成

北京周日最低气温或达-4℃

北京朝阳两涉疫校区及16所学校停课