随着AI大模型研发应用热潮持续高涨,记者注意到,赛道内的玩家开始将重心从语言大模型转向视觉大模型。近期,Adobe、Meta、360、美图等多家国内外互联网头部企业纷纷发表大模型成果,为本就火热异常的AI市场再添了一把火。
【资料图】
“人工智能在视频领域的应用越来越受到重视。”中国通信工业协会两化融合委员会副会长吴高斌向《华夏时报》记者表示,这些大型AI模型的发布为企业间的竞争带来了新的动力。企业之间的竞争将促进技术创新和进步,同时也将带来更好的产品和服务。竞争还将促进企业间的合作和共享资源,从而更好地满足市场需求。
海内外视觉大模型“神仙打架”
在鳞次栉比的语言大模型、多模态大模型纷纷涌现之后,“视觉大模型”成为又一个兵家必争之地。日前,美图发布AI视觉大模型MiracleVision,一同发布的还有AI视觉创作工具WHEE、AI数字人生成工具DreamAvatar、美图AI助手RoboNeo等7款产品。
据介绍,MiracleVision具有强大的视觉表现力和创作力,能从绘画、设计、影视、摄影、游戏、3D、动漫等视觉创作场景反推技术演化。与市面上其他大模型不同,它尤其擅长亚洲人像摄影、国风国潮、商业设计等生成方向。
美图公司创始人、董事长兼首席执行官吴欣鸿在接受《华夏时报》记者采访时表示:“美图大模型的核心优势是‘懂美学’,C端用户基础足够大,大模型冷启动的获客成本低,美图目前有2.43亿的月活用户,全球VIP会员数为719万,能在短时间去验证产品成功与否。不同于其他厂商,美图大模型聚焦于美学(画面画质设计等),未来如果非要竞争,会在美学上面去‘卷’。”
无独有偶,360也日前正式发布“360智脑-视觉大模型”。 360创始人周鸿祎表示,大语言模型是构建视觉大模型的基础,多模态能力增强的核心是借助了大语言模型的认知、推理、决策能力。同时,视觉大模型也是“360智脑”的重要能力组成,能够看懂图片,未来还能看懂视频、听懂声音。
海外企业也已经开始在视觉大模型上布局。日前,社交媒体巨头Meta宣布,将向研究人员开放一个名为I-JEPA的“类人”人工智能模型的部分组件,该模型可以比现有模型更准确地分析和完成未完成的图像,而不是像其他生成式人工智能模型那样,只根据附近的像素进行推断。
Meta公司首席人工智能科学家杨立昆曾公开指出,当前的GPT自回归模型存在缺乏规划、推理的能力,未来GPT系统或将被抛弃,并给出了他认为的正确答案——世界模型。据称I-JEPA是第一个基于其愿景关键组成部分的AI模型,能比现有模型更准确地分析和完成未完成的图像。
除此之外,Meta还发布了语音生成AI模型“Voicebox”,支持从文本中生成语音,能够根据仅两秒长的样本匹配音频风格,并将文本样本转换为另一种语言,在给定单独的语音样本的情况下,并能够以说话者的原始语音朗读翻译后的文本内容,目前支持六种语言:英语、法语、德语、西班牙语、波兰语和葡萄牙语。
而早在今年4月,Adobe便将其Adobe Firefly功能(类ChatGPT产品)集成在Premiere Pro、After Effects、Audition、Remix等音视频产品矩阵中,为用户提供一键生成内容、剪辑、调色、更换音乐等功能。
从“语言大模型”到“视觉大模型”
《中国人工智能大模型地图研究报告》显示,从全球已发布的大模型数量及分布来看,中国和美国大幅领先,超过全球总数的80%。同时,欧洲、俄罗斯、以色列等越来越多的研发团队也在投入大模型研发。但值得注意的是,我国在计算机视觉等领域的大模型还较少。
究其原因,北京智源研究院访问首席科学家颜水成向《华夏时报》记者表示:“现在视觉模型发展稍微滞后的主要原因,是因为视觉大模型吃算力吃得比文本要大很多,所以我们也期待芯片更快速的发展,甚至有可能把非GPU其他的芯片融合在一起来做。现在大家见到的模型一般千卡级比较常见,但可能明年就有人会用万卡级来做。”
而在北京智源人工智能研究院院长黄铁军看来,视觉领域是大模型领域下一个浪潮的重点。他指出,视觉大模型和语言大模型背后的思想方法和基本路线是异曲同工的,只是输入的数据变成了图像和视频,训练出来的模型则具有一定的通用视觉语言能力,一种是之前提到的AIGC(人工智能自动生成内容),可以生成图像和艺术品,“还有一种更基本的能力,就是看到世界之后,得首先能把这个世界(万物)分清。”
对于视觉大模型的发展,不少机构也表达出看好的态度。中金研究发布的研报认为,计算机视觉未来有望实现更高程度的自动化、高精度和低功耗,进一步丰富元宇宙的内容生态,降低进入门槛。计算机视觉的进步引领了三维重建和动捕技术快速成熟,并逐渐在各自的领域积累技术进步。计算机视觉未来有望迎来更高程度的自动化、更高的精度,以及更低的功耗,逐渐在移动端实现更好的视觉效果,被应用在大量下游行业,逐渐迈向连接物理世界和数字世界的长期愿景。
中信证券研究也表示,在设计领域,大模型引领数字设计走向智能设计,相关工业设计软件结合GPT等技术,可应用在设计规划、布局优化、插件助手、草图绘制等场景,工业设计软件有望在AI升级的大趋势下迎来新一轮生产力革命。
(文章来源:华夏时报)
标签:
精彩推荐
广东人,世界上划水最拼的人
科学家利用“中国天眼”FAST发现了一个轨道周期仅为53分钟的脉冲星双星
新华社上海6月21日电(记者陈爱平、许晓青)今年端午节假期,上海白领
hello大家好,我是城乡经济网小晟来为大家解答以上问题,野外求生类电
[本站资讯]本站从星途品牌获悉,星途TX超能四驱版将于6月5日晚上19:30-
己建站,怎么自己建站很多人还不知道,现在让我们一起来看看吧!1、第
1、委托代理理论的主要观点认为:委托代理关系是随着生产力大发展和规
截至2023年6月21日收盘,中国建筑(601668)报收于5 87元,上涨0 51%,换
6月21日,鸿远电子(603267)融资买入7660 88万元,融资偿还4800 97万
1、金都尔虽然除草效果很好,但并不是所有蔬菜上都可以使用它。因为金
6月21日北向资金增持6 09万股上海谊众。近5个交易日中,获北向资金增持
1、中蜂高窄式蜂箱的巢框上梁的长度为两百九十六毫米,而宽和厚则分别
1、graduate既可以作名词,也可以作动词,还可以作形容词。这里重点说
来为大家解答以上问题,windows,mediaplayer10很多人还不知道,现在让
1、2008年,22岁的周刚在成都成立了公司。2、周刚是四川成都人,成都阿
1、洋务运动没有触及腐败的社会制度,只是在建立制度的基础上引入了一
1、原因有二,一是地质,二是人为。2、地面沉降的地质原因。从地质因素
来源:华夏时报一则实际控制人前妻减持的消息,把风口上的昆仑万维(30
北京警方严厉打击环境生态领域犯罪,主动开展工作,前不久在一个神秘的
中大的使命是“结合传统与现代,融会中国与西方”,这个使命虽然是60年
资讯News
06-22
06-22
06-22
06-22
06-22
06-22
06-22
06-22
06-22
06-22
06-22
06-22
06-22
06-22
06-21
06-21
06-21
06-21
06-21
06-21
聚焦Policy
当好农民工的“护薪人” 近日,罗某等7名农民工在收到被拖欠的工资后,纷纷打电话向江西省南昌市...
“通讯录里所有人都知道我欠钱了” □ 本报记者 韩丹东 □ 本报见习记者 张守坤 ...
大连宝马车撞人案肇事司机被判死刑 本报讯 记者韩宇 10月29日,辽宁省大连市中级人民法院一审...
医院财务迷上网络赌博输光5000万元公款 □ 本报记者 马维博 □ 本报通讯员 汪宇堂 曹...
辊环车削 雕琢毫厘(工匠绝活) 【绝活看点】 23年来,雷虎始终扎根一线,改进钢材轧制工艺...
交警严查超标电动自行车挪用“白牌” 截至昨晚6时,处罚电动自行车违法行为共计6585笔;下一步将...
明起寒潮来袭 北方气温普降10℃以上 中央气象台预计,本周日北京平原地区最低气温降至-4℃左右...
多种蔬菜价格降幅达五成 包括菠菜、蒿子秆等 预计本月中旬蔬菜恢复供需平衡 本报讯(记者...
北京周日最低气温或达-4℃ 本报讯(记者 赵婷婷)北京青年报记者昨天从中央气象台获悉,新一股...
昌平一家四口确诊新冠肺炎 天通北苑第二社区升级为中风险地区 朝阳两涉疫校区及16所学校停课 ...