每经记者 朱成祥 每经编辑 张海妮 在通义千问宣布大模型降价后,百度也随即宣布旗下两款大模型免费。5月22日,科大讯飞(002230.SZ,股价43.87元,市值1015.76亿元)也宣布讯飞星火LiteAPI永久免费开放。 当下,数字人的互动能力正是依赖于大模型。大模型纷纷降价,对互动数字人是否是个机会呢? 5月21日,飞影数字人战略顾问小豪对《每日经济新闻》记者表示:“数字人和大模型是两个领域。大模型价格下跌,对我们正在做的新产品(互动数字人)是利好。我们结合大模型之后,数字人升级进化成数智人。” 讯飞智作产品经理姚仕豪认为:“大模型有利于虚拟人的发展,目前看成本不是关键因素,效果更重要。” 数字人崛起小豪首先向记者讲述了数字人的具体操作:“现在的数字人,是需要你给文案,再根据文案来生成数字人视频。接入大模型之后,这个数字人就可以实时互动。比如数字人直播,可以根据观众的提问来实时回答。大模型是‘大脑’,数字人是‘身体’,两者结合,成为新的数智人。” 那么,大模型降价之后,对数字人行业有何影响呢? 小豪说:“比如前面说到的互动数字人,大模型成本降低后,面向C端普通人的用户场景才能够被真正释放。如果大模型的价格很高,你跟一个数字人聊天1小时,光是大模型的费用就要很多,现在价格下降了90%后,普通人也能承担(得起)这个费用。” 头豹研究院行业分析师陈庆民也对记者表示:“大模型技术的发展将为数字人提供更好的交互性,尤其是结合自然语言处理和语音识别技术,数字人可以更自然地理解和回应人类语言,从而提升用户体验。” 不过,在姚仕豪看来,相比降价,数字人的效果更重要。根据讯飞智作公众号文章,虚拟人(数字人)本质是对人的数字化模拟,具备三大特征:外观、行为和思想。这些特性的实现依赖一系列先进技术的融合,如图像识别、3D建模、动作捕捉、自然语言处理、计算机视觉等。 即数字人不仅仅需要大模型技术。 4月30日,《每日经济新闻》记者来到淘气叮当总部。工作人员向记者展示了数字人动作捕捉的场景,以及数字人直播效果展示。如果不是工作人员提醒,记者已经很难分清真人直播与数字人直播的区别。 上述工作人员说:“你看到的这个场景叫做多模态建模。她(正在被建模的真人主播)现在说的话、行为动作都会被我们在后台打上标签,通过文字带动标签形成一系列动作,还原成你看到的现场。录制需要一个小时以上,因为得有足够多的动作和语言。如果5分钟、10分钟的素材来做建模,出来的效果并不符合品牌方的要求。” ![]() 数字人多模态建模场景 图片来源:每经记者 朱成祥 摄 |
22 分钟前
23 分钟前
23 分钟前
23 分钟前
24 分钟前