跳转至

🔥AI副业赚钱星球

点击下面图片查看

郭震AI

商汤科技推出了国内首例视觉与交互体验比肩GPT-4的创新模型——“日日新5o”。这款模型实现了所见即所得的功能,开创了全新的交互模式。

编辑日期:2024年07月05日

image

"日日新5o"通过融合多元化的跨模态数据,涵盖了声音、文字、图片及视频等丰富形式,开创了一种创新的AI交互方式——即时的多模态流式交互,从而开启全新体验。

"日日新50"具备听力、视觉及卓越的话题引导能力,仿佛与真实的人类交谈无异。这种交互体验特别适应于实时对话和语音识别等场景,它能在单一模型内流畅地执行多重任务,并根据不同的语境自动调整反应和输出内容。

"日日新5.5是开创性的国内首款正式推出的流式原生多模态交互模型。该模型依托于超10TB的优质训练数据,包括大量精心合成的信息,以塑造高级认知链条。模型运用了混合端云协作架构,具备6000亿个参数,能充分发挥云端与边缘端的协同效率,实现每秒109.5字的高速推理能力。"

在先前的新闻中,商汤科技于世界人工智能大会推出了创新的Vimi模型,这是一款首屈一指的“可控制”人物视频生成工具。它能依据任何风格的单张照片,创造出与预设动作同步的人物视频,并具备多重驱动模式。用户可以利用现有的人物视频、动画、语音或文字等多种素材来操纵这一模型,实现丰富的创意表达。

以上全文,欢迎继续阅读学习

大家在看

京ICP备20031037号-1 | AI之家 | AI资讯 | Python200 | 数据分析