随着全球AI领域的竞争加剧,越来越多的科技巨头和创新企业纷纷致力于多模态AI的开发。2024年10月14日至18日,GITEX GLOBAL海湾信息技术博览会在迪拜举行,吸引了超过6700家全球科技巨头和创新公司参与,展示了智能互联、人工智能等领域的新成果。 此次展会中,Soul App创始人张璐团队携自主研发的多模态AI交互模型首次亮相。该模型具备3D虚拟人生成、多模态理解、多语种和语音通话等多项创新功能,进一步深化了拓展社交互动场景的可能性。 Soul团队此次展示的多模态AI交互方案,是在3D虚拟人技术和多模态理解方面的全新尝试。通过该方案,用户可以快速生成一个与自身相似的虚拟化身,与人进行自然、流畅的互动沟通。这种创新的交互模式不仅增强了虚拟形象的个性化,还能够在不依赖于真实外貌的前提下,为用户带来舒适、轻松的社交体验。 大会现场,借助展会设备,参与体验的用户十秒内便可完成3D虚拟人建模。在互动过程中,系统能精准捕捉并还原用户的面部特征与动作,让参与者可以体验到更加生动、自然的交流方式。 其实自创立以来,Soul一直致力于通过技术提升社交平台的多样性和体验感。为了能让用户自在地分享兴趣爱好、表达自我,Soul不支持用户上传真实照片,而是鼓励用户通过“捏脸”功能,创建个性化虚拟形象。 2022年,Soul推出了自研引擎,进一步增强了虚拟形象的表现力。该引擎基于AI、渲染与图像处理等核心技术,可以帮助用户创建出富有个性的3D虚拟社交形象。在此次GITEX GLOBAL上亮相的多模态AI交互方案正是对该引擎能力的进一步延伸,为线上社交体验注入更多真实感。 Soul的多模态AI模型具备端到端处理能力,能够理解文字、语音、图像等多模态信息,从而实现接近人类的交流体验。这种高度拟人化的AI交互方案源于Soul在人工智能领域的长期技术积累。 自2020年启动AI技术研发计划以来,Soul团队已陆续推出了自研的语言大模型Soul X、语音生成大模型、语音识别大模型等一系列技术成果。今年,Soul还进一步推出了全双工语音通话大模型,实现了超低交互延迟、快速自动打断以及高度真实的声音表达与情绪感知理解,为用户提供了“类真人”的陪伴体验。 在多模态AI技术的支持下,Soul已实现了“数字分身”功能。用户授权后,平台可以基于其聊天记录、内容偏好等,定制虚拟人的形象与特征,从而在视觉、语言风格、身份特征和情感表达等方面达到高度还原。数字分身不仅能为用户提供智能回复推荐,还能通过模拟人类的情绪和反应,帮助用户在社交破冰、关系建立等环节提升沟通效率,使虚拟人真正成为数字世界中的“社交助手”。 此次亮相GITEX GLOBAL,Soul App创始人张璐团队不仅展示了Soul在3D虚拟人、语音通话、情绪理解等多模态AI技术方面的成果,也为海外嘉宾呈现了中国企业在社交科技领域的创新探索。 |
来自:
互联网
文中内容和观点 : 不代表本网站立场 ; 合作及投稿请联系 : ceoim@vip.qq.com