AI驱动！武汉人工智能研究院“照片说话”应用上线，快来体验

admin 科技生活 2024-08-22 10 0

近日，武汉人工智能研究院（以下简称武智院）与北京首都在线科技股份有限公司（以下简称首都在线）正式达成战略合作，共同上线 “照片说话”应用。用户可以通过简短的文本描述或录音文件，让照片开口说话。

该应用依托武智院“紫东太初”2.0全模态大模型技术，结合首都在线高性能异构智算平台的全栈智能算力服务能力，让用户体验到个性化AI创作的魅力。

创作时，用户仅需要上传自己的真实人物照片，即可一键实现训练、微调、部署自己的文生图模型，从而感受AIGC“个性化动态照片”的创作魔力。

如今，人工智能、大数据、云计算等领域在技术上的飞速发展，促使着AGI产业正在成为国家数字经济发展中新的增长点。

武智院和首都在线的紧密合作将极大地推动人工智能技术的发展和应用，加速人工智能产业的布局和成长。未来，双方也将持续加大在大模型、人工智能等前沿科技领域的技术创新，为AGI产业持续赋能创新。

目前，“照片说话”应用已正式上线，欢迎大家前来体验。体验入口：-cds.wair.ac.cn/ （点击文后【阅读原文】）

具体步骤

第一步

输入视频名称

为本视频命名

第二步

上传真人照片

可在右侧“选择头像”栏选择默认照片，也可上传任意超写实人物照片。

第三步

输入播报内容

输入需要播报的内容，支持“文字输入”和“上传录音”两种方式，上传的录音文件可以调整音频音量。

可以通过语速、停顿、多音字配置等内容控制播报内容，鼠标滑动到相关功能按钮上即可提示。

可以选择不同的音色来播报这段话。

方式一：文字输入

方式二：上传录音文件

第四步

合成

点击合成后，会弹窗进行预估费用计算，计算完毕后则可进行确认合成。

第五步

查看合成进度

您可在右上角用户头像处点击“我的合成记录”中查看，支持预览、下载和删除。

采写摄影 | 康鹏张璨龙

编辑 | 钱果

编审 | 龙大虎

审核 | 肖辉

出品 | 光谷融媒体中心

©中国光谷投稿邮箱：[email protected]