数字人介绍

AI应用8个月前更新 bot444
137 0

数字人定义

百科定义:https://baike.baidu.com/item/%E6%95%B0%E5%AD%97%E4%BA%BA/5364140

数字人(Digital Human / Meta Human),是运用数字技术创造出来的、与人类形象接近的数字化人物形象。

 

创建一个数字人主要需要三种能力:

1、 文生文能力,类似于Chat Gpt ,可以理解和人进行对话,理解语义。比如coze.cn提供了提示词、知识库、插件、工作流、存储等四个能力来配置bot。

2、 声音合成能力。实现音色复刻,可以根据输入音频样本,生成音色,结合各种文本生成音频。

3、 视频合成能力。基于音频和图片、文本和图片来生成视频能力。

 

目前国外有D-ID、Hengen等平台,国内的阿里云和火山云也提供了open api能力。

 

D-ID

地址https://studio.d-id.com/ 。did 根据图片+文本、图片+音频方式 来驱动生成视频,还可以复刻音色。

方式1 图片+文本+音色。并且可以通过ai自动补全文案

数字人介绍

 

方式2 图片+ 音频生成

数字人介绍

Hengen

介绍参考

© 版权声明

相关文章