数字人定义
百科定义:https://baike.baidu.com/item/%E6%95%B0%E5%AD%97%E4%BA%BA/5364140
数字人(Digital Human / Meta Human),是运用数字技术创造出来的、与人类形象接近的数字化人物形象。
创建一个数字人主要需要三种能力:
1、 文生文能力,类似于Chat Gpt ,可以理解和人进行对话,理解语义。比如coze.cn提供了提示词、知识库、插件、工作流、存储等四个能力来配置bot。
2、 声音合成能力。实现音色复刻,可以根据输入音频样本,生成音色,结合各种文本生成音频。
3、 视频合成能力。基于音频和图片、文本和图片来生成视频能力。
目前国外有D-ID、Hengen等平台,国内的阿里云和火山云也提供了open api能力。
D-ID
地址https://studio.d-id.com/ 。did 根据图片+文本、图片+音频方式 来驱动生成视频,还可以复刻音色。
方式1 图片+文本+音色。并且可以通过ai自动补全文案
方式2 图片+ 音频生成
Hengen
介绍参考
© 版权声明
文章版权归作者所有,未经允许请勿转载。