检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
查询知识库技能列表 功能介绍 该接口用于查询知识库技能列表。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/digital-human-chat/knowledge/skill 表1 路径参数 参数 是否必选 参数类型 描述 project_id
查询语音训练任务详情 功能介绍 查询语音训练任务详情 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/voice-training-manage/user/jobs/{job_id} 表1 路径参数 参数 是否必选 参数类型 描述 project_id
查询知识库意图列表 功能介绍 该接口用于查询知识库意图列表。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/digital-human-chat/knowledge/intent 表1 路径参数 参数 是否必选 参数类型 描述 project_id
参数 是否必选 参数类型 描述 text 是 String 参数解释: 台词脚本。支持两种模式,纯文本模式和标签模式。 纯文本模式:使用方法,如“大家好,我是人工智大家,是个虚拟主播”。 标签模式:SSML标签的详细定义请参考文本驱动SSML定义。 约束限制: 不含SSML标签字符数最长10000个字符。
查询语音训练任务列表 功能介绍 查询语音训练任务列表 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/voice-training-manage/user/jobs 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String
voice_config VoiceConfig object 语音配置参数。 streamer_action String 参数解释: 助播出声时主播行为设置。 约束限制: 不涉及 取值范围: SILENCE:静默 VOLUME_DOWN:音量降低 默认取值: 不涉及。 表13 VoiceConfig
voice_config VoiceConfig object 语音配置参数。 streamer_action String 参数解释: 助播出声时主播行为设置。 约束限制: 不涉及 取值范围: SILENCE:静默 VOLUME_DOWN:音量降低 默认取值: 不涉及。 表13 VoiceConfig
voice_config VoiceConfig object 语音配置参数。 streamer_action String 参数解释: 助播出声时主播行为设置。 约束限制: 不涉及 取值范围: SILENCE:静默 VOLUME_DOWN:音量降低 默认取值: 不涉及。 表11 VoiceConfig
(忽略大小写)为wav,mp3,m4a,主文件大小不超过100M 幻灯片资产:资产类型为PPT,主文件格式(忽略大小写)为ppt、pptx和pdf,主文件大小不超过100M 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/digital-assets
获取语音驱动数据 功能介绍 该接口用于获取生成的数字人驱动数据,包括语音、表情、动作等。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/ttsa-jobs/{job_id} 表1 路径参数 参数 是否必选 参数类型 描述 project_id
参数 是否必选 参数类型 描述 text 是 String 参数解释: 台词脚本。支持两种模式,纯文本模式和标签模式。 纯文本模式:使用方法,如“大家好,我是人工智大家,是个虚拟主播”。 标签模式:SSML标签的详细定义请参考文本驱动SSML定义。 约束限制: 不含SSML标签字符数最长10000个字符。
参数 是否必选 参数类型 描述 text 是 String 参数解释: 台词脚本。支持两种模式,纯文本模式和标签模式。 纯文本模式:使用方法,如“大家好,我是人工智大家,是个虚拟主播”。 标签模式:SSML标签的详细定义请参考文本驱动SSML定义。 约束限制: 不含SSML标签字符数最长10000个字符。
选择“抠除拍摄背景”,制作分身数字人视频时,可以替换背景。 身份认证及授权数据上传 联系方式 请输入有效的11位手机号码。 身份证照片 需要分别上传身份证人像面和国徽面的照片。 单击“点击上传人像面”,从本地选择身份证人像面照片上传。 单击“点击上传国徽面”,从本地选择身份证国徽面照片上传。 形象授权
分身数字人训练任务标签。 model_version String 分身数字人模型版本。默认是V3.2版本模型。 V3.2:V3.2版本模型 说明: V3和V2版本已废弃不用 取值范围: 0-64 默认取值: V3.2 matting_type String 抠图类型。默认是AI。 AI:AI抠图
<speak></speak>:SSML文本的根节点。 语法 1 <speak>这里输入SSML标签的文本</speak> 属性 无 标签关系 <speak>可以包含文本和标签,包括<break>、<phoneme>、<say-as>、<sub>标签。 break标签 描述 <break/>:在任意位置插入静音停顿。
高品质:整段录制生成一个WAV或MP3格式音频,总时长1小时以上,建议1小时。 原声录制音频和其对应生成的音色播报示例,如客户声音制作案例所示。 录音准备 表1 录音准备 声音类型 录制设备和软件 录音环境 录音文案 基础版 优先使用专业录音设备录制音频,推荐使用Adobe Audition软件进行录音。
Flexus分身数字人制作任务会同时生成一个Flexus形象和一个Flexus声音,所以也需要提供音频。 单独上传语料包:单独录制音频文件,需要单击下方的“点击上传音频文件”,上传音频。 音频格式支持WAV、MP3,单段音频时长1~5分钟,建议1分钟。语料中的语言仅支持中文和英文。 视频中提取声音:直接提取
随着版权保护意识的加强,用户已经愿意以付费方式来收看影视内容, 可商家在收费之余却忽视了消费者的观看体验。 旅美大熊猫丫丫因恶劣的健康状况,引发了网友的大量关注和担忧。 多方纷纷站出来为丫丫发声,盼望它早日归来。 八月二十四日中午十二时,日本福岛第一核电站启动核污染水排海。 海洋是全人类赖以生存的蓝色家园,
务适配的功能。 产品介绍 什么是数字内容生产线 功能特性 产品优势 使用限制 计费说明 03 API 数字内容生产线服务提供了丰富的API和调用示例,您可以通过API实现分身数字人资产管理、视频制作、视频直播、智能交互等功能。 API文档 API概览 API接口 04 SDK 数
分身数字人训练任务标签。 model_version String 分身数字人模型版本。默认是V3.2版本模型。 V3.2:V3.2版本模型 说明: V3和V2版本已废弃不用 取值范围: 0-64 默认取值: V3.2 matting_type String 抠图类型。默认是AI。 AI:AI抠图