检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
asset_id String 当任务状态为成功时呈现,音色模型在资产库中的id。 job_failed_code String 当任务失败时呈现,失败错误码。 job_failed_reason String 当任务失败时呈现,失败原因。 create_time Long 任务创建时间。
参考真人声音录制,提前录制一个WAV或MP3格式的长音频文件,每句之间需要有2~3秒的停顿。语料推荐使用文案样例(基础版)。 声音授权签署文件。 操作步骤 登录MetaStudio控制台。 单击“声音制作”下方的“开始创建”,进入声音制作页面。 图1 定制声音 在“华为模型”页签,配置声音制作参数。 界面操作详情,如表1所示。
制作好数字人后,可以不购买路数进行直播吗? 数字人模型只能通过MetaStudio服务驱动,不与其他第三方服务兼容。数字人形象制作与视频直播是两个独立的功能,需各自计费。可通过包周期或按需计费方式购买路数。 视频直播间的场景布置好之后,可以通过捕捉网页画面或RTMP推流的方式向第
形象拍摄指导文档下载 如需查看拍摄形象采集视频的PDF文件,请单击形象拍摄指导下载文件。 父主题: 形象制作
声音录制指导文档下载 如需查看真人声音录制的的PDF文件,请单击声音制作录制指导下载文件。 父主题: 声音制作
RESIZE codec 是 String 参数解释: 视频编码格式及视频文件格式。 约束限制: 仅分身数字人视频制作支持VP8编码。 取值范围: H264:h264编码,输出mp4文件。 VP8:vp8编码,输出webm文件。 默认取值: 不涉及 bitrate 是 Integer 参数解释:
配置说明如下所示: 如果科大讯飞AIUI开放平台应用使用AIUI通用语义模型,则从下拉框中选择“科大讯飞AIUI通用语义模型”。 如果科大讯飞AIUI开放平台应用应用使用星火大模型,则从下拉框中选择“科大讯飞星火交互认知大模型”。 应用名称 与AIUI开放平台应用的“应用名称”保持一致。 APPID
asset_id String 当任务状态为成功时呈现,音色模型在资产库中的id。 job_failed_code String 当任务失败时呈现,失败错误码。 job_failed_reason String 当任务失败时呈现,失败原因。 create_time Long 任务创建时间。
分身形象制作管理 创建分身数字人模型训练任务 查询分身数字人模型训练任务列表 查询分身数字人模型训练任务详情 删除分身数字人模型训练任务 更新分身数字人模型训练任务 租户执行分身数字人模型训练任务命令
分身数字人驱动算法是指通过深度学习生成数字人驱动模型,模型生成后,输入音频来合成数字人视频的一种技术。 其基本情况包括: 输入数据:真人视频、音频。 算法原理:通过深度学习算法来学习真人视频,生成驱动该真人形象的数字人模型。通过该模型输入音频,合成数字人视频。 输出结果:数字人视频。
String 字幕文件下载链接。 subtitle_file_upload_url 否 String 字幕文件上传链接。 subtitle_file_state 否 String 字幕文件生成状态。 GENERATING:字幕文件生成中。 GENERATE_SUCCEED:字幕文件生成成功。
RESIZE codec String 参数解释: 视频编码格式及视频文件格式。 约束限制: 仅分身数字人视频制作支持VP8编码。 取值范围: H264:h264编码,输出mp4文件。 VP8:vp8编码,输出webm文件。 默认取值: 不涉及 bitrate Integer 参数解释:
String 字幕文件下载链接。 subtitle_file_upload_url 否 String 字幕文件上传链接。 subtitle_file_state 否 String 字幕文件生成状态。 GENERATING:字幕文件生成中。 GENERATE_SUCCEED:字幕文件生成成功。
RESIZE codec 是 String 参数解释: 视频编码格式及视频文件格式。 约束限制: 仅分身数字人视频制作支持VP8编码。 取值范围: H264:h264编码,输出mp4文件。 VP8:vp8编码,输出webm文件。 默认取值: 不涉及 bitrate 是 Integer 参数解释:
定制声音时,从平台下载的授权书中有明确说明,定制音色需授权给公司使用。 使用限制 制作好的声音模型不支持下载或导出至本地。 声音模型不是通用模型,不与第三方服务兼容。用户在MetaStudio制作的模型,仅支持在本服务内使用。 父主题: 使用限制
时必填,智能交互配置的大模型机器人ID。 获取方法请参考创建应用。 取值范围: 字符长度0-64位。 默认取值: 不涉及 play_type 否 String 回复播放类型。 APPEND:追加,放置在场景播放队列尾部 INSERT: 插入,在两个音频文件,或者文本句末添加。 PLAY_NOW
配置说明如下所示: 如果科大讯飞AIUI开放平台应用使用AIUI通用语义模型,则从下拉框中选择“科大讯飞AIUI通用语义模型”。 如果科大讯飞AIUI开放平台应用应用使用星火大模型,则从下拉框中选择“科大讯飞星火交互认知大模型”。 应用名称 与AIUI开放平台应用的“应用名称”保持一致。 APPID
定制分身形象时,从平台下载的授权书中有明确说明,定制分身形象需授权给公司使用。 使用限制 制作好的数字人模型不支持下载或导出至本地。 数字人模型不是通用模型,不与第三方服务兼容。用户在MetaStudio制作的模型,仅支持在本服务内使用。 数字人不支持换脸、换衣服。 如果形象训练视频包含动作编排,那
RESIZE codec 是 String 参数解释: 视频编码格式及视频文件格式。 约束限制: 仅分身数字人视频制作支持VP8编码。 取值范围: H264:h264编码,输出mp4文件。 VP8:vp8编码,输出webm文件。 默认取值: 不涉及 bitrate 是 Integer 参数解释:
RESIZE codec String 参数解释: 视频编码格式及视频文件格式。 约束限制: 仅分身数字人视频制作支持VP8编码。 取值范围: H264:h264编码,输出mp4文件。 VP8:vp8编码,输出webm文件。 默认取值: 不涉及 bitrate Integer 参数解释: