检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
0-1920 表7 VoiceConfig 参数 参数类型 描述 voice_asset_id String 参数解释: 音色资产ID,可以从资产库中查询。 约束限制: 不涉及。 取值范围: 字符长度1-256位。 默认取值: 不涉及。 speed Integer 参数解释: 语速。50表示0
剧本封面下载url。 表5 VoiceConfig 参数 参数类型 描述 voice_asset_id String 参数解释: 音色资产ID,可以从资产库中查询。 约束限制: 不涉及。 取值范围: 字符长度1-256位。 默认取值: 不涉及。 speed Integer 参数解释: 语速。50表示0
asset_id: 资产ID job_id: 任务 auth_type 否 String 认证类型。 NONE。URL中自带认证。 MSS_A。HMACSHA256签名模式,在URL中追加参数:secret,time_stamp。取值方式:secret=hmac_sha256(key, URI(callback_url)+
VoiceConfig 参数 是否必选 参数类型 描述 voice_asset_id 是 String 参数解释: 音色资产ID,可以从资产库中查询。 约束限制: 不涉及。 取值范围: 字符长度1-256位。 默认取值: 不涉及。 speed 否 Integer 参数解释: 语速。50表示0
VoiceConfig 参数 是否必选 参数类型 描述 voice_asset_id 是 String 参数解释: 音色资产ID,可以从资产库中查询。 约束限制: 不涉及。 取值范围: 字符长度1-256位。 默认取值: 不涉及。 speed 否 Integer 参数解释: 语速。50表示0
PREPROCESSING:直播任务准备中。 PLAY_READY:直播任务准备完成,数字人保持静默状态,等待剧本播放指令。 PROCESSING:直播任务运行中。 PLAY_PAUSE:数字人暂停说话,保持静默状态。 TAKE_OVER:真人接管中。 PLAY_END:直播任务结束。
谷歌浏览器 打开Chrome浏览器,单击浏览器右上方的图标,从下拉框中选择“设置”。 进入“设置”页面。 在左侧导航栏中,选择“隐私设置和安全性”。 在右侧界面中,单击“网络设置”,进入“网络设置”页面。 在“权限”区域,单击“麦克风”,进入麦克风授权页面。 选择“网站可以请求使
提前准备中文或英文台本,并建议使用提词器,以确保阅读流畅。阅读中如果出现错误,不影响最终效果,无需停止录制。条件允许情况下,建议使用录制者自己熟悉的台本。 视频提交 - 训练视频需保留原声,且音画必须同步。 视频请勿剪辑,并确保视频中的讲述、静默状态、手势,会一并导出至一个视频中。 父主题: 拍摄真人视频
声音制作任务算法训练完成后,可以查看声音。 操作步骤 登录MetaStudio控制台。 在左侧导航栏中,单击“任务中心”。 选择“声音制作”,确认声音制作任务已训练完成。 在左侧导航栏中,单击“我的创作”。 选择“声音”,找到已生成的声音,单击声音卡片中的头像,即可试听声音效果。 用户还可以执行如下操作:
知识库 单击“添加”,在弹出的“选择知识库”对话框中,勾选对应的知识库。 这里的知识库均为“普通文件”类型,其来源请参考新增知识库-上传普通文件。 回答仅限于文档 是否开启回答仅限于文档。 如果开启此设置, 数字人仅回答知识库中内容。如果超出知识库范围,数字人使用兜底话术答复。 回答来源
科大讯飞免费赠送500次/天的问答交互次数,如需提升问答交互次数,请参考本节操作,订购套餐包。 操作步骤 在界面上方的主菜单中,单击“我的应用”。 单击应用所在行的图标,进入当前应用的“应用配置”页面。 在左侧导航栏中,单击“服务统计”,进入“服务统计”页面,如图1所示。 通过下图可以看出,科大讯飞免费赠送500次/天的问答交互。
命令成功完成。 参考表1,下载SDK安装包完整性校验文件至本地。 使用文本编辑器打开完整性校验文件,查看文件中的SHA256值和2中生成的SHA256值是否一致。 如果一致,说明SDK安装包下载过程中,不存在篡改和丢包现象。 父主题: SDK下载
视频制作、视频直播功能,都需要进行视频创作,下面以视频直播为例,进行说明。 视频素材:如图中1区域所示,包括模板、角色、背景、贴图、视频、商品、文本等素材。支持使用预置的,也支持自定义生成。 画面布局:简称“画布”,如图中2区域所示。可以在画布中插入人物形象、背景、贴图、文本框、视频等内容,支持调整各项直播
> 已激活”页面。 选择“未激活”页签,单击已接收资产卡片中的“激活”,在弹出的“提示”对话框中,单击“确认”。 界面提示“资产已激活”,说明资产已激活成功。用户可以在“已激活”页签中查看已激活的分身模型资产。 图4 激活资产 完成上述操作后,声音和分身模型资产已经在当前账号下生
> 已激活”页面。 选择“未激活”页签,单击已接收资产卡片中的“激活”,在弹出的“提示”对话框中,单击“确认”。 界面提示“资产已激活”,说明资产已激活成功。用户可以在“已激活”页签中查看已激活的分身模型资产。 图4 激活资产 完成上述操作后,声音和分身模型资产已经在当前账号下生
> 已激活”页面。 选择“未激活”页签,单击已接收资产卡片中的“激活”,在弹出的“提示”对话框中,单击“确认”。 界面提示“资产已激活”,说明资产已激活成功。用户可以在“已激活”页签中查看已激活的分身模型资产。 图4 激活资产 完成上述操作后,声音和分身模型资产已经在当前账号下生
OBS视频采集工具的基础分辨率和输出分辨率的值需要保持一致。 检查方法如下所示: 本地打开OBS视频采集工具。 在界面上方的导航栏中,选择“文件 > 设置”,弹出“设置”对话框。 在左侧导航栏中,选择“视频”,检查基础分辨率和输出分辨率的取值是否一致。 如果不一致,需要修改为相同的取值。 图1 视频设置
VoiceConfig 参数 是否必选 参数类型 描述 voice_asset_id 是 String 参数解释: 音色资产ID,可以从资产库中查询。 约束限制: 不涉及。 取值范围: 字符长度1-256位。 默认取值: 不涉及。 speed 否 Integer 参数解释: 语速。50表示0
OBS视频采集工具的基础分辨率和输出分辨率的值需要保持一致。 检查方法如下所示: 本地打开OBS视频采集工具。 在界面上方的导航栏中,选择“文件 > 设置”,弹出“设置”对话框。 在左侧导航栏中,选择“视频”,检查基础分辨率和输出分辨率的取值是否一致。 如果不一致,需要修改为相同的取值。 图1 视频设置
将鼠标放在需要停顿的文字右侧,单击“插入停顿”。在弹出的提示框中,选择“换气”或者停顿的时间,也支持自定义停顿时长。 连读 选中需要连读的文本内容,单击“连读”。 多音字 选中文本中的多音字,单击“多音字”,在弹出的提示框中,选择正确的发音或者自定义发音。 须知: 这里设置的多音字,