检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
说明: SIS:使用的语音识别服务为SIS时选此类型 vocabulary_id String 热词ID(sis中配置)。 sis_project_id String SIS服务所在区域projectId region Integer 对接SIS服务的区域。
取值范围: 1-10 默认取值: 1 is_ifly_production Boolean 是否为正式环境 默认取值: false tail_silence_time Integer 语音识别后端点静音时长默认500ms 取值范围: 0-3000 role_id String 奇妙问角色
在线生成SDK代码 API Explorer能根据需要动态生成SDK代码功能,降低您使用SDK的难度,推荐使用。 您可以在API Explorer中,具体API页面的“代码示例”页签查看对应编程语言类型的SDK代码,如图1 获取SDK代码示例所示。
如果配置,则段落切换回调中会携带该信息。 美团对应liveId 状态码: 400 表16 响应Body参数 参数 参数类型 描述 error_code String 错误码。 error_msg String 错误描述。
如果配置,则段落切换回调中会携带该信息。 美团对应liveId 状态码: 400 表16 响应Body参数 参数 参数类型 描述 error_code String 错误码。 error_msg String 错误描述。
如果配置,则段落切换回调中会携带该信息。 美团对应liveId 状态码: 400 表14 响应Body参数 参数 参数类型 描述 error_code String 错误码。 error_msg String 错误描述。
String 交互对接类型 LIVE:直播交互 CHAT:智能交互 language 否 String 智能交互语言 zh_CN:简体中文(已下线,请使用CN) en_US:英语(已下线,请使用EN) CN:中文 EN:英文 tail_silence_time 否 Integer 语音识别后端点静音时长默认
表8 ShootScript 参数 是否必选 参数类型 描述 script_type 否 String 参数解释: 脚本类型,即视频制作的驱动方式 约束限制: 不涉及 取值范围 TEXT: 文本驱动,即通过TTS合成语音 AUDIO: 语音驱动 默认取值: TEXT text_config
String 交互对接类型 LIVE:直播交互 CHAT:智能交互 language 否 String 智能交互语言 zh_CN:简体中文(已下线,请使用CN) en_US:英语(已下线,请使用EN) CN:中文 EN:英文 tail_silence_time 否 Integer 语音识别后端点静音时长默认
注意事项 开启AM子账户隔离能力后,各IAM子账户历史上传或制作的资产归属均已自动变更为华为云账号。 视频制作剧本、直播间、智能交互对话项目,暂不支持修改资产归属。 企业联邦虚拟用户,不支持修改资产归属。 操作步骤 登录MetaStudio控制台。
审核通过后,任务状态变更为“算法训练中”,如图1所示。 单击右上角的“编辑”,可以为数字人添加标签。标签添加完成后,单击“保存”,保存修改。 图1 数字人定制任务 数字人模型会在3个工作日内训练完成。训练完成后的任务状态更新为“算法训练完成”,如图2所示。
声音更新记录 2025年1月 表1 声音更新记录 发音人名称 性别 TTS版本 风格 语言 变更方式 云海 男 TTS V7 营销 中文 新增 云佳 女 TTS V7 客服 中文 新增 云辉 男 TTS V7 直播 中文 新增 云英 女 TTS V9 直播 中文 新增 云薇 女 TTS
ECOMMERCE: 电商 NEWS: 新闻 MARKETING: 营销 sex 是 String 语音性别,是男性声音还是女性声音,为Flexus版声音的配置。
AIUI通用语义模型应用,不支持直接切换为星火交互认知大模型。因为已配置内容不适用,建议参考在科大讯飞平台创建应用(星火交互认知大模型)单独为其创建应用。 详细操作如下所示,具体的操作步骤请参见科大讯飞的文档中心。 创建应用:在科大讯飞的AIUI开放平台创建应用。
星火交互认知大模型应用,不支持直接切换为AIUI通用语义模型。因为已配置内容不适用,建议参考在科大讯飞平台创建应用(AIUI通用语义模型)单独为其创建应用。 详细操作如下所示,具体的操作步骤请参见科大讯飞的文档中心。 创建应用:在科大讯飞的AIUI开放平台创建应用。
如何实时切换智能交互的语言和声音? 父主题: 附录
如何实时切换智能交互的语言和声音?
收音 我们会使用视频中的语音和您口型变化的对应关系来训练口型驱动效果,训练结果还会经过专家的技术审核。 因此在收音这方面,我们建议: 保证视频音画同步。 确保环境安静无噪声,模特人声清晰,无其他人声干扰,尽量减少视频的底噪。
背景替换 分身数字人是否支持更换背景。 包含如下选项,请根据实际情况选择: 抠除拍摄背景:制作分身数字人视频时,可以更换背景。 保留拍摄背景:分身数字人使用拍摄时的原背景,不支持更换背景。 身份认证及授权数据上传 联系方式 请输入有效的11位手机号码。
图4 定制任务详情 审核通过后,任务状态变更为“算法训练中”,如图所示。 数字人定制任务审核通过后,启动算法训练,会在3个工作日内训练完成并生成数字人。 图5 数字人定制任务 等待数字人模型训练完成后,任务状态变更为“算法训练完成”,如图6所示。