检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
环境要求 环境项 使用限制 开发工具 Microsoft Visual Studio Code、WebStorm或其他Web IDE开发工具。 语言 Javascript或Typescript。 编译环境 建议Node 17+。 编译工具 建议Webpack 5 + babel 7。 浏览器
上传音频。 音频格式支持WAV、MP3,单段音频时长1~5分钟,建议1分钟。语料中的语言仅支持中文和英文。 视频中提取声音:直接提取训练视频中的声音,训练生成Flexus声音。 视频中的语言仅支持中文和英文。 须知:“单独上传语料包”的方式生成Flexus声音的效果会更好。 数字人名称
用户阅读隐私政策。隐私政策需方便用户查看,例如用户在App主功能界面中通过4次以内的点击或滑动操作可访问。 描述语言需要清晰通俗,符合通用语言习惯,避免使用有歧义的语言。 隐私政策内容要包含产品及服务收集个人信息的目的、方式和范围,个人信息处理者的名称和联系方式等。 您的产品及服
HUAWEI_EI:EI TTS MOBVOI:出门问问TTS language String 语言类型。默认值CN。 CN:中文。 EN:英文。 默认取值: CN language_desc String 语言描述。 状态码:400 表11 响应Body参数 参数 参数类型 描述 error_code
声音制作:录制真人声音,建模生成声音模型。 形象制作:拍摄形象采集视频,建模生成数字人形象。 视频制作:使用系统预置或自定义生成的数字人形象、声音,制作音视频内容。 视频直播:使用系统预置或自定义的数字人形象、声音,制作音视频直播内容。 智能交互:对接第三方大脑,通过数字人交互的方式与用户进行问答。
声音更新记录 2025年1月 表1 声音更新记录 发音人名称 性别 TTS版本 风格 语言 变更方式 云海 男 TTS V7 营销 中文 新增 云佳 女 TTS V7 客服 中文 新增 云辉 男 TTS V7 直播 中文 新增 云英 女 TTS V9 直播 中文 新增 云薇 女 TTS
and CLOUD_SDK_SK in the local environment ak = os.environ["CLOUD_SDK_AK"] sk = os.environ["CLOUD_SDK_SK"] projectId = "{project_id}"
and CLOUD_SDK_SK in the local environment ak = os.environ["CLOUD_SDK_AK"] sk = os.environ["CLOUD_SDK_SK"] projectId = "{project_id}"
如何自定义域名方式访问智能交互页面? 智能交互业务媒体流如何应对防火墙限制? 智能交互界面报错“MSS.20010135”如何处理? 如何实时切换智能交互的语言和声音?
OR:表示多个条件满足其一即可。 RESERVED:兜底回复不会去判断其他命中条件。 默认取值: 不涉及。 priority 否 Integer 参数解释: 优先级,数值越低优先级越高;取值0-999,默认值为500,为可选值 约束限制: 不涉及 取值范围: 0-999 默认取值: 500 tags 否 Array
and CLOUD_SDK_SK in the local environment ak = os.environ["CLOUD_SDK_AK"] sk = os.environ["CLOUD_SDK_SK"] projectId = "{project_id}"
购买声音套餐 第三方声音支持的语言类型 购买出门问问声音套餐 父主题: 声音制作
47010130 第三方语言模型配置为空 第三方语言模型配置为空 请携带正确的第三方语言模型配置 400 MSS.47010131 第三方语言模型地址为空 第三方语言模型地址为空 请携带正确的第三方语言模型地址字段 400 MSS.47010134 第三方语言模型地址非法 第三方语言模型地址非法
前提条件 场景说明 创建智能交互数字人(华为云CBS) 创建智能交互数字人(科大讯飞) 创建智能交互数字人(奇妙问) 创建智能交互数字人(第三方语言模型) 创建智能交互数字人(二次开发场景) 智能交互公共配置
频制作”,详见计费说明。 系统声音和Flexus声音免费使用。第三方声音的计费方式,详见购买出门问问套餐包。 标准版视频制作:必须使用标准版形象,声音不支持使用Flexus声音。 按视频制作时长计费,计费项为“分身数字人视频制作”,详见计费说明。 系统声音免费使用。第三方声音的计费方式,详见购买出门问问套餐包。
修订记录 发布日期 修订记录 2024-07-09 新增PHP和Node.js语言SDK。 2023-06-30 第一次正式发布。
云端对音频进行VAD检测,发现一句话末尾的静音时长超过500ms,会结束语音识别。建议该值大于500ms。 委托语言交互服务(SIS) 如需使用热词功能,请开启委托授权。SIS服务用于将用户口述音频转换为文本。 热词 仅开启“委托语言交互服务(SIS)”后,才会展示“热词”配置。 数字人与用户进行智能交互对话时,
直播时长即将到达“直播最长时长” 如果直播时长即将到达“直播最长时长”,系统会提前发送预警通知。用户需要在直播时长到达前,修改“直播最大时长”,避免直播中断。“直播最长时长”配置,详见直播配置。 租户资源不足 如果直播资源即将耗尽,系统会提前发送预警通知。用户需要在资源耗尽前,开通按需或者购买包周期资源,避免直播中断。
如何调用MetaStudio接口? 数字人相关问题 第三方平台的直播画面不清晰怎么办? 第三方平台的直播画面突然中断是怎么回事? 如何实时切换智能交互的语言和声音? 父主题: 附录
计费咨询 MetaStudio有哪些计费项? 如何购买第三方音色? 第三方声音AK/SK如何填写? 购买语音包后试听一直转圈圈是为什么? 多语言的计费规则? 如何查看已购声音套餐明细? 分身形象或声音制作的不好,可以使用原有资源重新制作吗? 形象制作和声音制作支持退订吗? 制作好数字人后,可以不购买路数进行直播吗?