检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
speechRecognized的流式返回是覆盖式返回。后一条通知中的text字段值包含前一条通知的内容。例如:第一条通知的text值为“你吃”,第二条新识别了“饭了么”,则第二条text值为“你吃饭了么”。 semanticRecognized的流式返回是分段式返回。后一条通知中的text字段值
约束限制: 该配置仅用于模板 取值范围: PRIVATE:私有,仅本租户可访问。 PUBLIC:公开,所有租户可访问。当前仅提供系统资产可公开访问。 SHARED:共享,指定租户可访问。拥有者指定租户可访问。 默认取值: 不涉及。 shared_state 否 String 参数解释:
使用预置的,也支持自定义生成。 画面布局:简称“画布”,如图中2区域所示。可以在画布中插入人物形象、背景、贴图、文本框、视频等内容,支持调整各项直播素材的大小和图层位置。所有的设置效果均在画布中直观可见。 开播设置:简称“设置”,如图中3区域所示,包括视频直播的各类设置。 剧本设
他声音套餐的操作均相同。 查看用户已购语音合成套餐,获取“用户账号”和“登录密码”,作为在MetaStudio控制台激活第三方声音的使用凭证。 访问云商店买家中心,进入“已购买的服务”界面。 可以看到已购买的语音合成套餐信息。 图8 已购买的服务 单击已购买套餐右侧的“资源详情”,进入资源详情界面。
音频制作完成后,可单击音量图标,调整音频的音量。 上述操作全部完成后,第一个场景的视频内容已制作完成。 如果还需要制作更多场景,可单击“场景”区域的“+”图标,新增场景。制作过程参考第一个场景即可。 图3 场景区域 所有场景设置完成后,单击界面右上角的“合成视频”,弹出“合成设置”对话框。 参数设置说明如下所示:
约束限制: 该配置仅用于模板 取值范围: PRIVATE:私有,仅本租户可访问。 PUBLIC:公开,所有租户可访问。当前仅提供系统资产可公开访问。 SHARED:共享,指定租户可访问。拥有者指定租户可访问。 默认取值: 不涉及。 shared_state String 参数解释:
”。在弹出的提示框中,选择“换气”或者停顿的时间,也支持自定义停顿时长。 连读 选中需要连读的文本内容,单击“连读”。 多音字 选中文本中的多音字,单击“多音字”,在弹出的提示框中,选择正确的发音或者自定义发音。 须知: 这里设置的多音字,仅对当前视频制作剧本有效,如需全局生效,可参考配置特殊词表配置。
每个单场景中所有段落输入文字的总量需大于200字。 每个段落的文本字符数量需小于2000,如果包含语音合成标记语言SSML标签,需小于3000。 整个直播间所有段落的文本总字符数,如果包含语音合成标记语言SSML标签时,需小于30万。 音频驱动 每个单场景上传音频的时长需大于1分钟,大小不超过100M。
获取。 响应消息头中X-Subject-Token的值。 Authorization 否 String 使用AK/SK方式认证时必选,携带的鉴权信息。 X-Sdk-Date 否 String 使用AK/SK方式认证时必选,请求的发生时间。 X-Project-Id 否 String
约束限制: 该配置仅用于模板 取值范围: PRIVATE:私有,仅本租户可访问。 PUBLIC:公开,所有租户可访问。当前仅提供系统资产可公开访问。 SHARED:共享,指定租户可访问。拥有者指定租户可访问。 默认取值: 不涉及。 shared_state String 参数解释:
是设计成简约时尚的现代风格。 183. 语音助手设置:您可以根据自己的偏好选择机器人的语音助手角色和声音风格。 184. 例如,您可以选择一个温柔的女声、一个幽默的男声,或是选择带有不同地区口音的语音助手。 185. 偏好设置:家用机器人可以学习并记忆您和家人的偏好,例如音乐、电影、食物、运动等。
约束限制: 该配置仅用于模板 取值范围: PRIVATE:私有,仅本租户可访问。 PUBLIC:公开,所有租户可访问。当前仅提供系统资产可公开访问。 SHARED:共享,指定租户可访问。拥有者指定租户可访问。 默认取值: 不涉及。 shared_state 否 String 参数解释:
<word></word>标签用于设置选中文字为连读模式。 MetaStudio包含多种TTS音色,每种音色支持的SSML标签能力是有差异的,请通过“查询资产详情”接口,获取每个音色支持使用的标签。 speak标签 描述 <speak></speak>:SSML文本的根节点。 语法 1 <s
file_id为2中返回的file_id的值;Body中的state取值为“CREATED”,其余参数配置请参考确认文件已上传参数说明。 如果状态码返回200,说明确认文件已上传接口调用成功,可以在查询资产详情接口界面查看上传结果。也可以在MetaStudio控制台的“我的创作 > 资源 >
Array of strings 音频上传的地址。 通过该obs地址上传时,需设置content-type为audio/wav txt_uploading_url Array of strings 文本上传的地址。 通过该obs地址上传时需设置content-type为text/plain
智能交互 智能交互支持富媒体吗? 如何自定义域名方式访问智能交互页面? 智能交互业务媒体流如何应对防火墙限制? 智能交互界面报错“MSS.20010135”如何处理? 如何实时切换智能交互的语言和声音?
概览页面,开通“声音合成”的按需计费。 详细操作为:单击“声音合成”卡片中的“去开通”,在弹出的“开通按需计费服务提示”对话框中,勾选同意协议。单击“确定”,开通按需计费。 如需使用第三方声音进行语音合成,请购买出门问问声音套餐,操作请参考《用户指南》的“购买出门问问声音套餐”章节。
从下拉框中选择已购买的资源实例。 示例:分身数字人形象制作 - 2025-11-01。 请选择资源数量 设置资源数量,不能超过所选资源实例已激活的数量。 示例:2。 请选择日期 资源激活后,从激活日期开始计算,有效期是一年。这里选择的日期,为有效期内的时间。 这里配置的日期,为当前租户
登录MetaStudio控制台。 在左侧导航栏中,选择“我的创作”。 选择“资源”页签,单击“声音”页签。 单击需要使用的声音卡片,进入“声音详情”界面。 这里的“资产编号”即语音同步合成WebSocket接口需要使用的音色ID。 图1 声音详情界面 在控制台查询音色ID(方式二)
Array of strings 音频上传的地址。 通过该obs地址上传时,需设置content-type为audio/wav txt_uploading_url Array of strings 文本上传的地址。 通过该obs地址上传时需设置content-type为text/plain