检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
如果未使用服务预置文案,声音标签仅作为标签,来区分声音使用场景。 请选择声音性别 声音的性别,用于匹配声音模型的精准度。 如下所示: 男生 女生 原始输入语言 上传语料所使用的语言。 包含如下语言: 中文 英文 须知:当前参数配置仅作为标识,对训练结果没有任何影响。 选择声音标签 声音的标签。作用为选择声音时,快速筛选领域。
需要确认这里的“设备”与Windows系统的声音输出设备是否一致。如果不一致,会导致OBS无法成功捕获声音给第三方直播平台。需要修改为一致后再直播。 图2 桌面音频属性设置 检查Windows系统的声音输出设备 在Windows系统的系统设置中,找到声音设置,查看输出设备,示例如图3所示。
and CLOUD_SDK_SK in the local environment ak = os.environ["CLOUD_SDK_AK"] sk = os.environ["CLOUD_SDK_SK"] projectId = "{project_id}"
单击“管理技能配置”,在弹出的“配置应用需要的技能”对话框中,设置需要的系统预置技能,如图13所示。 示例:可以开启“生活”分类中的“天气”技能,这样用户就可以提问天气相关的问题。启用这类预置技能,可以支持用户进行闲聊。 图13 系统预置技能 全部设置完成后,单击对话框右上角的“保存配置”。 开启讯飞的闲聊功能。
单击“管理技能配置”,在弹出的“配置应用需要的技能”对话框中,设置需要的系统预置技能,如图7所示。 示例:可以开启“生活”分类中的“天气”技能,这样用户就可以提问天气相关的问题。启用这类预置技能,可以支持用户进行闲聊。 图7 系统预置技能 全部设置完成后,单击对话框右上角的“保存配置”。 开启讯飞的闲聊功能。
and CLOUD_SDK_SK in the local environment ak = os.environ["CLOUD_SDK_AK"] sk = os.environ["CLOUD_SDK_SK"] projectId = "{project_id}"
图像真实:智能重打光,背景融合更真实。 多种复杂场景建模:支持人物走动、侧身等训练,肢体动作更自然。 多语言泛化:一次母语训练,多语种支持;支持20+语种,覆盖主流语言。 相对真人成本下降90%以上 一次拍摄与训练后,可无限次使用;无时间约束、无时长限制、无容量限制;统一质量
Console上用户看到的状态映射关系如下: 待提交 WAIT_FILE_UPLOAD: 待上传文件 系统审核中 AUTO_VERIFYING: 自动审核中 MANUAL_VERIFYING: 人工审核中 系统审核未通过 AUTO_VERIFY_FAILED: 自动审核失败 MANUAL_VERIFY_FAILED:
每个单场景中所有段落输入文字的总量需大于200字。 每个段落的文本字符数量需小于2000,如果包含语音合成标记语言SSML标签,需小于3000。 整个直播间所有段落的文本总字符数,如果包含语音合成标记语言SSML标签时,需小于30万。 音频驱动 每个单场景上传音频的时长需大于1分钟,大小不超过100M。
上传音频。 音频格式支持WAV、MP3,单段音频时长1~5分钟,建议1分钟。语料中的语言仅支持中文和英文。 视频中提取声音:直接提取训练视频中的声音,训练生成Flexus声音。 视频中的语言仅支持中文和英文。 须知:“单独上传语料包”的方式生成Flexus声音的效果会更好。 数字人名称
环境要求 环境项 使用限制 开发工具 Microsoft Visual Studio Code、WebStorm或其他Web IDE开发工具。 语言 Javascript或Typescript。 编译环境 建议Node 17+。 编译工具 建议Webpack 5 + babel 7。 浏览器
用户阅读隐私政策。隐私政策需方便用户查看,例如用户在App主功能界面中通过4次以内的点击或滑动操作可访问。 描述语言需要清晰通俗,符合通用语言习惯,避免使用有歧义的语言。 隐私政策内容要包含产品及服务收集个人信息的目的、方式和范围,个人信息处理者的名称和联系方式等。 您的产品及服
and CLOUD_SDK_SK in the local environment ak = os.environ["CLOUD_SDK_AK"] sk = os.environ["CLOUD_SDK_SK"] projectId = "{project_id}"
设置TTS租户级自定义读法配置 功能介绍 该接口用于设置TTS租户级自定义读法配置。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/ttsc/vocabulary-configs 表1 路径参数 参数 是否必选 参数类型 描述 project_id
HUAWEI_EI:EI TTS MOBVOI:出门问问TTS language String 语言类型。默认值CN。 CN:中文。 EN:英文。 默认取值: CN language_desc String 语言描述。 状态码: 400 表11 响应Body参数 参数 参数类型 描述 error_code
购买声音套餐 第三方声音支持的语言类型 购买出门问问声音套餐 父主题: 声音制作
修订记录 发布日期 修订记录 2024-07-09 新增PHP和Node.js语言SDK。 2023-06-30 第一次正式发布。
and CLOUD_SDK_SK in the local environment ak = os.environ["CLOUD_SDK_AK"] sk = os.environ["CLOUD_SDK_SK"] projectId = "{project_id}"
频制作”,详见计费说明。 系统声音和Flexus声音免费使用。第三方声音的计费方式,详见购买出门问问套餐包。 标准版视频制作:必须使用标准版形象,声音不支持使用Flexus声音。 按视频制作时长计费,计费项为“分身数字人视频制作”,详见计费说明。 系统声音免费使用。第三方声音的计费方式,详见购买出门问问套餐包。
47010130 第三方语言模型配置为空 第三方语言模型配置为空 请携带正确的第三方语言模型配置 400 MSS.47010131 第三方语言模型地址为空 第三方语言模型地址为空 请携带正确的第三方语言模型地址字段 400 MSS.47010134 第三方语言模型地址非法 第三方语言模型地址非法