检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
获取语音训练任务审核结果 20次/秒 10次/秒 10次/秒 设置任务批次 10次/秒 3次/秒 3次/秒 确认在线录音结果 10次/秒 3次/秒 3次/秒 获取在线录音确认结果 20次/秒 10次/秒 10次/秒 语音合成管理 创建TTS试听任务 5次/秒 3次/秒 3次/秒 获取TTS试听文件
今天咱们刚刚开播,给大家带来了超多福利,是你想不到的优惠! 在直播间的宝宝可以扣个一,让我看到你们。 当前在直播间的宝宝,我们先来抽五个人免费送一波福利! 今晚的美食专场有饼干,有薯片…还有我也非常喜欢吃的麻辣香锅。 不过数量都比较少,真的要拼手速宝宝们! 今天直播间会有超级秒杀价,比双十一还要便宜哦!
今天咱们刚刚开播,给大家带来了超多福利,是你想不到的优惠! 在直播间的宝宝可以扣个一,让我看到你们。 废话不多说,我们先来一波抽奖! 当前在直播间的宝宝,我们先来抽五个人免费送一波福利! 今晚的美食专场有饼干,有薯片…还有我也非常喜欢吃的麻辣香锅。 不过数量都比较少,真的要拼手速宝宝们! 今天直播间会有超级秒杀价,比双十一还要便宜哦!
wav~19.wav;文本文件命名规则:0.txt~19.txt。 语音文件和文本文件逐句上传:每次上传一句语料的语音文件和文本文件,再调用“确认在线录音结果”接口确认语音和文本内容是否一致。确认成功后再上传和确认下一句。 文件上传后,调用“提交语音训练任务”接口,启动审核和训练。 调用方法
wav~99.wav;文本文件命名规则:0.txt~99.txt。 语音文件和文本文件逐句上传:每次上传一句语料的语音文件和文本文件,再调用“确认在线录音结果”接口确认语音和文本内容是否一致。确认成功后再上传和确认下一句。 文件上传后,调用“提交语音训练任务”接口,启动审核和训练。 调用方法
manage/user/training-segment 确认在线录音结果 GET /v1/{project_id}/voice-training-manage/user/training-segment 获取在线录音确认结果 语音合成管理 表27 语音合成管理接口 接口 说明 POST
费说明。 系统声音和Flexus声音免费使用。第三方声音的计费方式,详见购买出门问问套餐包。 标准版视频制作:必须使用标准版形象,声音不支持使用Flexus声音。 按视频制作时长计费,计费项为“分身数字人视频制作”,详见计费说明。 系统声音免费使用。第三方声音的计费方式,详见购买出门问问套餐包。
直播播放说明 直播内容审核说明 直播间配置约束 直播间配置限制,如表1所示。 表1 直播间限制 直播间配置 限制 文本驱动 每个单场景中所有段落输入文字的总量需大于200字。 每个段落的文本字符数量需小于2000,如果包含语音合成标记语言SSML标签,需小于3000。 整个直播间所有段落的
资产创建失败说明 资产冻结说明 资产存储计费说明 资产存储计费说明,如表1所示。 表1 资产存储计费说明 资产存储 计费说明 免费存储空间 MetaStudio服务免费赠送每个租户5GB资产存储空间,用于上传各类音视频、图片等素材。如果租户需要更多的存储空间,请购买单独的资产管理包月产品。
人形象采集时,需拍摄入场动作。 <speak><insert-action name="入场" tag="WALKING"/>文字</speak> “文字”示例:嗨,我在,请问你有什么问题? 热点问题 如果用户不知如何提问,可参考热点问题进行提问。 热点问题会展示在如图4所示②区域的位置。
TextLayerConfig 参数 是否必选 参数类型 描述 text_context 否 String 参数解释: 文字图层的文本,内容需做Base64编码。 示例:若想添加文字水印“测试文字水印”,那么text_context的值为:5rWL6K+V5paH5a2X5rC05Y2w 约束限制:
左下角展示资产存储空间的已使用量,单位:GB。 须知: 用户首次使用MetaStudio服务,会免费赠送5G的存储空间。 资源总量默认包含免费赠送的5G存储空间。 目前资产管理,在内侧免费体验中,所以存储空间可以为负数。内测体验到期后,会在Metastudio控制台进行公告提醒。
DK提供方名称、收集个人信息类型、使用目的、隐私政策链接,并获取用户的同意或取得其他合法性基础。您可以参考如下方式提供条款内容: 1. 以文字方式向用户告知 第三方SDK名称:数字人智能交互Web SDK 第三方公司名称:华为云计算技术有限公司 收集个人信息类型:您或您的最终用户
数字人支持TTS和ASR吗? 已支持TTS(文本转语音),详见创建TTS异步任务。MetaStudio不提供ASR(语音转文本),用户如有ASR需求,可以查看语音交互服务或其他ASR服务。 父主题: 数字人
TextLayerConfig 参数 参数类型 描述 text_context String 参数解释: 文字图层的文本,内容需做Base64编码。 示例:若想添加文字水印“测试文字水印”,那么text_context的值为:5rWL6K+V5paH5a2X5rC05Y2w 约束限制:
tQuestion进行文本问答了。 数字人主动播报与文本问答的区别是什么? 智能交互同时支持数字人主动播报和文本问答两种能力,两者都是通过文字驱动数字人讲话。 区别如下所示: 主动播报:主动播报是直接将sendDrivenText接口传入的文本作为数字人播报内容,来驱动数字人讲话。
TextLayerConfig 参数 参数类型 描述 text_context String 参数解释: 文字图层的文本,内容需做Base64编码。 示例:若想添加文字水印“测试文字水印”,那么text_context的值为:5rWL6K+V5paH5a2X5rC05Y2w 约束限制:
在段落的某个位置,插入换气或者停顿时间,也支持自定义停顿时长。 多音字 选中文字,设置多音字的正确读音。 全局语速 设置全局语速,取值范围[0.5X,2X]。设置为0.5X时,声音放慢至0.5倍速播放;设置为2X时,声音加速至2倍速播放。 助播 选中一段文字,设置为助播来播报这段内容。 全局声音(主播) 主
TextLayerConfig 参数 是否必选 参数类型 描述 text_context 否 String 参数解释: 文字图层的文本,内容需做Base64编码。 示例:若想添加文字水印“测试文字水印”,那么text_context的值为:5rWL6K+V5paH5a2X5rC05Y2w 约束限制:
TextLayerConfig 参数 参数类型 描述 text_context String 参数解释: 文字图层的文本,内容需做Base64编码。 示例:若想添加文字水印“测试文字水印”,那么text_context的值为:5rWL6K+V5paH5a2X5rC05Y2w 约束限制: