检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
图片简介:图片的基本介绍,方便了解和使用。 风格:关键词标签,方便用户搜索此类型的资产。 基本信息:图片的用途。 图3 上传图片 单击“图片上传”区域,从本地选择需要上传的图片资产。 单击界面右上方的“保存”,在弹出的“资产保存成功”对话框中,单击“知道了”。 资产保存成功后,返回到“我的创作 > 资源
String 批次名称 output_language 否 String 模型输出语言类型 custom_text 否 String 自定义试听文本 响应参数 状态码:200 表4 响应Body参数 参数 参数类型 描述 job_id String 任务id。 training_data_uploading_url
TextConfig 参数 是否必选 参数类型 描述 text 是 String 参数解释: 台词脚本。支持两种模式,纯文本模式和标签模式。 纯文本模式:使用方法,如“大家好,我是人工智大家,是个虚拟主播”。 标签模式:SSML标签的详细定义请参考文本驱动SSML定义。 约束限制: 不含SSML标签字符数最长10000个字符。
asset_type String 资产类型。 公共资产类型: VOICE_MODEL:音色模型 VIDEO:视频文件 IMAGE:图片文件 PPT:幻灯片文件 MUSIC: 音乐 AUDIO: 音频 COMMON_FILE:通用文件 分身数字人资产类型: HUMAN_MODEL_2D:分身数字人模型
etaStudio制作的模型,仅支持在本服务内使用。 视频制作 使用系统预置或自定义生成的数字人形象、声音,制作音视频内容。 制作的视频可应用于教学、培训等各类场景中。 视频直播 使用系统预置或自定义的数字人形象、声音,制作音视频直播内容。 可通过下述方式,在直播平台开播。 RT
源页面。可以选择当前区域、服务类型、产品分类、计费模式等信息,购买对应的资源。各类产品的计费说明,详见计费说明。 关联租户:仅SP用户有此入口。单击“关联租户”,进入“关联租户”信息配置界面。输入租户所在区域的项目ID和租户名称,租户名称支持自定义。单击“创建”,租户新增完成。 我的资源(租户)
频制作剧本中。 新增1个视频制作剧本,默认会有1个场景,用户可以自定义此场景,也可以保持不变。MetaStudio按文件页面依次生成对应的场景,即一个页面对应生成一个场景。 不同的操作的含义为: 复制当前场景:插入的文件页面直接复制第一个场景,粘贴生成新场景,即新场景中完全复用第
TextConfig 参数 是否必选 参数类型 描述 text 是 String 参数解释: 台词脚本。支持两种模式,纯文本模式和标签模式。 纯文本模式:使用方法,如“大家好,我是人工智大家,是个虚拟主播”。 标签模式:SSML标签的详细定义请参考文本驱动SSML定义。 约束限制: 不含SSML标签字符数最长10000个字符。
使用SP用户登录华为云控制台,单击界面左上角的图标,在弹出的服务列表界面中,搜索并单击“数字内容生产线 MetaStudio”服务,进入MetaStudio服务概览页面,如图1所示。 图1 服务概览页面 在左侧导航栏中,选择“租户管理”,进入“租户列表”页面。 单击“关联租户”,进入“关联租户”页面,如图2所示。
TextConfig 参数 是否必选 参数类型 描述 text 是 String 参数解释: 台词脚本。支持两种模式,纯文本模式和标签模式。 纯文本模式:使用方法,如“大家好,我是人工智大家,是个虚拟主播”。 标签模式:SSML标签的详细定义请参考文本驱动SSML定义。 约束限制: 不含SSML标签字符数最长10000个字符。
UpdateHotWordsSwitchRequest request = new UpdateHotWordsSwitchRequest(); UpdateHotWordsSwitchReq body = new UpdateHotWordsSwitchReq();
10次/秒 10次/秒 设置TTS租户级自定义读法配置 10次/秒 3次/秒 3次/秒 获取TTS租户级自定义读法配置 10次/秒 3次/秒 3次/秒 删除TTS租户级自定义读法配置 10次/秒 3次/秒 3次/秒 修改TTS租户级自定义读法配置 10次/秒 3次/秒 3次/秒 3D数字人风格管理
10次/秒 10次/秒 设置TTS租户级自定义读法配置 10次/秒 3次/秒 3次/秒 获取TTS租户级自定义读法配置 10次/秒 3次/秒 3次/秒 删除TTS租户级自定义读法配置 10次/秒 3次/秒 3次/秒 修改TTS租户级自定义读法配置 10次/秒 3次/秒 3次/秒 3D数字人风格管理
待上传文件 系统审核中 AUTO_VERIFYING: 自动审核中 MANUAL_VERIFYING: 人工审核中 系统审核未通过 AUTO_VERIFY_FAILED: 自动审核失败 MANUAL_VERIFY_FAILED: 人工审核失败 算法训练中 说明: 算法训练中的状态仅管理员
SYSTEM_AUDITING: 系统审核中 AUDITING: 人工审核中 WAITING_SPLIT: 等待切割 SPLITTING: 切割中 SPLIT_FAILED: 切割失败 ANNOTATING: 标注中 WAITING: 等待训练 PROCESSING: 任务训练中 RESULT_REVIEW:
解除所有IP访问的限制。 在客户端防火墙配置SparkRTC端口和域名白名单。 配置SparkRTC端口的防火墙白名单,如表1所示。 表1 防火墙端口白名单 端口类型 端口 TCP端口 443、6447 UDP端口 20000-20063 配置SparkRTC域名的防火墙白名单,如表2所示。 表2 防火墙域名白名单
是否必选 参数类型 描述 robot_id 是 String 应用ID。 pacify_words_type 是 Integer 安抚话术类型 说明: 0:通用安抚话术, 1:意图匹配安抚话术 取值范围: 0-32 intent 否 String 意图名称 pacify_words 是 String
SYSTEM_AUDITING: 系统审核中 AUDITING: 人工审核中 WAITING_SPLIT: 等待切割 SPLITTING: 切割中 SPLIT_FAILED: 切割失败 ANNOTATING: 标注中 WAITING: 等待训练 PROCESSING: 任务训练中 RESULT_REVIEW:
不同声音模型对表1中操作的支持情况有差异,所以如果表1中操作项置灰,说明当前声音模型不支持此操作。需要重新选择一个支持所需操作的声音模型进行设置。 表1 操作说明 操作 说明 插入停顿 将鼠标放在需要停顿的文字右侧,单击“插入停顿”。在弹出的提示框中,选择“换气”或者停顿的时间,也支持自定义停顿时长。 连读 选中需要连读的文本内容,单击“连读”。
创建TTS试听任务 获取TTS试听文件 创建TTS异步任务 获取TTS异步任务 设置TTS租户级自定义读法配置 获取TTS租户级自定义读法配置 删除TTS租户级自定义读法配置 修改TTS租户级自定义读法配置 语音同步合成WebSocket接口