检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
单击“立即购买”,进入“订单确认”页面。 单击“去支付”。按照界面提示支付完成。 图1 控制台 在“智能问答机器人”页面,单击问答机器人所在行的“机器人管理”,进入“数据总览”页面。 图2 问答机器人 在左侧导航栏中,选择“知识库 > 问答管理”,如图3所示。 图3 问答管理页面 用户可以选择下述一种方式,
英文 默认取值: CN create_type 否 String 任务创建方式。 PACKAGE: 使用一个zip包包含所有数据 SEGMENT: 逐句上传数据 phone 否 String 手机号 dhtms_job_id 否 String 形象制作任务id batch_name
training_input_source_url String 用户原始输入数据url。 create_type String 任务创建方式。 PACKAGE: 使用一个zip包包含所有数据 SEGMENT: 逐句上传数据 tag String 任务标签。 ECOMMERCE: 电商 NEWS:
object 分身模型元数据 image_meta ImageAssetMeta object 图片元数据 video_meta VideoAssetMeta object 视频元数据,自动提取获得。 audio_meta AudioAssetMeta object 音频元数据,自动提取获得。
英文 默认取值: CN create_type 否 String 任务创建方式。 PACKAGE: 使用一个zip包包含所有数据 SEGMENT: 逐句上传数据 phone 否 String 手机号 dhtms_job_id 否 String 形象制作任务id batch_name
FullAccess策略内容 MetaStudio ReadOnlyAccess MetaStudio只读权限,拥有该权限的用户仅能查看MetaStudio数据。 系统策略 MetaStudio ReadOnlyAccess策略内容 相关链接 IAM产品介绍 创建用户组、用户并授予MetaStud
英文 默认取值: CN create_type 否 String 任务创建方式。 PACKAGE: 使用一个zip包包含所有数据 SEGMENT: 逐句上传数据 phone 否 String 手机号 dhtms_job_id 否 String 形象制作任务id batch_name
data 是 ChatReqDataInfo object 对话请求数据信息。 表7 ChatReqDataInfo 参数 是否必选 参数类型 描述 text 是 String 文本信息。 seq 否 Integer 数据包序号。 is_last 否 Boolean 判断是否为最后一个文本。
RESIZE codec String 参数解释: 视频编码格式及视频文件格式。 约束限制: 仅分身数字人视频制作支持VP8编码。 取值范围: H264:h264编码,输出mp4文件。 VP8:vp8编码,输出webm文件。 默认取值: 不涉及 bitrate Integer 参数解释:
RESIZE codec 是 String 参数解释: 视频编码格式及视频文件格式。 约束限制: 仅分身数字人视频制作支持VP8编码。 取值范围: H264:h264编码,输出mp4文件。 VP8:vp8编码,输出webm文件。 默认取值: 不涉及 bitrate 是 Integer 参数解释:
S: 等待训练数据预处理 TRAINING_DATA_PREPROCESSING: 训练数据预处理中 TRAINING_DATA_PREPROCESS_FAILED: 训练数据预处理失败 TRAINING_DATA_PREPROCESS_SUCCESS: 训练数据预处理完成,等待训练资源中
如需使用第三方声音进行语音合成,请购买出门问问声音套餐。 图1 声音合成 功能介绍 该接口用于TTS流式合成音频,用于文本转化为语音,并实时返回合成的音频数据。 调用方法 构造请求 请求URL:wss://metastudio-api.{region}.myhuaweicloud.com:443
及修改,如表1所示。 表1 问题定位及修改 错误提示 处理办法 视频名称包含非法字符 请您根据要求修改导出文件名称中的敏感字符。 资产名称重复 请您根据要求重新修改导出文件的名称。 视频任务合成状态一直显示“待合成” 可能是由于当前视频任务正在等待队列中,请您耐心等待。 演示素材不存在或不可用
5(HEVC)视频解码。 图2 查看浏览器配置 用ffmpeg检查视频的编码是否是H265(HEVC),输入命令:ffmpeg -i 视频文件名。 图3 检查视频是否是hevc编码 需要先安装ffmpeg,安装方法如下。 ffmpeg下载地址:https://github.com
语音合成管理 创建TTS试听任务 获取TTS试听文件 创建TTS异步任务 获取TTS异步任务 设置TTS租户级自定义读法配置 获取TTS租户级自定义读法配置 删除TTS租户级自定义读法配置 修改TTS租户级自定义读法配置 语音同步合成WebSocket接口
10次/秒 10次/秒 复制资产 4次/秒 3次/秒 3次/秒 文件管理 创建文件并获取上传URL 10次/秒 5次/秒 5次/秒 删除文件 10次/秒 5次/秒 5次/秒 确认文件已上传 10次/秒 5次/秒 5次/秒 创建大文件 10次/秒 5次/秒 5次/秒 视频制作剧本管理 创建视频制作剧本
CAPTURE: 直播助手,将摄像头获取视频流推送到RTC房间 ANIMATION: VDS服务,从RTC房间拉视频流生成动作数据 RENDER: 渲染服务,将动作数据渲染成数字人动画 PLAYER: 普通观看方,可选择原始视频流或者数字人动画视频流观看 INFERENCE_USER:
CAPTURE: 直播助手,将摄像头获取视频流推送到RTC房间 ANIMATION: VDS服务,从RTC房间拉视频流生成动作数据 RENDER: 渲染服务,将动作数据渲染成数字人动画 PLAYER: 普通观看方,可选择原始视频流或者数字人动画视频流观看 INFERENCE_USER:
83d4dec9fa/ttsc/vocabulary-configs { "type" : "ALIAS", "key" : "中国", "value" : "东方大国" } 设置字母读法 POST https://{endpoint}/v1/3f0924078d1
支持流式文本消息。seq为流式文本序号,从1开始计数;is_last用于判断流式文本的最后一包数据。如果不使用流式文本消息,seq设置为“1”,is_last设置为“true”。 建议每个分包数据长度大于6个字,否则可能会导致数字人说话卡顿。 详细交互流程如下所示: 用户发送文本驱动消息。