检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
包含如下命令: TEXT_DRIVE:文本驱动 INTERRUPT_CHAT:中断对话 STOP_CHAT:停止对话 data 是 ChatReqDataInfo object 对话请求数据信息。
图3 用户数据页面 父主题: 形象制作
2023-08-07 第二次正式发布 本次变更如下: 更新3个接口的请求参数和响应参数,包括:查询资产列表、查询资产详情和获取语音驱动数据接口。 2022-12-27 第一次正式发布。
MANUAL_VERIFY_SUCCESS: 审核通过,等待预处理资源 WAIT_TRAINING_DATA_PREPROCESS: 等待训练数据预处理 TRAINING_DATA_PREPROCESSING: 训练数据预处理中 TRAINING_DATA_PREPROCESS_FAILED
图1 控制台 在“智能问答机器人”页面,单击问答机器人所在行的“机器人管理”,进入“数据总览”页面。 图2 问答机器人 在左侧导航栏中,选择“知识库 > 问答管理”,如图3所示。
图1 声音合成 功能介绍 该接口用于TTS流式合成音频,用于文本转化为语音,并实时返回合成的音频数据。 调用方法 构造请求 请求URL:wss://metastudio-api.
说明: 通过该obs地址上传时需要设置content-type为text/plain 表4 package_url 参数 参数类型 描述 training_data_uploading_url String 上传的训练数据地址,用户需要将训练数据打成zip包后上传到该url。
数据读取失败 请联系技术支持 500 MSS.47010008 租户数据被清理,任务停止 租户数据被清理,任务停止 不涉及 500 MSS.47010025 问答对主题标识创建失败 问答对主题标识创建失败 请联系技术支持 500 MSS.47010036 导出技能配置失败 导出技能配置失败
系统策略 MetaStudio FullAccess策略内容 MetaStudio ReadOnlyAccess MetaStudio只读权限,拥有该权限的用户仅能查看MetaStudio数据。
自动驾驶具备安全合规、数据管理高效、算法训练高效、生态开放等优势。 华为云|自动驾驶 图3 技能编辑页面 表3 问答对 参数 说明 主题 输入主题,便于问题查找,不包含问题内容。 所有问法 输入所有提问方式。问法包括同一个问题的不同提问方式。
seq为流式文本序号,从1开始计数;is_last用于判断流式文本的最后一包数据。如果不使用流式文本消息,seq设置为“1”,is_last设置为“true”。 建议每个分包数据长度大于6个字,否则可能会导致数字人说话卡顿。 详细交互流程如下所示: 用户发送文本驱动消息。
原始录音数据,需为48kHz采样率、16bit编码和单声道。 录制风格 录制全程保持语境风格一致,避免多种情绪混杂。如直播场景时,录制风格需接近日常直播效果。 发音吐字 发音吐字清晰、准确,音量适中。如果出现喷麦或嘶嘶声音,建议当前句子重新录制。
数据上传完成后,界面提示“制作任务提交成功!”,如图3所示。 数字人定制任务提交成功后,会在1个工作日内完成审核。任务审核通过后,才能进行算法训练,会在3个工作日内训练完成并生成数字人。
CAPTURE: 直播助手,将摄像头获取视频流推送到RTC房间 ANIMATION: VDS服务,从RTC房间拉视频流生成动作数据 RENDER: 渲染服务,将动作数据渲染成数字人动画 PLAYER: 普通观看方,可选择原始视频流或者数字人动画视频流观看 INFERENCE_USER
CAPTURE: 直播助手,将摄像头获取视频流推送到RTC房间 ANIMATION: VDS服务,从RTC房间拉视频流生成动作数据 RENDER: 渲染服务,将动作数据渲染成数字人动画 PLAYER: 普通观看方,可选择原始视频流或者数字人动画视频流观看 INFERENCE_USER
说明: 通过该地址上传时,需设置content-type为application/octet-stream audio_upload_url String 音频数据训练上传URL。
说明: 通过该地址上传时,需设置content-type为application/octet-stream audio_upload_url String 音频数据训练上传URL。
照片建模任务详情查询 20次/秒 10次/秒 - 基于图片URL创建照片建模任务 2次/秒 2次/秒 - 3D数字人语音驱动 创建语音驱动任务 2次/秒 2次/秒 - 获取语音驱动任务列表 20次/秒 10次/秒 - 创建语音驱动表情动画任务 2次/秒 2次/秒 - 获取语音驱动表情数据
唯一的区别可能就是在时长与存储空间的差异了。 月度会员和季度会员分别提供了20分钟和60分钟。 按照每条视频最长2分钟算,平均单条视频价格是12.8元和12元。 目前比较建议大家购买年度会员,年度会员提供了所有的会员权益。
CAPTURE: 直播助手,将摄像头获取视频流推送到RTC房间 ANIMATION: VDS服务,从RTC房间拉视频流生成动作数据 RENDER: 渲染服务,将动作数据渲染成数字人动画 PLAYER: 普通观看方,可选择原始视频流或者数字人动画视频流观看 INFERENCE_USER