检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
播报内容生成后,单击右侧的“试听”,可以试听播报效果。 语音上传:本地录制音频后上传。音频格式需要为WAV或MP3格式,音频大小不超过20MB,时长不超过5分钟。 在线录音:在线录制音频。录音时长不能超过5分钟,为保证音频生成的效果,请保持录音环境安静无噪音。支持试听录制生成的语音。 文本驱动:通过输入文本,选
华为云提供了MetaStudio服务端SDK,您可以直接集成服务端SDK来调用MetaStudio的相关API,从而实现对MetaStudio服务的快速操作。 在线生成SDK代码 API Explorer能根据需要动态生成SDK代码功能,降低您使用SDK的难度,推荐使用。 您可以在API Explor
wav~99.wav;文本文件命名规则:0.txt~99.txt。 语音文件和文本文件逐句上传:每次上传一句语料的语音文件和文本文件,再调用“确认在线录音结果”接口确认语音和文本内容是否一致。确认成功后再上传和确认下一句。 文件上传后,调用“提交语音训练任务”接口,启动审核和训练。 调用方法
wav~19.wav;文本文件命名规则:0.txt~19.txt。 语音文件和文本文件逐句上传:每次上传一句语料的语音文件和文本文件,再调用“确认在线录音结果”接口确认语音和文本内容是否一致。确认成功后再上传和确认下一句。 文件上传后,调用“提交语音训练任务”接口,启动审核和训练。 调用方法
能力开放可集成 智能交互端侧Web SDK 形象驱动API 数字人大脑API 数字人能力开放,多种合作模式灵活选择 实名安全认证后,可使用控制台在线自助完成内容制作。 集成数字人API、SDK至企业自建平台。 联合专业直播服务伙伴,定制场景化解决方案,实现数字人直播系统交付和运营专业支持。
快速入门 环境要求 Web SDK运行环境要求,如表1所示。 表1 环境要求 环境项 使用限制 开发工具 Microsoft Visual Studio Code、WebStorm或其他Web IDE开发工具。 语言 Javascript或Typescript。 编译环境 建议Node
删除视频制作剧本 功能介绍 该接口用于删除视频制作剧本。 调用方法 请参见如何调用API。 URI DELETE /v1/{project_id}/digital-human-video-scripts/{script_id} 表1 路径参数 参数 是否必选 参数类型 描述 project_id
复制视频制作剧本 功能介绍 该接口用于复制视频制作剧本。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/digital-human-video-scripts/{script_id}/copy 表1 路径参数 参数 是否必选 参数类型 描述
查询视频制作剧本详情 功能介绍 该接口用于查询视频制作剧本详情。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/digital-human-video-scripts/{script_id} 表1 路径参数 参数 是否必选 参数类型 描述 project_id
更新视频制作剧本 功能介绍 该接口用于更新视频制作剧本。 调用方法 请参见如何调用API。 URI PUT /v1/{project_id}/digital-human-video-scripts/{script_id} 表1 路径参数 参数 是否必选 参数类型 描述 project_id
完整性校验 操作说明 对下载的SDK安装包进行完整性校验,判断下载过程是否存在篡改和丢包现象。 操作步骤 参考下载SDK安装包,下载SDK安装包至本地。 打开本地命令运行程序,输入如下命令,在本地生成SDK安装包的SHA256值。 其中,“D:\HwICSUiSdk-1.0.0.
Internal error. 内部异常,请联系技术支持。 MSS.47010101 Failed to parse the message. 消息解析失败,请联系技术支持。 MSS.47010102 Failed to start the dialog. The robot ID is empty
直播业务媒体流如何应对防火墙限制? 分身数字人直播业务使用SparkRTC方式收流,其信令和媒体访问方式为“IP+端口”或“域名+端口”,防火墙需要放开如下限制: 解除所有IP访问的限制。 在客户端防火墙配置SparkRTC端口和域名白名单。 配置SparkRTC端口的防火墙白名单,如表1所示。
肢体驱动数据格式如何定义? MetaStudio肢体驱动数据的前三个为Hips骨骼的Translation信息,按XYZ排列,后接75根骨骼的旋转数据,具体定义如下: 序号 骨骼名称 0 Hips 1 Spine 2 Spine1 3 Spine2 4 Spine3 5 Neck
-manage/user/training-segment 确认在线录音结果 GET /v1/{project_id}/voice-training-manage/user/training-segment 获取在线录音确认结果 语音合成管理 表27 语音合成管理接口 接口 说明
客户声音制作案例 单击声音样例.zip,下载如表1所示的音频文件。 mos分是从音色相似度、情感表达效果和声音音质方面,进行整体效果综合评分的结果。 表1 音频文件 版本 类别 原音文件 合成音文件 版本差异 适用场景 基础版声音制作 女声 基础版媒体1.wav 基础版媒体2.wav
智能交互业务媒体流如何应对防火墙限制? 分身数字人智能交互业务使用SparkRTC方式收流,其信令和媒体访问方式为“IP+端口”或“域名+端口”,您的防火墙需要配置SparkRTC端口和域名的白名单,请参考直播业务媒体流如何应对防火墙限制?。 父主题: 智能交互
获取语音训练任务审核结果 20次/秒 10次/秒 10次/秒 设置任务批次 10次/秒 3次/秒 3次/秒 确认在线录音结果 10次/秒 3次/秒 3次/秒 获取在线录音确认结果 20次/秒 10次/秒 10次/秒 语音合成管理 创建TTS试听任务 5次/秒 3次/秒 3次/秒 获取TTS试听文件
因素。这个改革是想减轻学生的学业压力,让他们能更全面地发展。 因为互联网技术的发展,网络教育在中国越来越受欢迎。 更多的学校和教育机构提供在线课程和远程学习平台,让学生能灵活选择时间和地点学习。 网络教育还给偏远地区和弱势群体提供了更多平等的教育机会。 STEM教育是中国教育改革的重要话题。
获取语音训练任务审核结果 20次/秒 10次/秒 10次/秒 设置任务批次 10次/秒 3次/秒 3次/秒 确认在线录音结果 10次/秒 3次/秒 3次/秒 获取在线录音确认结果 20次/秒 10次/秒 10次/秒 语音合成管理 创建TTS试听任务 5次/秒 3次/秒 3次/秒 获取TTS试听文件