检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
智能交互语言 zh_CN:简体中文(已下线,请使用CN) en_US:英语(已下线,请使用EN) CN:中文 EN:英文 tail_silence_time 否 Integer 语音识别后端点静音时长默认500ms 取值范围: 0-3000 enable_question_audit 否 Boolean
智能交互语言 zh_CN:简体中文(已下线,请使用CN) en_US:英语(已下线,请使用EN) CN:中文 EN:英文 tail_silence_time 否 Integer 语音识别后端点静音时长默认500ms 取值范围: 0-3000 enable_question_audit 否 Boolean
拍摄流程 支持手机或相机拍摄,需1080P或更高分辨率。 录制时长为2分钟,包含15秒静默转态和1分45秒的演讲过程。 允许使用中文、英文录制。 录制全程眼睛需注视镜头,周围环境保持安静,脸部光照明亮且均匀。 拍摄完成后不要剪辑,整个视频一起上传至MetaStudio控制台。
播报内容生成后,单击右侧的“试听”,可以试听播报效果。 语音上传:本地录制音频后上传。音频格式需要为WAV或MP3格式,音频大小不超过20MB,时长不超过5分钟。 在线录音:在线录制音频。录音时长不能超过5分钟,为保证音频生成的效果,请保持录音环境安静无噪音。支持试听录制生成的语音。 文本驱动:通过输入文本,选
对应的系统权限并向用户告知征得其同意。 权限 权限描述 使用目的 获取麦克风权限 获取浏览器的麦克风设备权限 开始语音交互时,用于进行语音识别文字,获取交互答案 四、延迟初始化要求 为了避免您的应用在未获取用户的同意前SDK提前处理用户的个人信息。我们提供了智能交互任务创建接口c
font_name 否 String 参数解释: 字体。当前支持的字体请参考服务支持的字体 约束限制: 不涉及。 取值范围: 字符长度0-64位 默认取值: HarmonyOS_Sans_SC_Black font_size 否 Integer 参数解释: 字体大小。接口的取值范围为0-120,
在一场网络暴力事件中,用户可能是直接施暴者、直接或间接传播者,也可能是受害者。 用户应注重规范自身“文明上网”的行为习惯, 严守言论自由的义务边界,提高对于网络暴力行为的识别能力, 及时举报相关内容,学习了解有关平台防范网络暴力的功能机制, 做好自我防护,避免网络暴力再次发生。 近日,旅美大熊猫丫丫因恶劣的健康状况,引发了网友的大量关注和担忧。
华为云提供了MetaStudio服务端SDK,您可以直接集成服务端SDK来调用MetaStudio的相关API,从而实现对MetaStudio服务的快速操作。 在线生成SDK代码 API Explorer能根据需要动态生成SDK代码功能,降低您使用SDK的难度,推荐使用。 您可以在API Explor
视频直播 操作指导 15:32 视频直播操作指导 视频直播 视频直播全流程 04:26 视频直播全流程演示 视频直播(英文) 视频直播全流程 01:46 视频直播英文界面全流程演示 视频直播 如何访问MetaStudio服务 00:26 1.如何访问MetaStudio服务 视频直播
系统预置自研音色ID列表,如表1所示。 表1 预置音色ID列表 音色名称(中文) 资产ID(华东-上海一) 资产ID(华北-北京四) 音色名称(英文) 资产ID(亚太-新加坡) 云歌 075494c45b5aef529d55cd2a456e6076 0a4b548fd8d2d6998e1fc3fffb29f9bc
(可选)新增English情景模式:前面的所有操作,都是main情景模式下的配置,如果对话配置时,语言选择“中文”,则main情景模式下的配置生效。如果对话配置时,语言选择“英文”,当前应用需要新增English情景模式,才能对话成功。 情景模式名称必须为“English”,English情景模式下,不支持开启系统
(可选)新增English情景模式:前面的所有操作,都是main情景模式下的配置,如果对话配置时,语言选择“中文”,则main情景模式下的配置生效。如果对话配置时,语言选择“英文”,当前应用需要新增English情景模式,才能对话成功。 情景模式名称必须为“English”,English情景模式下,不支持开启系统
wav~99.wav;文本文件命名规则:0.txt~99.txt。 语音文件和文本文件逐句上传:每次上传一句语料的语音文件和文本文件,再调用“确认在线录音结果”接口确认语音和文本内容是否一致。确认成功后再上传和确认下一句。 文件上传后,调用“提交语音训练任务”接口,启动审核和训练。 调用方法
wav~19.wav;文本文件命名规则:0.txt~19.txt。 语音文件和文本文件逐句上传:每次上传一句语料的语音文件和文本文件,再调用“确认在线录音结果”接口确认语音和文本内容是否一致。确认成功后再上传和确认下一句。 文件上传后,调用“提交语音训练任务”接口,启动审核和训练。 调用方法
desc:降序 默认asc升序。 robot_id 是 String 机器人ID。 language 否 String 智能交互语言 CN:中文 EN:英文 请求参数 表3 请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token 否 String 用户Token。使用Token鉴权方式时必选。
1-100 默认取值: 10 robot_id 是 String 应用ID。 language 否 String 智能交互语言 CN:中文 EN:英文 请求参数 表3 请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token 否 String 用户Token。使用Token鉴权方式时必选。
能力开放可集成 智能交互端侧Web SDK 形象驱动API 数字人大脑API 数字人能力开放,多种合作模式灵活选择 实名安全认证后,可使用控制台在线自助完成内容制作。 集成数字人API、SDK至企业自建平台。 联合专业直播服务伙伴,定制场景化解决方案,实现数字人直播系统交付和运营专业支持。
language 否 String 智能交互语言 zh_CN:简体中文(已下线,请使用CN) en_US:英语(已下线,请使用EN) CN:中文 EN:英文 响应参数 状态码:200 表4 响应Header参数 参数 参数类型 描述 X-Request-Id String 请求ID。 表5 响应Body参数
1-100 默认取值: 10 robot_id 是 String 应用ID。 language 否 String 智能交互语言 CN:中文 EN:英文 pacify_words_type 否 Integer 安抚话术类型 说明: 0:通用安抚话术, 1:基于意图匹配安抚话术 取值范围: 0-32
CONTINUUM:连读 ALIAS:别名 SAY_AS:数字/英文的读法。不同value值有不同的读法,详情如下所示。 数字的读法包括: date:读日期 number:读数字 figure:读数值 telephone:读电话 英文的读法包括: spell:读字母 english:读单词