检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
ebsocket连接。 连接建立成功后,MetaStudio智能交互服务已准备就绪,会发送START_CHAT命令给第三方应用。第三方应用接收到START_CHAT命令后,用户开始发送文本驱动命令。 详细交互流程如下所示: 用户请求建立与数字人对话的WebSocket连接。 代码示例如下所示:
> 分身名片”页面。 用户在控制台进行智能交互操作,生成的对话项目和技能,会展示在“我的创作 > 智能交互”页面。 一类是通过本地上传或者接收资产管理员转移的资产生成的,会展示在“我的创作 > 资源”页面。 父主题: 资产管理
因素。这个改革是想减轻学生的学业压力,让他们能更全面地发展。 因为互联网技术的发展,网络教育在中国越来越受欢迎。 更多的学校和教育机构提供在线课程和远程学习平台,让学生能灵活选择时间和地点学习。 网络教育还给偏远地区和弱势群体提供了更多平等的教育机会。 STEM教育是中国教育改革的重要话题。
普通观看方,可选择原始视频流或者数字人动画视频流观看 INFERENCE_USER: 数字人推理端用户。从RTC房间接收音频流,并推送视频流到RTC房间 END_USER: 端侧用户。从推送音频流到RTC房间,并从RTC房间接收视频流 user_id String RTC用户ID。 signature String
普通观看方,可选择原始视频流或者数字人动画视频流观看 INFERENCE_USER: 数字人推理端用户。从RTC房间接收音频流,并推送视频流到RTC房间 END_USER: 端侧用户。从推送音频流到RTC房间,并从RTC房间接收视频流 user_id String RTC用户ID。 signature String
普通观看方,可选择原始视频流或者数字人动画视频流观看 INFERENCE_USER: 数字人推理端用户。从RTC房间接收音频流,并推送视频流到RTC房间 END_USER: 端侧用户。从推送音频流到RTC房间,并从RTC房间接收视频流 user_id String RTC用户ID。 signature String
播报内容生成后,单击右侧的“试听”,可以试听播报效果。 语音上传:本地录制音频后上传。音频格式需要为WAV或MP3格式,音频大小不超过20MB,时长不超过5分钟。 在线录音:在线录制音频。录音时长不能超过5分钟,为保证音频生成的效果,请保持录音环境安静无噪音。支持试听录制生成的语音。 文本驱动:通过输入文本,选
获取语音训练任务审核结果 20次/秒 10次/秒 10次/秒 设置任务批次 10次/秒 3次/秒 3次/秒 确认在线录音结果 10次/秒 3次/秒 3次/秒 获取在线录音确认结果 20次/秒 10次/秒 10次/秒 语音合成管理 创建TTS试听任务 5次/秒 3次/秒 3次/秒 获取TTS试听文件
获取语音训练任务审核结果 20次/秒 10次/秒 10次/秒 设置任务批次 10次/秒 3次/秒 3次/秒 确认在线录音结果 10次/秒 3次/秒 3次/秒 获取在线录音确认结果 20次/秒 10次/秒 10次/秒 语音合成管理 创建TTS试听任务 5次/秒 3次/秒 3次/秒 获取TTS试听文件
播报内容生成后,单击右侧的“试听”,可以试听播报效果。 语音上传:本地录制音频后上传。音频格式需要为WAV或MP3格式,音频大小不超过20MB,时长不超过5分钟。 在线录音:在线录制音频。录音时长不能超过5分钟,为保证音频生成的效果,请保持录音环境安静无噪音。支持试听录制生成的语音。 文本驱动:通过输入文本,选
华为云提供了MetaStudio服务端SDK,您可以直接集成服务端SDK来调用MetaStudio的相关API,从而实现对MetaStudio服务的快速操作。 在线生成SDK代码 API Explorer能根据需要动态生成SDK代码功能,降低您使用SDK的难度,推荐使用。 您可以在API Explor
图片、产品视频、企业logo、添加文字贴图背景音乐等编辑功能。 目前已经支持桌面端、移动端安卓iOS都可以直接下载使用。 在九月,还将上线在线端,到时候只需要打开浏览器就可以制作数字人视频。 我们可以看一些视频案例,以下这是视频都是利用万兴播爆数字人生成的营销视频,大家可以看看,整体效果还是蛮不错的,我们边看边聊~
资产冻结说明,如表2所示。 表2 资产冻结说明 场景 操作说明 服务冻结租户资产 MetaStudio服务对租户资产内容的风险有一定连带责任。如果服务接收到资产内容投诉,按照国家相关部门要求,会冻结违规违规资产。情节严重的,还会冻结租户的全部资源。 被冻结的资产不能用作内容生成的素材。租户可以删除被冻结的资产或者申请解冻资产。
-manage/user/training-segment 确认在线录音结果 GET /v1/{project_id}/voice-training-manage/user/training-segment 获取在线录音确认结果 语音合成管理 表27 语音合成管理接口 接口 说明
普通观看方,可选择原始视频流或者数字人动画视频流观看 INFERENCE_USER: 数字人推理端用户。从RTC房间接收音频流,并推送视频流到RTC房间 END_USER: 端侧用户。从推送音频流到RTC房间,并从RTC房间接收视频流 user_id String RTC用户ID。 signature String
停止说话(注:接口已重命名为stopUserSpeak,请直接切换至新接口)。 × √ stopUserSpeak 用户停止提问(注:此处只是停止ASR接收用户语音,对话仍处于激活态)。 × √ unmuteRemoteAudio 数字人取消静音。 √ √ activeInteractionMode
能力开放可集成 智能交互端侧Web SDK 形象驱动API 数字人大脑API 数字人能力开放,多种合作模式灵活选择 实名安全认证后,可使用控制台在线自助完成内容制作。 集成数字人API、SDK至企业自建平台。 联合专业直播服务伙伴,定制场景化解决方案,实现数字人直播系统交付和运营专业支持。
法的直播内容。 如果租户已对接其他内容风控系统,且承诺内容风控自行负责,可提交工单申请关闭MetaStudio服务内容审核功能。 如果服务接收到直播内容投诉,按照国家相关部门要求,会冻结违规的直播间及直播任务。情节严重的,还会冻结租户的全部资源。 父主题: 使用限制
指定的第三方系统或模型,用于识别语义并做出应答,给您提供交互功能。 产品运营和维护 为了保障SDK稳定运行,改善产品的运营策略,SDK会直接收集客户应用调用SDK接口的信息并上传至服务器进行统计分析。处理的个人信息包括应用信息(浏览器User Agent)、SDK接口调用记录。上
创建智能交互对话 功能介绍 该接口用于创建智能交互对话。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/smart-chat-rooms 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID,获取方法请参考获取项目ID。