检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
创建智能交互数字人 介绍如何在MetaStudio平台创建智能交互数字人,实现用户和数字人进行交互对话。相应的场景说明,请参考场景说明。 前提条件 已配置完成第三方应用,示例如创建智能交互数字人(科大讯飞)所示。 操作步骤 登录MetaStudio控制台,单击“智能交互”,如图1所示。
视频直播 提示模板不可用怎么办? 直播业务媒体流如何应对防火墙限制? 第三方平台的直播画面不清晰怎么办? 第三方平台的直播画面突然中断是怎么回事? 第三方平台的直播画面没有声音怎么办?
需计费。 如需使用第三方声音进行语音合成,请购买出门问问声音套餐,操作请参考《用户指南》的“购买出门问问声音套餐”章节。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/ttsc/async-jobs 表1 路径参数 参数 是否必选 参数类型
分段设置 选择文字分段的方式。 包含如下选项: 自动分段:自动对文档进行分段处理。单击“自动分段”,“分段预览”区域会展示自动分段后的文本效果。 手动分段:自定义分隔符和分隔长度的方式,对文档进行分段处理。 索引配置 配置索引的类型。 包含如下选项: 标准版 高配版 单击“保存”。
口确认语音和文本内容是否一致。确认成功后再上传和确认下一句。 文件上传后,调用“提交语音训练任务”接口,启动审核和训练。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/voice-training-manage/user/basic-jobs
提交训练的视频需要保留录制时的原声。 若对素材进行后处理,导出时请确保帧率与原视频保持一致。 时长 视频时长通常为5~6分钟。请勿剪辑视频长度,确保讲述视频、静默、手势,一起导出至同一个视频中。 美颜 如需对视频进行美颜等处理,确认美颜效果后,检查素材,确保不存在变形、模糊、晃动等情况,可提交训练视频。
口确认语音和文本内容是否一致。确认成功后再上传和确认下一句。 文件上传后,调用“提交语音训练任务”接口,启动审核和训练。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/voice-training-manage/user/middle-jobs
S_FAILED、JOB_SUCCESS、WAIT_USER_CONFIRM、JOB_REJECT、JOB_FINISH 调用方法 请参见如何调用API。 URI DELETE /v1/{project_id}/digital-human-training-manage/user/jobs/{job_id}
一致,建议将PPT转存为PDF文件后再导入。 操作详情请参考PPT如何转为PDF文件?。 如果PPT中有动画、动效,是不支持在MetaStudio控制台展示的,建议将PPT导出为视频后再导入。 操作详情请参考如何在MetaStudio控制台呈现PPT的动画效果?。 父主题: 使用限制
00:00-12:00,生效日期为2024年9月27日。 产品价格调整完成后,新购买的客户可直接使用新价格下单。已有下单用户,需联系客户经理或提交工单给我们处理。 请您及时关注新的计费价格及余额变动,并及时做出业务调整。若您有任何疑问,可直接联系客户经理或提交工单给我们。衷心感谢各位用户对本产品的信赖与支持!
状态码 返回值 说明 200 OK 请求正常。 201 Created 创建类的请求完全成功。 202 Accepted 已经接受请求,但未处理完成。 204 No Content 请求完全成功,同时HTTP响应不包含响应体。 400 Bad Request 非法请求。 建议直接修改该请求,不要重试该请求。
绿幕视频文件等内容。如果存在多个问题,可以单击界面右上角的“添加问题”,增加多个问题描述。问题全部添加完成后,单击“确认”,等待服务管理员处理。 用户也可以单击“定制任务详情”页面左上方的“返回”,回到任务列表界面,通过任务列表右侧的“同意”或“驳回”实现数字人形象的验收操作。 图2
算法运行机制 选择一段真人视频。 输入真人视频,经过平台专家安全审核通过,且用户授权使用后,由训练人员选取真人视频中符合要求的视频进行预处理。预处理完成后,进行深度学习训练,生成该真人形象的数字人驱动模型。 推理阶段输入一段音频。 音频输入至数字人驱动模型后,经过模型推理生成数字人形象播报视频。
它们可以帮助您记住重要事项、日程安排,并提醒您及时处理。 它们能够回答您的问题、提供天气预报、播放音乐等各种娱乐功能。 无论您身处何地,只需一声令下,机器人将立即响应,提供真正个性化的服务。 智慧管家可以通过语音识别和自然语言处理技术,与您或家人进行交互和对话。 您只需对它说出您的需求,它就会立刻执行。
如果使用服务提供SDK默认样式,受限于浏览器的CSP策略,导入图片、视频链接的域名,需提交工单添加至白名单。 表1 问答知识库 序号 标准问题 问题答案 1 如何领券? <img src="https:///test.example.com.com/AI-POC/3/领券二维码.jpg" /> 富媒体展示效果(SDK默认展示方式)
条通知的text值拼接在一起才是完整的内容。 文本问答的用法 智能交互默认是语音问答,如需使用文本问答,需要切换模式。可以通过下述2种方式处理: 在开始对话时设置。使用startChat接口开启对话时,设置成文本问答模式,如下所示: const { result } = await
c36274be@wx123456789", "is_end": false } 错误码 表4 错误码 状态码 错误码 错误信息 描述 处理措施 400 MSS.20050053 没有额度 声音合成未开启按需付费。 声音合成开启按需付费。 401 MSS.20050023 websocket接口鉴权失败
让您可以尽享科技的奇迹,轻松体验畅快无比的运行速度和极致的使用感受。 201. 首先,这款家用机器人搭载了强大的处理器和计算能力。 202. 处理器是机器人的大脑,能够快速处理各种数据和指令,使得机器人能够迅速响应您的各种需求。 203. 同时,高效的计算能力使得机器人能够轻松应对复
媒体服务地址为空,请联系技术人员进行问题定位及处理 MSS.47015012 Media negotiation failed. Contact technical support to locate and rectify the fault. 媒体协商失败,请联系技术人员进行问题定位及处理 90000001
界面左侧是定制分身数字人的数据上传界面。 界面右侧上方,展示分身数字人定制流程。下方展示训练视频拍摄指导和样例视频,包括:拍摄前准备、拍摄中操作和拍摄后处理,有效指导用户拍摄生成一段完整可用的训练视频,用于训练生成分身数字人。 图1 定制数字人形象 上传分身数字人训练数据。 界面操作详情,如表1所示。