检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
接口驱动数字人的方案,是不支持websdk内置语音唤醒能力的)。预制的唤醒能力支持使用“你好云笙”、“稍等一下”、“谢谢再见”三个唤醒词,进行数字人唤醒、打断和退出。 可以通过调用create接口,设置接口参数param中config里的enableLocalWakeup参数来开启Web语音唤醒能力。
SDK下载 SDK名称 SDK包 开发者 个人信息处理规则 合规使用指南 HwICSUiSDK 参见表2下载链接 华为云计算技术有限公司 SDK如何处理个人信息请参见SDK隐私声明 您集成和使用我们的SDK时需要遵从个人信息保护基本要求,详情请参见SDK合规使用指南。 表2 Web SDK下载
2所示。 表2 问答对样例 序号 主题 所有问法 数字人回答(2000) 关键词(可选) 1 自动驾驶的优势 自动驾驶领域的优势有哪些? 如何帮助客户快速构建安全合规的自动驾驶研发平台? 自动驾驶具备安全合规、数据管理高效、算法训练高效、生态开放等优势。 华为云|自动驾驶 图3 技能编辑页面
新增设备人设,并在应用中启用人设。 目前仅支持开启“播报类”的闲聊技能,即有“播报类”标识的技能。 模拟测试:在应用配置界面的“模拟测试”区域输入用户问题,进行用户问题模拟,查看对话效果。 (可选)新增English情景模式:前面的所有操作,都是main情景模式下的配置,如果对话配置时,语言选择“
interactionModeSwitch({ interactionMode: 'TEXT' }); 切换至文本问答模式后,就可以通过接口sendTextQuestion进行文本问答了。 数字人主动播报与文本问答的区别是什么? 智能交互同时支持数字人主动播报和文本问答两种能力,两者都是通过文字驱动数字人讲话。 区别如下所示:
单击“提交制作”。 数据上传完成后,界面提示“制作任务提交成功!”,如图2所示。 数字人定制任务提交成功后,会在1个工作日内完成审核。任务审核通过后,才能进行算法训练,会在3个工作日内训练完成并生成数字人。 图2 制作任务提交成功 用户可以单击“查看制作任务列表”,进入分身数字人定制任务列表页面,如图所示。
单击“提交制作”。 数据上传完成后,界面提示“制作任务提交成功!”,如图2所示。 数字人定制任务提交成功后,会在1个工作日内完成审核。任务审核通过后,才能进行算法训练,会在3个工作日内训练完成并生成数字人。 图2 制作任务提交成功 用户可以单击“查看制作任务列表”,进入分身数字人定制任务列表页面。
直播间内容审核 MetaStudio服务内容审核说明,如下所示: 默认会对直播间的各个配置项,如直播间名称、描述、文本、音频、视频、图片等内容进行机器审核。以排除内容违规风险,避免生成不合法的直播内容。 如果租户已对接其他内容风控系统,且承诺内容风控自行负责,可提交工单申请关闭MetaStudio服务内容审核功能。
ub> 属性 表4 属性说明 属性名称 属性类型 属性值 是否必选 描述 alias String 替代词语 是 将标记的内容替换为此值进行阅读。 标签关系 可以包含文本,不可以包含其他标签。 示例 实际阅读为“保罗”。 1 <sub alias="保罗">Paul</sub>是德国人
单击“提交制作”。数据上传完成后,界面提示“制作任务提交成功!”,如图3所示。 数字人定制任务提交成功后,会在1个工作日内完成审核。任务审核通过后,才能进行算法训练,会在3个工作日内训练完成并生成数字人。 图3 制作任务提交成功 Flexus分身数字人训练任务提交后,会同时生成一个Flexus分身数字人训练任务和声音制作任务。
S_FAILED、JOB_SUCCESS、WAIT_USER_CONFIRM、JOB_REJECT、JOB_FINISH 调用方法 请参见如何调用API。 URI DELETE /v1/{project_id}/digital-human-training-manage/user/jobs/{job_id}
m4a,主文件大小不超过100M 幻灯片资产:资产类型为PPT,主文件格式(忽略大小写)为ppt、pptx和pdf,主文件大小不超过100M 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/digital-assets 表1 路径参数 参数 是否必选 参数类型 描述
详细操作为:单击“声音合成”卡片中的“去开通”,在弹出的“开通按需计费服务提示”对话框中,勾选同意协议。单击“确定”,开通按需计费。开通后的效果如图1所示。 如需使用第三方声音进行语音合成,请购买出门问问声音套餐。 图1 声音合成 功能介绍 该接口用于TTS流式合成音频,用于文本转化为语音,并实时返回合成的音频数据。
口确认语音和文本内容是否一致。确认成功后再上传和确认下一句。 文件上传后,调用“提交语音训练任务”接口,启动审核和训练。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/voice-training-manage/user/middle-jobs
媒体服务地址为空,请联系技术人员进行问题定位及处理。 MSS.47015012 Media negotiation failed. Contact technical support to locate and rectify the fault. 媒体协商失败,请联系技术人员进行问题定位及处理。
口确认语音和文本内容是否一致。确认成功后再上传和确认下一句。 文件上传后,调用“提交语音训练任务”接口,启动审核和训练。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/voice-training-manage/user/basic-jobs
绝对路径为完整的HTTP文件资源路径。 initModel 否 true boolean 是否直接初始化唤醒模型。 初始化唤醒模型需要2~3s的加载时间,这段时间无法进行其他操作,所以需要根据实际情况选择模型初始化的时间点,详细说明如下所示: 如果为true,会在接口执行时,初始化模型。 如果为false,会在数字人创建过程中,初始化模型。