检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
如需使用热词功能,请开启委托授权。SIS服务用于将用户口述音频转换为文本。 热词 仅开启“委托语言交互服务(SIS)”后,才会展示“热词”配置。 数字人与用户进行智能交互对话时,语音识别不准确的专业词汇,可以作为热词反馈到语音模型,以提高语音识别的准确率。这里仅开启热词功能,实际的热词配置,请参见对话配置。
音驱动的方式说话。 5 数字人支持提供语义理解知识库吗? 不提供语义理解知识库。语义理解是知识库的能力,不是数字人的能力。 智能交互的主要功能是通过数字人与用户进行交互问答,也就是用户提问,数字人说出知识库返回的答案。数字人回答的内容,是由大模型或知识库返回的答案决定的。 6 数字人支持TTS和ASR吗?
音驱动的方式说话。 5 数字人支持提供语义理解知识库吗? 不提供语义理解知识库。语义理解是知识库的能力,不是数字人的能力。 智能交互的主要功能是通过数字人与用户进行交互问答,也就是用户提问,数字人说出知识库返回的答案。数字人回答的内容,是由大模型或知识库返回的答案决定的。 6 数字人支持TTS和ASR吗?
如需使用热词功能,请开启委托授权。SIS服务用于将用户口述音频转换为文本。 热词 仅开启“委托语言交互服务(SIS)”后,才会展示“热词”配置。 数字人与用户进行智能交互对话时,语音识别不准确的专业词汇,可以作为热词反馈到语音模型,以提高语音识别的准确率。这里仅开启热词功能,实际的热词配置,请参见对话配置。
如下特点: 2D模型,通过拍摄真人视频训练生成 无表情&骨骼数据 只能由AI驱动 使用既定表情&动作 剧本、画布和设置 视频制作、视频直播功能,都需要进行视频创作,下面以视频直播为例,进行说明。 视频素材:如图中1区域所示,包括模板、角色、背景、贴图、视频、商品、文本等素材。支持使用预置的,也支持自定义生成。
如需使用热词功能,请开启委托授权。SIS服务用于将用户口述音频转换为文本。 热词 仅开启“委托语言交互服务(SIS)”后,才会展示“热词”配置。 数字人与用户进行智能交互对话时,语音识别不准确的专业词汇,可以作为热词反馈到语音模型,以提高语音识别的准确率。这里仅开启热词功能,实际的热词配置,请参见对话配置。
Internal Server Error 表明服务端能被请求访问到,但是不能理解用户的请求。 501 Not Implemented 服务器不支持请求的功能,无法完成请求。 502 Bad Gateway 充当网关或代理的服务器,从远端服务器接收到了一个无效的请求。 503 Service Unavailable
修改欢迎词 功能介绍 该接口用于修改欢迎词。 调用方法 请参见如何调用API。 URI PUT /v1/{project_id}/digital-human-chat/welcome-speech/{welcome_speech_id} 表1 路径参数 参数 是否必选 参数类型 描述
删除TTS租户级自定义读法配置 功能介绍 该接口用于删除TTS租户级自定义读法配置。 调用方法 请参见如何调用API。 URI DELETE /v1/{project_id}/ttsc/vocabulary-configs 表1 路径参数 参数 是否必选 参数类型 描述 project_id
10次/秒 10次/秒 修改欢迎词 4次/秒 3次/秒 3次/秒 删除欢迎词 4次/秒 3次/秒 3次/秒 修改欢迎词功能开关 4次/秒 3次/秒 3次/秒 查询欢迎词功能开关 20次/秒 10次/秒 10次/秒 智能交互数字人热点问题管理 创建热点问题 4次/秒 3次/秒 3次/秒 查询热点问题列表
限进行代运维。 如果华为云账号已经能满足您的要求,不需要创建独立的IAM用户,您可以跳过本章节,不影响您使用MetaStudio服务的其它功能。 本章节为您介绍对用户授权的方法,操作流程如示例流程所示。 前提条件 给用户组授权之前,请您了解用户组可以添加的MetaStudio系统策略,并结合实际需求进行选择。
文本驱动:通过输入文本的方式生成音频。文本支持插入停顿、调整语速,如果是多音字可设置正确的发音,还可以选择不同的声音,试听生成的音频效果。支持开启字幕展示功能。 音频驱动:从本地上传音频文件,作为视频的语音。音频驱动方式,仅支持中文普通话的场景下能开启字幕。 还可以设置音频的音量,和调整画布的横竖屏展示。
/SK对请求进行签名,也可以使用专门的签名SDK对请求进行签名。详细的签名方法和SDK使用方法请参见API签名指南。 签名SDK只提供签名功能,与服务提供的SDK不同,使用时请注意。 Token认证 Token的有效期为24小时,需要使用一个Token鉴权时,可以先缓存起来,避免频繁调用。
10次/秒 10次/秒 修改欢迎词 4次/秒 3次/秒 3次/秒 删除欢迎词 4次/秒 3次/秒 3次/秒 修改欢迎词功能开关 4次/秒 3次/秒 3次/秒 查询欢迎词功能开关 20次/秒 10次/秒 10次/秒 智能交互数字人热点问题管理 创建热点问题 4次/秒 3次/秒 3次/秒 查询热点问题列表
行互动内容插播。插播结束后,继续播报原有内容。 真人接管 单击“真人接管”,开启真人接管功能。数字人停止发声,仅保留动作,改由真人发声。 真人发声结束后,单击“取消真人接管”,关闭真人接管功能,继续播报原有内容。 暂停 单击“暂停”,暂停播报。 单击“继续”,可恢复播报。 停止 单击“停止”,关闭当前直播。
查询欢迎词列表 功能介绍 该接口用于查询欢迎词列表。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/digital-human-chat/welcome-speech 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String
查询欢迎词详情 功能介绍 该接口用于查询欢迎词详情。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/digital-human-chat/welcome-speech/{welcome_speech_id} 表1 路径参数 参数 是否必选 参数类型
创建欢迎词 功能介绍 该接口用于创建欢迎词。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/digital-human-chat/welcome-speech 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String
创建第三方直播平台 功能介绍 该接口用于创建第三方直播平台。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/live-platforms/platforms 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String
修复多次调用create接口报错的问题。 2024-03-15 本次变更如下: 新增发布1.1.0版本SDK,相比1.0.0版本,新增如下功能: 支持英文版智能交互。 增加热点问题开关,可以控制是否显示热点问题,详情请参考create中config参数配置或setConfig。