检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
is_stream 否 Boolean 是否采用流式响应。 默认取值: false chat_rounds 否 Integer 支持的多轮对话数量,取值大于1时,请求第三方语言模型时将携带历史对话信息。 取值范围: 1-10 默认取值: 1 sis_region 否 Integer SIS所在区域
智能交互驱动流程 流程图示例 用户与数字人进行智能交互的流程图示例,如下所示,对应流程的详细说明,如流程图总体说明所示。 智能交互非流式驱动流程图,如图1所示。 智能交互流式驱动流程图,如图2所示。 智能交互驱动打断对话流程图,如图3所示。 智能交互驱动停止对话流程图,如图4所示。
frame_rate 是 Integer 期望的输出帧率 取值范围: 15-120 默认取值: 60 emotion 否 Integer 情绪: 0:平静(默认) 1:开心 2:哀伤 3:愤怒 取值范围: 0-3 默认取值: 0 响应参数 状态码: 202 表3 响应Header参数 参数 参数类型
5倍语速,100表示正常语速,200表示2倍语速。 取值范围: 50-200 默认取值: 100 pitch 否 Integer 音高。 取值范围: 50-200 默认取值: 100 volume 否 Integer 音量。 取值范围: 90-240 默认取值: 140 business_type 否 String
PACKAGE:打包后的资产文件 file_multipart_count 否 Integer ORI4K文件分段上传数量,默认值为1 取值范围: 1-100 默认取值: 1 响应参数 状态码: 200 表4 响应Header参数 参数 参数类型 描述 X-Request-Id String
智能交互客户端SDK 操作前提 SDK概述 SDK下载 Web SDK 父主题: 智能交互
智能交互驱动 前提条件 智能交互驱动流程 智能交互驱动WebSocket接口 父主题: 智能交互
Flexus版数字人仅支持选择“VIDEO_2D”。 默认取值: [VIDEO_2D,LIVE_2D] audio_source_type 否 String 声音来源类型 VIDEO:视频中抽取音频 AUDIO:单独上传的音频 默认取值: VIDEO 表4 ActionBasicSampleInfo
否 Integer 偏移量,表示从此偏移量开始查询。 取值范围: 0-2147483647 默认取值: 0 limit 否 Integer 每页显示的条目数量。 取值范围: 1-100 默认取值: 10 请求参数 无 响应参数 状态码: 200 表3 响应Body参数 参数 参数类型
否 Integer 偏移量,表示从此偏移量开始查询。 取值范围: 0-2147483647 默认取值: 0 limit 否 Integer 每页显示的条目数量。 取值范围: 1-100 默认取值: 10 请求参数 表3 请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token
数。 AUDIO: 语音驱动,需要在资产库中先上传语音资产。语音驱动需要填写introduction_audio_asset_id参数。 默认取值: TEXT introduction_text 否 String 自我介绍文本,用于驱动数字人口型。 voice_asset_id 否
须知: 平台合成的视频按秒记录时长,套餐包以分钟记录时长。所以合成视频的总时长会从秒转化为分钟,保留小数点后两位,末位四舍五入。 当前资源默认置灰,即不支持购买。如需购买,仅支持企业用户联系产品经理或者提交工单开通购买,个人用户不支持。 按需计费 按需预付费套餐包 分身数字人名片制作
数。 AUDIO: 语音驱动,需要在资产库中先上传语音资产。语音驱动需要填写introduction_audio_asset_id参数。 默认取值: TEXT introduction_text 否 String 自我介绍文本,用于驱动数字人口型。 voice_asset_id 否
limit 否 Integer 每页显示的条目数量。 取值范围: 1-100 默认取值: 10 offset 否 Integer 偏移量,表示从此偏移量开始查询。 取值范围: 0-2147483647 默认取值: 0 resource 否 String 资源类型。可填多个,用","分隔。详见资源类型。
语音合成管理 创建TTS试听任务 获取TTS试听文件 创建TTS异步任务 获取TTS异步任务 设置TTS租户级自定义读法配置 获取TTS租户级自定义读法配置 删除TTS租户级自定义读法配置 修改TTS租户级自定义读法配置 语音同步合成WebSocket接口
视频制作 上传图片时提示像素超标怎么办? 贴图支持动态图片吗? PPT如何转为PDF文件? 如何呈现PPT的动画效果? PPT文件解析失败,无法上传怎么办? 上传的PPT支持编辑吗? 视频合成失败如何处理? 如何将WEBM视频转成MOV格式? 合成的视频可以下载至本地吗? 合成视频二次剪辑后,数字人口型效果变差?
用户在奇妙问创建角色的AppSecret。 RoleId 用户在奇妙问创建角色的RoleId。 对话内容合规审核 开启后,自动审核用户提问内容。若存在违禁词,将自动拦截,并返回默认答案。如果关闭,将无法审核用户提问内容。 配置检查 单击“配置检查”,自动检查当前页签配置是否正确,如果有问题,会给出相应提示。 尾静音时长
视频制作限制 分身数字人视频制作限制说明,如表1所示。 表1 视频制作限制 视频制作配置 限制 视频制作剧本 一个视频制作剧本的场景数量不能超过50个。 一个视频制作剧本,仅支持使用一个数字人模型和一个音色模型。 文本驱动 每个单场景输入文字的数量不超过1万字。 所有场景输入文字的数量不超过10万字。
M用户没有权限授权,需要参考开通委托报错如何处理?处理。 对话内容合规审核 开启后,自动审核用户提问内容。若存在违禁词,将自动拦截,并返回默认答案。如果关闭,将无法审核用户提问内容。 配置检查 单击“配置检查”,自动检查当前页签配置是否正确,如果有问题,会给出相应提示。 尾静音时长
对接科大讯飞现网的自然语言模型,具体以“第三方应用”配置的模型为准,可提升应用运行的稳定性。 对话内容合规审核 开启后,自动审核用户提问内容。若存在违禁词,将自动拦截,并返回默认答案。如果关闭,将无法审核用户提问内容。 配置检查 单击“配置检查”,自动检查当前页签配置是否正确,如果有问题,会给出相应提示。 尾静音时长