检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
字人资产管理、视频制作、视频直播、智能交互等功能。 API文档 API概览 API接口 04 SDK 数字内容生产线服务提供Java、Python、Go语言的SDK,并提供丰富的代码示例,帮助您轻松完成二次开发。 服务端SDK文档 SDK概述 02 使用 MetaStudio提供
数字人主动播报与文本问答的区别是什么? 智能交互同时支持数字人主动播报和文本问答两种能力,两者都是通过文字驱动数字人讲话。 区别如下所示: 主动播报:主动播报是直接将sendDrivenText接口传入的文本作为数字人播报内容,来驱动数字人讲话。 文本问答:文本问答是使用sendTextQuestion接口输
3D数字人语音驱动 创建语音驱动任务 2次/秒 2次/秒 - 获取语音驱动任务列表 20次/秒 10次/秒 - 创建语音驱动表情动画任务 2次/秒 2次/秒 - 获取语音驱动表情数据 20次/秒 10次/秒 - 获取语音驱动数据 20次/秒 10次/秒 - 3D数字人视频驱动 创建视频驱动任务
音频制作区域,可选择下述1种方式生成音频。 文本驱动:通过输入文本的方式生成音频。文本支持插入停顿、调整语速,如果是多音字可设置正确的发音,还可以选择不同的声音,试听生成的音频效果。支持开启字幕展示功能。 音频驱动:从本地上传音频文件,作为视频的语音。音频驱动方式,仅支持中文普通话的场景下能开启字幕。
全局、删除等操作。还支持设置大小,拖动位置。 视频直播画面创作完成后,请根据实际情况,选择下述一种直播剧本驱动方式。 “剧本驱动”包含3种方式: 文本驱动 需要通过文本驱动数字人说话。支持下述2种方式,增加文本内容。 直接在各个场景的段落框中输入文本内容。可单击图标,新增更多的段落。
introduction_type String 自我介绍驱动方式。 TEXT: 文本驱动,即通过TTS合成语音 AUDIO: 语音驱动,需要在资产库中先上传语音资产 默认取值: TEXT introduction_text String 自我介绍文本,用于驱动数字人口型。 voice_asset_id
3D数字人语音驱动 创建语音驱动任务 2次/秒 2次/秒 - 获取语音驱动任务列表 20次/秒 10次/秒 - 创建语音驱动表情动画任务 2次/秒 2次/秒 - 获取语音驱动表情数据 20次/秒 10次/秒 - 获取语音驱动数据 20次/秒 10次/秒 - 3D数字人视频驱动 创建视频驱动任务
智能交互 智能交互管理 智能交互驱动 智能交互第三方LLM回调 智能交互客户端SDK
建立WebSocket连接,实现用户与数字人对话,详见智能交互驱动。 图2 操作流程图 单击“确定”,创建应用,创建效果如图3所示。 可单击“修改”,修改配置。 图3 互动问答 (可选)单击“对话配置”页签,配置对话,详细操作请参考对话配置。 单击“发布设置”页签,参考表2配置参数。 表2 发布设置 参数 说明
String 参数解释: 脚本类型,即视频制作的驱动方式 约束限制: 不涉及 取值范围 TEXT: 文本驱动,即通过TTS合成语音 AUDIO: 语音驱动 默认取值: TEXT text_config TextConfig object 讲解词配置。 audio_drive_action_config
创建语音驱动表情动画任务 GET /v1/{project_id}/fas-jobs/{job_id} 获取语音驱动表情数据 GET /v1/{project_id}/ttsa-jobs/{job_id} 获取语音驱动数据 3D数字人视频驱动 表31 3D数字人视频驱动接口 接口
附录 状态码 错误码 获取项目ID 获取账号ID 直播控制HTTP Command命令说明 直播控制RTSA Command命令说明 文本驱动SSML定义 系统资产标签定义 服务支持的字体 资源类型 使用Java代码生成文件内容的MD5值 预置音色ID列表 查询音色ID
BUSINESS_CARD_2D:分身数字人名片 PICTURE_2D:照片数字人视频 MODELING_3D:3D照片建模 VDS_3D:3D视觉驱动 TTSA_3D:3D语音驱动 FLEXUS_2D:FLEXUS版本资源 请求参数 表3 请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token
Github地址 参考文档 JAVA huaweicloud-sdk-java-v3 Java SDK使用指导 Python huaweicloud-sdk-python-v3 Python SDK使用指导 Go huaweicloud-sdk-go-v3 Go SDK使用指导 PHP hu
没有权限访问技能配置 没有权限访问技能配置 访问本租户下的技能配置 403 MSS.47010028 没有权限访问问答对配置 没有权限访问问答对配置 访问本租户下的问答对配置 403 MSS.47010031 没有权限访问问法配置 没有权限访问问法配置 访问本租户下的问法配置 403 MSS
智能交互SDK从哪里下载? 下载地址,详见下载SDK安装包。 父主题: API和SDK使用
用于互动回复。数字人不变,背景不变。params结构定义:PlayTextInfo。 INSERT_PLAY_AUDIO:插入驱动音频。用于音频直接驱动。数字人不变,背景不变。params结构定义:PlayAudioInfo。 REWRITE_PLAY_SCRIPT:动态编辑未播
当前未启用 3D数字人 照片建模 个 modeling_count - 语音驱动 分钟 ttsa_content_time - 视觉驱动 分钟 visual_motion_capture_time - 视觉驱动 路 periodic_concurrency_number - 声音合成
String 参数解释: 脚本类型,即视频制作的驱动方式 约束限制: 不涉及 取值范围 TEXT: 文本驱动,即通过TTS合成语音 AUDIO: 语音驱动 默认取值: TEXT text_config TextConfig object 讲解词配置。 audio_drive_action_config
对下载的SDK安装包进行完整性校验,判断下载过程是否存在篡改和丢包现象。 操作步骤 参考下载SDK安装包,下载SDK安装包至本地。 打开本地命令运行程序,输入如下命令,在本地生成SDK安装包的SHA256值。 其中,“D:\HwICSUiSdk-1.0.0.zip”为SDK安装包的本地