检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
environment variables CLOUD_SDK_AK and CLOUD_SDK_SK in the local environment ak = os.environ["CLOUD_SDK_AK"] sk = os.environ["CLOUD_SDK_SK"]
新增直播任务管理接口。 2023-08-07 第二次正式发布 本次变更如下: 更新3个接口的请求参数和响应参数,包括:查询资产列表、查询资产详情和获取语音驱动数据接口。 2022-12-27 第一次正式发布。
&languageSisHotWords, } hotWordsTypeHotWordsType:= model.GetHotWordsTypeEnumHotWordsTypeEnum().SIS request.Body = &model.CreateHotWordsReq{ SisHotWords:
参数类型 描述 script_type 否 String 参数解释: 脚本类型,即视频制作的驱动方式 约束限制: 不涉及 取值范围 TEXT: 文本驱动,即通过TTS合成语音 AUDIO: 语音驱动 默认取值: TEXT text_config 否 TextConfig object 讲解词配置。
默认取值: false model_version String 参数解释: 分身数字人模型版本 约束限制: 不涉及 取值范围: V2: V2版本模型 V3:V3版本模型 V3_2:V3.2版本模型 默认取值: V2 model_resolution String 参数解释: 分身数字人模型分辨率。
默认取值: false model_version 否 String 参数解释: 分身数字人模型版本 约束限制: 不涉及 取值范围: V2: V2版本模型 V3:V3版本模型 V3_2:V3.2版本模型 默认取值: V2 model_resolution 否 String 参数解释: 分身数字人模型分辨率。
更多编程语言的SDK代码示例,请参见API Explorer的代码示例页签,可生成自动对应的SDK代码示例。 状态码 状态码 描述 200 处理成功返回。 400 请求传参异常,包含错误码及对应描述。 错误码 请参见错误码。 父主题: 智能交互数字人应用管理
智能交互 智能交互管理 智能交互驱动 智能交互第三方LLM回调 智能交互客户端SDK
附录 状态码 错误码 获取项目ID 获取账号ID 直播控制HTTP Command命令说明 直播控制RTSA Command命令说明 文本驱动SSML定义 系统资产标签定义 服务支持的字体 资源类型 使用Java代码生成文件内容的MD5值 获取音色ID
关联租户已完成实名认证:单击进入实名认证。 关联租户提供项目ID给SP用户,获取项目ID的方法请参见获取项目ID。 关联租户提供的项目ID对应Region,必须与SP用户申请成为SP用户时,提供的项目ID对应Region保持一致。 操作步骤 使用SP用户登录华为云控制台,单击界面左上角的图标,在弹出的服务列表界面中,搜索并单击“数字内容生产线
音频制作区域,可选择下述1种方式生成音频。 文本驱动:通过输入文本的方式生成音频。文本支持插入停顿、调整语速,如果是多音字可设置正确的发音,还可以选择不同的声音,试听生成的音频效果。支持开启字幕展示功能。 音频驱动:从本地上传音频文件,作为视频的语音。音频驱动方式,仅支持中文普通话的场景下能开启字幕。
完成web界面开发。操作请参考创建智能交互数字人(华为云CBS)。 用户购买非华为的LLM或者大模型,当前支持科大讯飞AIUI通用语义模型及星火大模型、出门问问的数字人平台。 科大讯飞对接至智能交互服务,开发者基于SDK完成web界面开发,操作请参考创建智能交互数字人(科大讯飞)。
更多编程语言的SDK代码示例,请参见API Explorer的代码示例页签,可生成自动对应的SDK代码示例。 状态码 状态码 描述 200 处理成功返回。 400 请求传参异常,包含错误码及对应描述。 错误码 请参见错误码。 父主题: 智能交互数字人知识库意图管理
更多编程语言的SDK代码示例,请参见API Explorer的代码示例页签,可生成自动对应的SDK代码示例。 状态码 状态码 描述 200 处理成功返回。 400 请求传参异常,包含错误码及对应描述。 错误码 请参见错误码。 父主题: 智能交互数字人知识库问法管理
当前未启用 3D数字人 照片建模 个 modeling_count - 语音驱动 分钟 ttsa_content_time - 视觉驱动 分钟 visual_motion_capture_time - 视觉驱动 路 periodic_concurrency_number - 声音合成
开始播放剧本。 默认取值: true play_mode String 参数解释: 驱动方式。 约束限制: 不涉及。 取值范围: TEXT:文本驱动,即通过TTS合成语音。 AUDIO:语音驱动。 NO_PRESET:无预置剧本,人工控制模式。 默认取值: TEXT random_play_mode
取到账号ID。具体获取步骤如下: 登录管理控制台。 鼠标悬停在右上角的用户名,选择下拉列表中“我的凭证”。 在“API凭证”页面,即可获取对应的账号ID信息。 图1 获取账号ID 父主题: 附录
直播间配置 限制 文本驱动 每个单场景中所有段落输入文字的总量需大于200字。 每个段落的文本字符数量需小于2000,如果包含语音合成标记语言SSML标签,需小于3000。 整个直播间所有段落的文本总字符数,如果包含语音合成标记语言SSML标签时,需小于30万。 音频驱动 每个单场景上传
environment variables CLOUD_SDK_AK and CLOUD_SDK_SK in the local environment ak = os.environ["CLOUD_SDK_AK"] sk = os.environ["CLOUD_SDK_SK"]
environment variables CLOUD_SDK_AK and CLOUD_SDK_SK in the local environment ak = os.environ["CLOUD_SDK_AK"] sk = os.environ["CLOUD_SDK_SK"]