检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
String 热词类型。 说明: SIS:使用的语音识别服务为SIS时选此类型 vocabulary_id String 热词ID(sis中配置)。 sis_project_id String SIS服务所在区域projectId region Integer 对接SIS服务的区域。
String 热词类型。 说明: SIS:使用的语音识别服务为SIS时选此类型 vocabulary_id String 热词ID(sis中配置)。 sis_project_id String SIS服务所在区域projectId region Integer 对接SIS服务的区域。
五、最小化使用功能要求 我们的SDK针对扩展功能和可选的个人信息的处理提供了配置能力,您可以基于业务诉求选择开启或关闭相关功能。 1. 如何开启或关闭扩展功能 您可以通过setConfig或者create接口配置开启或关闭字幕、语音交互等扩展功能,以为您提供字幕、语音交互等服务。 2
0版本,新增如下功能: 支持英文版智能交互。 增加热点问题开关,可以控制是否显示热点问题,详情请参考create中config参数配置或setConfig。 如果打开开关,需要智能交互任务已配置热点问题。 2024-01-30 第一次正式发布。 父主题: Web SDK
访问科大讯飞的AIUI开放平台。 单击界面上方的“技能工作室”。进入“技能控制台”页面,如图7所示。 图7 技能控制台 单击“创建技能”,弹出如图8所示的对话框。 参数配置说明,如下所示: 技能名称:技能名称。必须与MetaStudio服务创建的技能一一对应,如6所示。为方便识别和记忆,两边的技能名称可以设置成一样的。
线(激活状态资产可用、管理员可用) 默认取值: 不涉及。 review_config 否 ReviewConfig object 内容审核配置 tags 否 Array of strings 参数解释: 标签列表。 说明: 分身形象系统资产的tag定义如下: 行业:NEWS,BUSINESS
签,筛选展示所有的分身模型资产。 找到需要转移的资产,单击资产右下角的,从下拉框中选择“转移”,弹出“资产转移”对话框,如图2所示。 参数配置说明,如表1所示。 图2 资产转移 表1 参数说明 参数 说明 用户账号 需要接收资产的租户,其所在Region的项目ID,获取方法请参见获取项目ID。
String 性别。 MALE:男性 FEMALE:女性 review_config 否 ReviewConfig object 内容审核配置 callback_config 否 CallBackConfig object 回调设置。 表4 BusinessCardTextConfig
operate_time String 操作时间,格式遵循:RFC 3339。 例 “2020-07-30T10:43:17Z” log_type String 命令执行结果。 USER_CREATE_JOD:用户开始分身数字人定制 USER_VERIFYING_SUBMITTED:用户提交审核 SYS
String 第三方用户ID。不允许输入中文。 表3 请求Body参数 参数 是否必选 参数类型 描述 action 是 String 批量操作命令. DELETE:删除 DELETE_FORCE:强制删除,该模式会立即删除资产 RESTORE:恢复 UNACTIVE:取消激活 ACTIVE:激活
智能交互中数字人分身的动作是根据数字分身拍摄形象训练生成的,唇形和文字声音匹配,数字分身和背景融合自然,清晰度1080P。 智能交互根据客户需要,后台提供多种知识库配置,支持配置中英双语。 智能交互基于已有训练生成的数字分身形象模型和声音模型,结合知识库,可与用户进行实时对话。 用户购买路数越多,同时进行数字人交互对话的数量则越多。
NORMAL_MODEL: 普通模型。 默认取值: 不涉及。 review_config 否 ReviewConfig object 内容审核配置。 tags 否 Array of strings 参数解释: 标签列表。 说明: 分身形象系统资产的tag定义如下: 行业:NEWS,BUSINESS
字符长度0-64位。 默认取值: 不涉及。 model_properties HumanModelMetaProperties object 记录模型配置信息 components Array of ComponentInfo objects 可替换组件列表。 表7 HumanModelMetaProperties
String 数字人名片制作结束时间。 output_asset_config OutputAssetInfo object 输出资产信息配置。 error_info ErrorResponse object 错误信息。 create_time String 任务创建时间。 lastupdate_time
String 性别。 MALE:男性 FEMALE:女性 review_config 否 ReviewConfig object 内容审核配置 callback_config 否 CallBackConfig object 回调设置。 表4 BusinessCardTextConfig
//IAM用户名 "password": $ADMIN_PASS, //IAM用户密码,建议在配置文件或者环境变量中密文存放,使用时解密,确保安全 "domain": {
预置音色ID列表 系统预置自研音色ID列表,如表1所示。 表1 预置音色ID列表 音色名称(中文) 资产ID(华东-上海一) 资产ID(华北-北京四) 音色名称(英文) 资产ID(亚太-新加坡) 云歌 075494c45b5aef529d55cd2a456e6076 0a4b54
智能交互第三方LLM回调接口 功能介绍 MetaStudio智能交互服务支持开发者自定义数字人大脑(即第三方LLM)。当用户与数字人对话时,将触发调用该接口,由该接口返回问题对应的答案文本内容。 签名计算方法 第三方LLM自定义接口,使用HMACSHA256签名模式,需要在URL
数字人直播更真实、更沉浸 支持持物直播、实景直播、弹幕智能互动、真人随时接管,让数字人直播更真实、更沉浸。 支持数字人直播矩阵式管理,高级策略配置管理直播更灵活。 实时智能交互,提升客户满意度和品牌形象 开放的Web SDK及API可快速集成到第三方业务系统,实现AI数字员工问答、服务、陪练等场景任务。
视频制作限制 分身数字人视频制作限制说明,如表1所示。 表1 视频制作限制 视频制作配置 限制 场景 一个视频草稿的场景数量不能超过50个。 文本驱动 每个单场景输入文字的数量不超过1万字。 所有场景输入文字的数量不超过10万字。 每个单场景如果包含语音合成标记语言SSML标签,文字数量需小于128K。