检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
应该如何解决的呢? 图2 文本驱动 文本内容的操作说明如表1所示。 不同声音模型对表1中操作的支持情况有差异,所以如果表1中操作项置灰,说明当前声音模型不支持此操作。需要重新选择一个支持所需操作的声音模型进行设置。 表1 操作说明 操作 说明 插入停顿 在段落的某个位置,插入换气或者停顿时间,也支持自定义停顿时长。
aining-manage/user/jobs 创建分身数字人模型训练任务 GET /v1/{project_id}/digital-human-training-manage/user/jobs 查询分身数字人模型训练任务列表 GET /v1/{project_id}/digi
音频:从本地上传一个音频文件,支持MP4、WAV和M4A格式。当命中此规则后,使用此音频进行回复。 智能交互:通过智能交互的方式回复用户问题,相当于提供了一个第三方语言模型去答复用户问题。 素材绑定(可选) 从本地选择图片或视频上传。当直播间命中当前互动内容进行答复时,同时会在直播画面展示这里上传的图片或视频。
音色名称。该名称会作为资产库中音色模型资产名称。 language 否 String 训练语言,当前仅支持中文。 CN: 中文 EN: 英文 phone 否 String 手机号 app_user_id 否 String 第三方用户id output_language 否 String 模型输出语言类型
appKey)&time_stamp=hex(timestamp)。 字段含义如下所示: llm_url:为创建智能交互数字人中“第三方语言模型地址”参数的取值,即第三方LLM自定义接口地址。 appKey:为创建智能交互数字人中“APPKEY”参数的取值。 代码示例,如下所示: URI
审核通过后,任务状态变更为“算法训练中”,如图所示。 数字人定制任务审核通过后,启动算法训练,会在3个工作日内训练完成并生成数字人。 图5 数字人定制任务 等待数字人模型训练完成后,任务状态变更为“算法训练完成”,如图6所示。 图6 数字人定制任务 如果训练生成的数字人形象满足需求,单击右下方的“通过”。在
过您主动点击聊天按钮申请客户应用或浏览器的麦克风权限,在您同意客户应用使用麦克风之后,将您的音频数据或文本数据上传到客户指定的第三方系统或模型,用于识别语义并做出应答,给您提供交互功能。 产品运营和维护 为了保障SDK稳定运行,改善产品的运营策略,SDK会直接收集客户应用调用SD
FEMALE: 女性 MALE: 男性 默认取值: FEMALE voice_name 是 String 音色名称。该名称会作为资产库中音色模型资产名称。 language 否 String 训练语言,当前仅支持中文。 CN: 中文 EN: 英文 默认取值: CN create_type
script_description String 剧本描述。 model_asset_id String 数字人模型资产ID,可以从资产库中查询。 model_asset_type String 数字人模型类型。 HUMAN_MODEL_2D:分身数字人 HUMAN_MODEL_3D:3D数字人 script_cover_url
FEMALE: 女性 MALE: 男性 默认取值: FEMALE voice_name 是 String 音色名称。该名称会作为资产库中音色模型资产名称。 language 否 String 训练语言,当前仅支持中文。 CN: 中文 EN: 英文 默认取值: CN create_type
String 机器人ID。 cover_url String 对话封面图URL model_infos ModelInfo object 数字人模型信息 voice_config VoiceConfig object 语音配置参数。 说明: *此参数将被废弃,请使用voice_config_list。
FEMALE: 女性 MALE: 男性 默认取值: FEMALE voice_name 是 String 音色名称。该名称会作为资产库中音色模型资产名称。 language 否 String 训练语言,当前仅支持中文。 CN: 中文 EN: 英文 默认取值: CN create_type
script_name 否 String 剧本名称。 最小长度1,最大长度256。 model_asset_id 否 String 数字人模型资产ID。 最小长度0,最大长度64。 shoot_scripts 否 Array of 表6 拍摄脚本列表。 数组长度:[0,100]。
PAGE:PPT内容页图片文件 SAMPLE:样例音频或样例动作文件 OTHER:其他文件 WHOLE_MODEL:全模型文件(3D数字人) USER_MODIFIED_MODEL:用户上传模型(3D数字人) TEMPORARY:临时文件夹(用于文件替换时上传新文件) PACKAGE:打包后的资产文件
thumbnail String 直播间封面图URL model_infos Array of ModelInfo objects 数字人模型信息 create_time String 创建时间,格式遵循:RFC 3339 如“2021-01-10T08:43:17Z”。 update_time
CALLBACK:回调给其他服务,携带设置的话术。 SHOW_LAYER:仅显示叠加图层,不影响话术。 INTELLIGENT_REPLY:使用配置的大模型生成回复话术。 默认取值: 不涉及 layer_config 否 SmartLayerConfig object 智能图层配置。 extra_layer_config
社交互动:家用机器人可以连接到社交媒体平台,帮助您与朋友和家人保持联系。 153. 它们可以发送消息、播放语音邮件、查找联系人等。 154. 有些机器人还具备人脸识别技术,能够识别面孔并与熟悉的人进行互动。 155. 总的来说,家用机器人作为生活伴侣可以提供陪伴和娱乐、语音助手和智能答疑、日程管理和提
如果用户不知如何提问,可参考热点问题进行提问。 热点问题会展示在如图4所示②区域的位置。 单击“添加”,依次添加所有的热点问题。 安抚话术 用户提问结束后,大模型搜索答案进行回复,可能会有延迟。为避免不好的体验,可以配置安抚话术,及时安抚用户情绪,耐心等待回复。 开启安抚话术后,可以看到“通用安抚话
核通过),AUDIT_NOT_PASS(审核未通过),TRAINING_FINISH(训练完成),UPLOADING_MODEL(上传语音模型),COMPLETE_JOB(任务完成) operator String 操作者,USER(用户),ADMIN(管理员),SYSTEM(用户)
响应消息头中X-Subject-Token的值。 command 是 String body 指令类型。 START:语音合成请求 PRELOAD:预加载音色模型 text 否 String body 待合成语音的文本。 command取值为START时,为必填项。 job_id 否 String body