检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
参数类型 描述 background_type 是 String 参数解释: 背景类型。 约束限制: 不涉及。 取值范围: IMAGE:图片背景,指定图片用作分身数字人背景。 COLOR:纯色背景,指定颜色RGB值作为分身数字人背景。 默认取值: 不涉及 background_config
解决部分BUG,优化部分错误提示。 2024-05-06 本次变更如下: 新增发布2.0.1版本SDK,相比2.0.0版本,变更点如下所示: 字幕支持回显富文本(目前支持图片、视频单个回显)。 新增接口startSpeak,stopSpeak,muteRemoteAudio,unmuteRemoteAudio。
参数类型 描述 background_type 是 String 参数解释: 背景类型。 约束限制: 不涉及。 取值范围: IMAGE:图片背景,指定图片用作分身数字人背景。 COLOR:纯色背景,指定颜色RGB值作为分身数字人背景。 默认取值: 不涉及 background_config
参数类型 描述 background_type 是 String 参数解释: 背景类型。 约束限制: 不涉及。 取值范围: IMAGE:图片背景,指定图片用作分身数字人背景。 COLOR:纯色背景,指定颜色RGB值作为分身数字人背景。 默认取值: 不涉及 background_config
asset_type 否 String 资产类型 IMAGE:图片 VIDEO:视频 AUDIO:音频 order 否 Integer 参数解释: 资产次序。不设置或者0表示按照加入时间先后排序。业务上将次序最靠前的图片设置为商品封面。 取值范围: 0-300 默认取值: 0 响应参数
asset_type 否 String 资产类型 IMAGE:图片 VIDEO:视频 AUDIO:音频 order 否 Integer 参数解释: 资产次序。不设置或者0表示按照加入时间先后排序。业务上将次序最靠前的图片设置为商品封面。 取值范围: 0-300 默认取值: 0 响应参数
参数类型 描述 background_type 是 String 参数解释: 背景类型。 约束限制: 不涉及。 取值范围: IMAGE:图片背景,指定图片用作分身数字人背景。 COLOR:纯色背景,指定颜色RGB值作为分身数字人背景。 默认取值: 不涉及 background_config
选择“文本回复”,输入文本内容,当满足触发方式时,数字人会阅读文本内容。 素材绑定(可选) 从本地选择图片或视频上传。当直播间命中当前互动内容进行答复时,同时会在直播画面展示这里上传的图片或视频。 无需设置。 单击“保存”,一条互动规则新增完成。 用户可以根据实际情况,为当前互动库增加更多的互动规则,或者增加更多的互动库。
表1 资产存储计费说明 资产存储 计费说明 免费存储空间 MetaStudio服务免费赠送每个租户5GB资产存储空间,用于上传各类音视频、图片等素材。如果租户需要更多的存储空间,请购买单独的资产管理包月产品。 定制形象模型存储 基于MetaStudio服务定制生成的形象模型,其所
分身数字人定制任务提交后,审核未通过怎么办? 如果提示信息为“自动审核不通过-人证不匹配”,可能原因如下所示: 人证校验时识别不到人脸,确保身份证照片无反光导致的内容或人像不清晰。 确保视频中的人脸清晰且与提交身份证中的人像保持一致。 视频方向可能不对,竖屏横拍的素材需要旋转,确保被拍摄对象为竖向。
无论是行走、搬运物品还是执行其他动作,机器人都能轻松应对。 这款家用机器人还采用了超高清显示技术,带给您细腻的色彩和清晰度。 无论是在观看电影、浏览图片还是玩游戏时,您都可以享受到极致的视觉体验。 它将为您的生活带来更多便捷和乐趣,让您轻松畅享美好时光! 为了感谢广大消费者,品牌现在特别推出限时优惠活动!
ms,会结束语音识别。建议该值大于500ms。 委托语言交互服务(SIS) 如需使用热词功能,请开启委托授权。SIS服务用于将用户口述音频转换为文本。 热词 仅开启“委托语言交互服务(SIS)”后,才会展示“热词”配置。 数字人与用户进行智能交互对话时,语音识别不准确的专业词汇,
新闻:新闻播报风格文案 声音授权 单击“授权书模板”,下载授权书模板后打印。用户手写相关信息后,重新生成签署后的pdf文件,或者拍摄成jpg或png格式的图片后上传。 授权书内容,可参考授权书。 单击“提交制作”。 弹出“资源消耗提示”对话框。提示用户目前声音制作服务剩余数量,本次将消耗1个资源。
ms,会结束语音识别。建议该值大于500ms。 委托语言交互服务(SIS) 如需使用热词功能,请开启委托授权。SIS服务用于将用户口述音频转换为文本。 热词 仅开启“委托语言交互服务(SIS)”后,才会展示“热词”配置。 数字人与用户进行智能交互对话时,语音识别不准确的专业词汇,
fo 参数 类型 描述 text string 识别结果文本。 questionText string 问题文本。 resultId number 识别流式响应时返回的各包顺序序号。 isLast boolean 是否是最后一条识别结果。 chatId string 对话ID,每轮问答的ID值唯一。
ms,会结束语音识别。建议该值大于500ms。 委托语言交互服务(SIS) 如需使用热词功能,请开启委托授权。SIS服务用于将用户口述音频转换为文本。 热词 仅开启“委托语言交互服务(SIS)”后,才会展示“热词”配置。 数字人与用户进行智能交互对话时,语音识别不准确的专业词汇,
单击“授权书模板”,将授权书模板下载本地。 打印授权书,由身份证本人完成签署操作。 扫描文件生成pdf文件,或拍摄文件生成jpg、png格式的图片。 单击“点击上传授权书”,从本地选择pdf、jpg或png格式的授权书上传。 单击“提交制作”。 数据上传完成后,界面提示“制作任务提交成功!”,如图2所示。
直播公共配置。 模板:视频直播模板,“模板”页签仅管理员可见。 角色:数字人形象列表,可选择需要使用的数字人形象,支持自定义。 背景:背景图片列表,支持本地导入。可选择需要使用的背景图。 贴图:各类贴图列表,支持本地导入。支持在当前画面基础上,增加贴图,丰富视频画面。 视频:无声
定提醒等。 163. 家用机器人还具备语音识别和语音回应功能,让您能够与机器人进行流畅的对话和交流。 164. 视觉交互:家用机器人配备了先进的摄像头和视觉传感器,可以通过图像识别和视觉感知与您进行交互。 165. 例如,机器人可以识别家庭成员的面孔、手势和身体姿势,并做出个性化的反应和服务。
注意: 数字人回答的内容,是由对接的第三方大模型或知识库返回的答案决定的。 资产管理 支持从本地上传模型、PPT、动画、素材、视频、场景、图片、音乐等资产。 支持转移声音和模型资产给其他租户使用。 此功能暂未对外开放,如需使用,需提交工单申请。 支持删除资产。 数字人名片 支持为