检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
照片建模 照片建模任务创建失败是什么原因? 照片建模任务出现异常问题怎么办? 风格化照片建模的照片有什么要求? 风格化照片建模生成的模型文件是什么格式? 表情驱动数据格式如何定义? 肢体驱动数据格式如何定义?
支持通过问答库导入富媒体。以奇妙问知识库为例,参考新增知识库,补充富媒体知识,示例如表1所示。 如果使用服务提供SDK默认样式,受限于浏览器的CSP策略,导入图片、视频链接的域名,需提交工单添加至白名单。 表1 问答知识库 序号 标准问题 问题答案 1 如何领券? <img src="https:///test
MetaStudio智能交互服务支持开发者自定义数字人大脑(即第三方LLM)。当用户与数字人对话时,将触发调用该接口,由该接口返回问题对应的答案文本内容。 签名计算方法 第三方LLM自定义接口,使用HMACSHA256签名模式,需要在URL中追加参数“secret”和“time_stamp”。 取值方
上传分身数字人训练数据。 界面操作详情,如表1所示。 表1 界面操作说明 区域 参数 说明 分身数字人训练数据上传 角色名称 输入分身数字人的角色名称。 示例:云笙。 训练视频 从本地上传已录制好,且符合拍摄要求的人像视频。 录制的视频要求4K,时长建议5~6分钟,分辨率≥1080P,宽高比16:9(
第三方平台的直播画面不清晰怎么办? 第三方平台的直播画面突然中断是怎么回事? 如何实时切换智能交互的语言和声音? 如何接收并激活声音和分身模型资产? 父主题: 附录
声音授权签署文件。 操作步骤 登录MetaStudio控制台。 单击“声音制作”下方的“开始创建”,进入声音制作页面。 图1 定制声音 在“华为模型”页签,配置声音制作参数。 界面操作详情,如表1所示。 表1 界面操作说明 区域 说明 声音制作方式 选择声音制作方式“基础版声音制作”,
音频:从本地上传一个音频文件,支持MP4、WAV和M4A格式。当命中此规则后,使用此音频进行回复。 智能交互:通过智能交互的方式回复用户问题,相当于提供了一个第三方语言模型去答复用户问题。 回复问题的时候,支持同时在直播画面中展示图片或者视频信息,以加强回复效果。图片和视频的添加和设置方式完全相同,下面以图片为例,进行操作说明。
音频:从本地上传一个音频文件,支持MP4、WAV和M4A格式。当命中此规则后,使用此音频进行回复。 智能交互:通过智能交互的方式回复用户问题,相当于提供了一个第三方语言模型去答复用户问题。 素材绑定(可选) 从本地选择图片或视频上传。当直播间命中当前互动内容进行答复时,同时会在直播画面展示这里上传的图片或视频。
aining-manage/user/jobs 创建分身数字人模型训练任务 GET /v1/{project_id}/digital-human-training-manage/user/jobs 查询分身数字人模型训练任务列表 GET /v1/{project_id}/digi
BUSINESS_CARD_TEMPLET: 数字人名片模板 3D数字人资产: HUMAN_MODEL:3D数字人模型 SCENE:场景模型 ANIMATION:动作动画 MATERIAL:风格化素材 NORMAL_MODEL: 普通模型 cover_url String 封面图片路径。 thumbnail_url
model_asset_id String 参数解释: 数字人模型资产ID。 约束限制: 不涉及 取值范围: 字符长度0-64位。 默认取值: 不涉及 model_asset_type String 参数解释: 数字人模型类型。 约束限制: 不涉及 取值范围: HUMAN_MODEL_2D:分身数字人
第三方逻辑智能训练版 FLEXUS: Flexus版---用的是大模型特征提取 job_id String 任务id。 app_user_id String 用户id。 voice_name String 音色名称。该名称会作为资产库中音色模型资产名称。 sex String 性别。 FEMALE:
参数解释: 字幕框高度。 约束限制: 参数h用于方便前端计算字幕框左上角坐标,后台不使用该参数。 取值范围: 0-1920 w 否 Integer 参数解释: 字幕框宽度。 约束限制: 字幕框宽度固定为屏幕宽度的80% 参数w用于方便前端计算字幕框左上角坐标,后台不使用该参数 取值范围: 0-1920
CALLBACK:回调给其他服务,携带设置的话术。 SHOW_LAYER:仅显示叠加图层,不影响话术。 INTELLIGENT_REPLY:使用配置的大模型生成回复话术。 默认取值: 不涉及 layer_config 否 SmartLayerConfig object 智能图层配置。 extra_layer_config
的集合,有独立的风火水电,AZ内逻辑上再将计算、网络、存储等资源划分成多个集群。一个Region中的多个AZ间通过高速光纤相连,以满足用户跨AZ构建高可用性系统的需求。 图1阐明了区域和可用区之间的关系。 图1 区域和可用区 目前,华为云已在全球多个地域开放云服务,您可以根据需求
可在合作的第三方平台进行数字人视频直播,如淘宝、拼多多、抖音等。 智能交互 包含下述功能实现场景: 支持开箱即用的智能交互数字人。 支持使用第三方语言模型,自主开发API实现与数字人对话。 支持使用智能交互API或SDK,自主开发实现与数字人对话场景。 智能导购、文旅导览、智能问答、营业厅客服、智能陪练等。
参数解释: 字幕框高度。 约束限制: 参数h用于方便前端计算字幕框左上角坐标,后台不使用该参数。 取值范围: 0-1920 w 否 Integer 参数解释: 字幕框宽度。 约束限制: 字幕框宽度固定为屏幕宽度的80% 参数w用于方便前端计算字幕框左上角坐标,后台不使用该参数 取值范围: 0-1920
model_asset_id 否 String 参数解释: 数字人模型资产ID。 约束限制: 不涉及 取值范围: 字符长度0-64位。 默认取值: 不涉及 model_asset_type 否 String 参数解释: 数字人模型类型。 约束限制: 不涉及 取值范围: HUMAN_MODEL_2D:分身数字人
model_asset_id 否 String 参数解释: 数字人模型资产ID。 约束限制: 不涉及 取值范围: 字符长度0-64位。 默认取值: 不涉及 model_asset_type 否 String 参数解释: 数字人模型类型。 约束限制: 不涉及 取值范围: HUMAN_MODEL_2D:分身数字人
参数解释: 字幕框高度。 约束限制: 参数h用于方便前端计算字幕框左上角坐标,后台不使用该参数。 取值范围: 0-1920 w 否 Integer 参数解释: 字幕框宽度。 约束限制: 字幕框宽度固定为屏幕宽度的80% 参数w用于方便前端计算字幕框左上角坐标,后台不使用该参数 取值范围: 0-1920