检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
创建智能交互数字人 介绍如何在MetaStudio平台创建智能交互数字人,实现用户和数字人对话。相应的场景说明,请参考场景说明。 操作步骤 登录MetaStudio控制台,单击“智能交互”。 在智能交互编辑页面,依次设置角色和背景。 查看界面右侧的“互动问答”页签,如图1所示。 参数配置说明,如表1所示。
多的段落。 单击右上方的“导入”,从本地导入不少于200字的txt文件。如果多个段落,可通过换行来实现,平台会自动解析输入内容。 手工输入文本示例,如下所示: 请注意,当前仅为效果演示,实际需要满足单场景不少于200字,单段落不多于2000字的要求。 段落1.1:大家好,今天欢迎
序号 功能名称 功能描述 阶段 相关文档 1 数字内容生产线服务上线(受限公测) MetaStudio依托图形引擎和空间引擎两大媒体引擎,提供3D模型制作(Creator)、资产管理(Store)、内容编辑(Editor)、物理仿真(Simulation)、云渲染(Rendering
如果数字人形象采集时,面向镜头有行走、倒退或抛接物体等行为,建议数字人视频输出时长不超过2分钟,否则可能会因为MetaStudio动作循环逻辑,导致视频效果不佳。 父主题: 声音和形象制作
真人声音录制 客户录制真人音频,上传至MetaStudio进行AI训练,即可得到和真人音色1:1复刻的声音模型。 声音模型可实现文本转语音,应用于数字人视频制作、直播、交互问答等场景中。不同版本录制规格如下: 基础版:整段录制生成一个WAV或MP3格式音频,总时长3~10分钟,建议5分钟。
播报内容生成后,单击右侧的“试听”,可以试听播报效果。 语音上传:本地录制音频后上传。音频格式需要为WAV或MP3格式,音频大小不超过20MB,时长不超过5分钟。 在线录音:在线录制音频。录音时长不能超过5分钟,为保证音频生成的效果,请保持录音环境安静无噪音。支持试听录制生成的语音。
详细操作为:单击“声音合成”卡片中的“去开通”,在弹出的“开通按需计费服务提示”对话框中,勾选同意协议。单击“确定”,开通按需计费。开通后的效果如图1所示。 如需使用第三方声音进行语音合成,请购买出门问问声音套餐。 图1 声音合成 功能介绍 该接口用于TTS流式合成音频,用于文本转化为语音,并实时返回合成的音频数据。
形象制作和声音制作支持退订吗? 形象制作和声音制作均为一次性计费产品,不支持退订,用户购买前需谨慎评估。 如果是软件问题导致模型效果不理想,可提交工单申请退订产品。产品经理会对实际情况进行核实,对满足条件的发起特殊退订操作。 父主题: 计费咨询
lary_id} 修改TTS租户级自定义读法配置 3D数字人风格管理 表28 3D数字人风格管理接口 接口 说明 GET /v1/{project_id}/styles 查询数字人风格列表 3D数字人风格化照片建模 表29 3D数字人风格化照片建模接口 接口 说明 POST /v
从科技创新的角度来看,家用机器人在许多方面都具有创新性。 它采用了简洁、时尚的外观设计,不仅美观大方,而且易于使用和操作。 它可以与智能家居设备进行连接,实现智能家居控制; 在引领科技潮流方面,家用机器人注重持续的技术更新和升级。 它将不断地推出新功能、新技术和新服务,以满足大家不断变化的需求。
创建智能交互数字人 介绍如何在MetaStudio平台创建智能交互数字人,实现用户和数字人交互对话。相应的场景说明,请参考场景说明。 操作步骤 登录MetaStudio控制台,单击“智能交互”。 在智能交互编辑页面,依次设置角色和背景。 查看界面右侧的“互动问答”页签,如图1所示。
PAGE:PPT内容页图片文件 SAMPLE:样例音频或样例动作文件 OTHER:其他文件 WHOLE_MODEL:全模型文件(3D数字人) USER_MODIFIED_MODEL:用户上传模型(3D数字人) TEMPORARY:临时文件夹(用于文件替换时上传新文件) PACKAGE:打包后的资产文件 说明:
BUSINESS_CARD_2D:分身数字人名片 PICTURE_2D:照片数字人视频 MODELING_3D:3D照片建模 VDS_3D:3D视觉驱动 TTSA_3D:3D语音驱动 FLEXUS_2D:FLEXUS版本资源 resource_expire_start_time 否 String
}); 表1中导入的图片使用SDK默认方式时,在智能交互页面的展示效果,如图1所示。 图1 SDK默认方式展示效果 富媒体展示效果(自定义方式) 用户与数字人进行智能交互的页面,默认为用户需要自定义富媒体的展示效果,即用户自定义UI界面展示。 通过注册事件通知semanticRe
间练习,其次直播间的搭建也费时费力,无法直接搭建到老百姓家里。而通过数字人直播技术,可以云上随时随地24小时直播,不耽误村民日常劳作,同时实现话术自动生成,用专业、流利的直播话术,打开市场销路,让农产品走出大山,走向世界。 万兴科技联合华为云,打造跨境全场景数字人服务的AI视频创
浏览器使用限制,请参见表1。 表1 浏览器适配详情 操作系统类型 浏览器类型 浏览器版本 Windows Chrome浏览器 91+ Edge浏览器 91+ Android 移动版Chrome浏览器 91+ iOS 移动版Safari浏览器 17.3+ Mac Safari浏览器 16.5+ 预制唤醒能力
分身数字人资产: HUMAN_MODEL_2D: 分身数字人模型 BUSINESS_CARD_TEMPLET: 数字人名片模板 3D数字人资产: HUMAN_MODEL:3D数字人模型 SCENE:场景模型 ANIMATION:动作动画 MATERIAL:风格化素材 NORMAL_MODEL:
分身数字人资产类型: HUMAN_MODEL_2D:分身数字人模型 BUSINESS_CARD_TEMPLET: 数字人名片模板 3D数字人资产类型: HUMAN_MODEL:3D数字人模型 SCENE:场景模型 ANIMATION:动作动画 MATERIAL:风格化素材 NORMAL_MODEL:
包年包月 hws.resource.type.metastudio.modeling.Interaction.pro.channel 当前未启用 3D数字人 照片建模 个 按需 hws.resource.type.metastudio.modeling.stylizedphoto.number
删除TTS租户级自定义读法配置 10次/秒 3次/秒 3次/秒 修改TTS租户级自定义读法配置 10次/秒 3次/秒 3次/秒 3D数字人风格管理 查询数字人风格列表 20次/秒 10次/秒 - 3D数字人风格化照片建模 创建照片建模任务 2次/秒 2次/秒 - 照片建模任务列表查询 20次/秒 10次/秒