检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
号 算法基本原理 数字人照片建模算法是指使用深度学习算法将已授权的人像照片信息转换为数字人3D模型的一种技术。 其基本情况包括: 输入数据:有授权的人像照片。 算法原理:使用深度学习算法,将人像照片转换为数字人3D模型。 输出结果:数字人3D模型。 应用领域:数字人照片建模算法可
表1 环境要求 环境项 使用限制 开发工具 Microsoft Visual Studio Code、WebStorm或其他Web IDE开发工具。 语言 Javascript或Typescript。 编译环境 建议Node 17+。 编译工具 建议Webpack 5 + babel
Boolean 参数解释: PPT是否需要自动解析。 约束限制: 部分过于复杂的PPT或压缩比过高的PPT可能无法解析。 超过50页PPT仅转换50页 转换的图片无法保证完全还原,需要自行确认。 取值范围: true: 自动解析 false: 无需解析 默认取值: false ppt_analysis_status
Boolean 参数解释: PPT是否需要自动解析。 约束限制: 部分过于复杂的PPT或压缩比过高的PPT可能无法解析。 超过50页PPT仅转换50页 转换的图片无法保证完全还原,需要自行确认。 取值范围: true: 自动解析 false: 无需解析 默认取值: false ppt_analysis_status
华为云提供了MetaStudio服务端SDK,您可以直接集成服务端SDK来调用MetaStudio的相关API,从而实现对MetaStudio服务的快速操作。 在线生成SDK代码 API Explorer能根据需要动态生成SDK代码功能,降低您使用SDK的难度,推荐使用。 您可以在API Explor
wav~19.wav;文本文件命名规则:0.txt~19.txt。 语音文件和文本文件逐句上传:每次上传一句语料的语音文件和文本文件,再调用“确认在线录音结果”接口确认语音和文本内容是否一致。确认成功后再上传和确认下一句。 文件上传后,调用“提交语音训练任务”接口,启动审核和训练。 调用方法
wav~99.wav;文本文件命名规则:0.txt~99.txt。 语音文件和文本文件逐句上传:每次上传一句语料的语音文件和文本文件,再调用“确认在线录音结果”接口确认语音和文本内容是否一致。确认成功后再上传和确认下一句。 文件上传后,调用“提交语音训练任务”接口,启动审核和训练。 调用方法
新增分身形象制作管理接口。 2023-11-29 第四次正式发布 本次变更如下: 新增视频制作剧本管理接口。 2023-09-19 第三次正式发布 本次变更如下: 新增数字人视频制作管理接口。 新增分身数字人视频制作管理接口。 新增数字人名片制作管理接口。 新增智能直播间管理接口。 新增直播任务管理接口。
说明: 此参数废弃。分身数字人在背景中位置在layer_config参数中配置。 human_size_2d 否 HumanSize2D object 分身数字人在背景图片的大小设置。 说明: 此参数废弃。分身数字人在背景中大小在layer_config参数中配置。 background_cover_url
权限管理 如果您需要对购买的MetaStudio资源,给企业中的员工设置不同的访问权限,以达到不同员工之间的权限隔离,您可以使用统一身份认证服务(Identity and Access Management,简称IAM)进行精细的权限管理。该服务提供用户身份认证、权限分配、访问控
说明: 此参数废弃。分身数字人在背景中位置在layer_config参数中配置。 human_size_2d HumanSize2D object 分身数字人在背景图片的大小设置。 说明: 此参数废弃。分身数字人在背景中大小在layer_config参数中配置。 background_cover_url
说明: 此参数废弃。分身数字人在背景中位置在layer_config参数中配置。 human_size_2d 否 HumanSize2D object 分身数字人在背景图片的大小设置。 说明: 此参数废弃。分身数字人在背景中大小在layer_config参数中配置。 background_cover_url
术。 SHOW_LAYER:仅显示叠加图层,不影响话术。 INTELLIGENT_REPLY:使用配置的大模型生成回复话术。 默认取值: 不涉及 layer_config 否 SmartLayerConfig object 智能图层配置。 extra_layer_config 否
10次/秒 10次/秒 确认在线录音结果 10次/秒 3次/秒 3次/秒 获取在线录音确认结果 20次/秒 10次/秒 10次/秒 语音合成管理 创建TTS试听任务 5次/秒 3次/秒 3次/秒 获取TTS试听文件 20次/秒 10次/秒 10次/秒 3D数字人风格管理 查询数字人风格列表
"layer_config" : [ { "layer_type" : "HUMAN", "position" : { "dx" : 656, "dy" : 0, "layer_index"
单击热词后面的问号图标,在提示框中单击“查看教程”,可以查看配置视频。 如果开启热词配置,需要同时配置下述参数: SIS服务授权:SIS服务用于将用户口述音频转换为文本,需要开启授权。 详细操作如下所示: 开启“SIS服务授权”,弹出“SIS服务授权”对话框。 单击“同意授权”,MetaStudio服务会自动在“统一身份认证服务
创建科大讯飞应用(AIUI通用语义模型) 在科大讯飞创建AIUI通用语义模型的应用。详细操作如下所示: AIUI通用语义模型应用,不支持直接切换为星火交互认知大模型,不适用。建议参考创建科大讯飞应用(星火交互认知大模型)单独为其创建应用。 创建应用 配置应用 查看应用信息 (可选)开启闲聊功能
术。 SHOW_LAYER:仅显示叠加图层,不影响话术。 INTELLIGENT_REPLY:使用配置的大模型生成回复话术。 默认取值: 不涉及 layer_config 否 SmartLayerConfig object 智能图层配置。 extra_layer_config 否
创建科大讯飞应用(星火交互认知大模型) 在科大讯飞创建星火交互认知大模型的应用。详细操作如下所示: 星火交互认知大模型应用,不支持直接切换为AIUI通用语义模型,不适用。建议参考创建科大讯飞应用(AIUI通用语义模型)单独为其创建应用。 创建应用 (可选)创建问答库 配置应用 查看应用信息
题描述。问题全部添加完成后,单击“确认”,等待服务管理员处理。 用户也可以单击“定制任务详情”页面左上方的“返回”,回到任务列表界面,通过任务列表右侧的“同意”或“驳回”实现数字人形象的验收操作。 图2 数字人定制任务 服务管理员会根据用户反馈的问题,重新优化数字人形象。 数字人