检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
开发者如何获取技术支持? 如果开发过程中遇到问题,可以提单MetaStudio服务处理。 详细操作如下所示: 访问华为云官网。 选择“开发者 > 开发支持”,进入“开发者在线提单”界面。 单击“开发业务”区域的“数字内容生产线MetaStudio”,进入“开发者在线提单”页面。 请根据界面
如果你有任何问题、建议或想法,都欢迎在聊天栏与我分享。 我如果看到了都会尽力回答的,欢迎大家多多互动、交流。 感谢新进来的朋友们,不要忘记点击关注按钮和分享直播链接给你的朋友,让更多的人加入我们的直播间。
无论是与机器人一起跳舞、聊天还是观看电影,它们都能成为您开心时光的陪伴者。 家用机器人可以成为您的生活伴侣,与您进行互动和交流。 它们可以讲笑话、唱歌、讲故事,甚至能够跳舞和演奏乐器。 您可以通过语音与机器人交谈,并询问问题,例如天气预报、新闻资讯、菜谱等。
产品优势 控制台自助服务,一站式快速生成所需内容 用户申请账号并上传相关授权,拍摄训练所需音视频素材,上传进行模型训练,生成自定义形象和声音。选择背景、声音、模特等内容,基于文本或语音智能驱动,实现视频制作、视频直播、智能交互等能力。 华为云盘古数字人大模型,赋能千行百业数字化营销新模式
成长地图 | 华为云 数字内容生产线 数字内容生产线(MetaStudio)解决方案,提供数字人视频与直播、智能交互等服务,使能千行百业场景应用。 产品介绍 视频论坛 立即使用 立即使用 成长地图 由浅入深,带您玩转MetaStudio 弹性云服务器四 01 了解 了解数字内容生产线的工作原理
API使用限制 使用API调用声音的限制说明 用户使用视频直播或智能交互接口调用音色时,需要先确认能否在MetaStudio控制台的视频直播间编辑界面或智能交互对话设置页面,选到当前音色。 如果界面正常展示且可以选择此音色使用,说明接口可以正常调用此音色,否则接口无法调用。 API
使用前必读 数字内容生产线(MetaStudio)解决方案,提供数字人视频与直播、智能交互等服务,使能千行百业场景应用。 您可以使用本文档提供的API对华为云MetaStudio服务进行相关操作,如形象制作、声音制作、视频制作等。支持的全部操作请参见API概览。 在调用华为云MetaStudio
API概览 华为云MetaStudio服务对应的接口列表如下所示,在调用API前,您需要先获取用户Token,Token可以用于调用其他API时鉴权,具体如何调用API请参考应用示例。 数字资产管理 表1 数字资产管理接口 接口 说明 POST /v1/{project_id}/digital-assets
查看任务 如果用户需要查看照片数字人视频生成任务,可参考本节操作。 操作步骤 登录MetaStudio控制台。 在左侧导航栏中,单击“任务中心”。 选择“照片数字人”页签,如图1所示。 在“照片数字人”页面,可以查看全部生成的视频,包括生成中、生成成功和生成失败的任务。 在下方的视频列表中
Flexus分身数字人限制 Flexus分身数字人限制说明,如表1所示。 表1 声音制作限制 限制项 说明 Flexus形象和声音使用限制 Flexus分身数字人目前仅支持视频制作,不支持视频直播和智能交互。 视频制作限制 Flexus数字人采用实景拍摄,视频制作时不支持切换背景。
算法备案公示 下述内容为MetaStudio服务提供的算法备案信息、基本原理、运行机制和目的意图等内容,以保障用户的知情权,方便用户更好的选择和使用MetaStudio服务。 华为云MetaStudio分身数字人驱动算法 表1 分身数字人驱动算法 算法项 描述 算法名称 华为云MetaStudio
查看声音 声音制作任务算法训练完成后,可以查看声音。 操作步骤 登录MetaStudio控制台。 在左侧导航栏中,单击“任务中心”。 选择“声音制作”,确认声音制作任务已训练完成。 在左侧导航栏中,单击“我的创作”。 选择“声音”,找到已生成的声音,单击声音卡片中的头像,即可试听声音效果
功能特性 数字内容生产线Metastudio通过AI学习真人形象和声音,来生成数字人模型,相应功能为形象制作、声音制作和Flexus分身数字人。再将模型用于音视频内容的创作,相应功能为视频制作、视频直播和智能交互,主要是生成画面内容。也可以直接通过静态的人脸照片生成视频,对应功能为照片数字人
常用概念 数字人 数字人是一种以数字形式存在于数字空间中的虚拟人物,它具有拟人或真人的外貌、行为特点,并具备一定的智能和情感,可以进行交互和表达。数字人也可以被称之为虚拟形象、数字虚拟人、虚拟数字人等。数字人的核心技术主要包括计算机视觉、计算机图形学、动作捕捉和驱动、图像渲染和人工智能等
应用示例 示例1:上传资产 示例2:资产管理 示例3:分身形象制作管理 示例4:声音制作任务管理 示例5:语音合成管理 示例6:语音同步合成WebSocket接口(Android SDK) 示例7:语音同步合成WebSocket接口(iOS SDK) 示例8:视频制作 示例9:视频制作剧本管理
资源类型 MetaStudio计费中涉及的资源类型,包括商用资源类型、POC测试用需管理员分配的资源类型。 表1 商用资源类型(租户订购) 类别 资源名称 单位 计费模式 资源类型编码 备注 分身数字人 形象制作 个 一次性 hws.resource.type.metastudio.avatarmodeling.number
第三方平台的直播画面不清晰怎么办? 如果用户在第三方直播平台的直播画面不清晰,需排查是否是下述原因导致: 电脑是否有独立显卡。 OBS视频采集工具的基础分辨率配置是否与输出分辨率一致。 检查独立显卡 用户使用的第三方直播平台所在电脑,必须装有独立显卡。 检查OBS视频分辨率配置 OBS
数字内容生产线MetaStudio是什么? 数字内容生产线(MetaStudio)解决方案,提供数字人视频与直播、智能交互等服务,使能千行百业场景应用。 主要功能如下所示,详见功能特性。 数字内容生产线Metastudio通过AI学习真人形象和声音,来生成数字人模型,相应功能为形象制作
计费说明 数字内容生产线支持按需计费、包年/包月(包周期)、一次性计费等计费模式,以满足不同场景下的用户需求。 计费项 数字内容生产线计费项包含分身数字人和资产管理费用。详细的价格信息,详见价格计算器。 所需费用按照不同的计费方式产生,具体详情如表1所示。 用户可以在MetaStudio
分身数字人定制任务提交后,审核未通过怎么办? 如果提示信息为“自动审核不通过-人证不匹配”,可能原因如下所示: 人证校验时识别不到人脸,确保身份证照片无反光导致的内容或人像不清晰。 确保视频中的人脸清晰且与提交身份证中的人像保持一致。 视频方向可能不对,竖屏横拍的素材需要旋转,确保被拍摄对象为竖向