检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
稿三:杭州西湖简介 杭州西湖,以其秀美的湖光山色和深厚的文化底蕴,被誉为“人间天堂”。作为世界文化遗产,西湖不仅是自然美景的宝库,也是中国园林艺术和历史文化的杰出代表。 湖光山色 西湖的美,在于山水的和谐共生。湖面碧波荡漾,山色空蒙,四季景色各异。春天,苏堤春晓,桃花盛开,垂柳依
电动汽车销量快速增长,充电基础设施建设也在加速。 中国政府重视区块链技术的发展,推动相关法规和标准的制定。 区块链被视为数字经济发展和数据安全的重要工具。 在金融领域,区块链被用于支付、贸易等场景。 中国的科技企业也在加大研发力度,推出创新产品。 例如,一家公司研发了智能家居系统,能给人们的生活带来便利; 另一
稿一:MetaStudio介绍 基于盘古数字人大模型,华为云MetaStudio打造了一站式、全流程的数字人直播服务,通过高效的训练和推理服务,重塑千行百业的电商直播。 数字人模型生成和驱动:基于一张照片或者一段3-5分钟视频,可以生成分身数字人模型,生成效率相比业界提升3倍以上
演讲示例稿 稿一:MetaStudio介绍 稿二:数字人形象采集指南 稿三:杭州西湖简介 稿四:春江花月夜 父主题: 形象制作
temperature, and humidity in your home, safeguarding the health of your family. 77. It can detect indoor environments and temperatures, promptly
频制作”,详见计费说明。 系统声音和Flexus声音免费使用。第三方声音的计费方式,详见购买出门问问套餐包。 标准版视频制作:必须使用标准版形象,声音不支持使用Flexus声音。 按视频制作时长计费,计费项为“分身数字人视频制作”,详见计费说明。 系统声音免费使用。第三方声音的计费方式,详见购买出门问问套餐包。
华为云盘古数字人大模型,赋能千行百业数字化营销新模式 MetaStudio服务依托华为云基础设施、海量算力(CPU/GPU/NPU)、全球一张网(算网融合、超低时延),通过华为云盘古数字人大模型,训练生成数字人、数字物、数字空间,实现数字人视频制作、直播、智能交互和数字人IP代言等场景。
频制作”,详见计费说明。 系统声音和Flexus声音免费使用。第三方声音的计费方式,详见购买出门问问套餐包。 标准版视频制作:必须使用标准版形象,声音不支持使用Flexus声音。 按视频制作时长计费,计费项为“分身数字人视频制作”,详见计费说明。 系统声音免费使用。第三方声音的计费方式,详见购买出门问问套餐包。
所示。 表1 硬件设备要求 硬件配置 最低配置 CPU i5及以上版本。 内存 8G以上。 硬盘 128G及以上。 操作系统 Windows或Android系统。 麦克风 需要有麦克风,且要保障1米以内的拾音效果。 扬声器 需要有扬声器。 触摸屏 需要有触摸屏。 带宽 4M以上。
音频经过人工安全审核和授权认证后,由训练人员标注用于训练的音频数据,使用深度学习算法训练生成数字人声音模型。 推理阶段: 用户上传一段文本作为输入文本内容,由系统自动审核。 输入文本使用数字人声音模型推理生成数字人语音。 算法应用场景 分身数字人声音制作算法可以应用于数字人语音合成。在新闻播报、课件
常用概念 数字人 数字人是一种以数字形式存在于数字空间中的虚拟人物,它具有拟人或真人的外貌、行为特点,并具备一定的智能和情感,可以进行交互和表达。数字人也可以被称之为虚拟形象、数字虚拟人、虚拟数字人等。数字人的核心技术主要包括计算机视觉、计算机图形学、动作捕捉和驱动、图像渲染和人工智能等。
错误码 获取项目ID 获取账号ID 直播控制HTTP Command命令说明 直播控制RTSA Command命令说明 文本驱动SSML定义 系统资产标签定义 服务支持的字体 资源类型 使用Java代码生成文件内容的MD5值 预置音色ID列表 查询音色ID
分辨率最大支持1080P。 图片素材总大小小于500MB。 字幕 字幕中正常断句的符号,如中文符号、,。:;!?….. 等;英文符号,.:;!?...等,系统会自动去除。 如果自动去除的符号在一段文字中间,自动去除后,会再增加一个空格。 如果自动去除的符号在段落末尾,仅直接去除。 有些符号不会自
如表1所示,包括了MetaStudio的所有系统策略。 表1 MetaStudio系统权限 策略名称 描述 策略类别 策略内容 MetaStudio FullAccess MetaStudio管理员权限,拥有该权限的用户可以拥有MetaStudio支持的全部权限。 系统策略 MetaStudio FullAccess策略内容
声音模型不是通用模型,不与第三方服务兼容。用户在MetaStudio制作的模型,仅支持在本服务内使用。 视频制作 使用系统预置或自定义生成的数字人形象、声音,制作音视频内容。 制作的视频可应用于教学、培训等各类场景中。 视频直播 使用系统预置或自定义的数字人形象、声音,制作音视频直播内容。 可通过下述方式,在直播平台开播。
使用限制 服务使用限制 API使用限制 形象制作限制 声音制作限制 视频制作限制 视频直播限制 Flexus分身数字人限制 照片数字人限制 智能交互限制 资产管理说明 SP用户限制
3次/秒 3次/秒 修改TTS租户级自定义读法配置 10次/秒 3次/秒 3次/秒 表2 API流控限制 接口分类 接口名称 单租户接口流控 系统流控 租户管理 查看租户资源用量信息 10次/秒 20次/秒 查看租户资源列表 10次/秒 20次/秒 统计时间段内资源数量 10次/秒 20次/秒
websocket连接出错,服务端主动断连。 90100017 capture failed, permission denied. 未授权音频设备采集权限,采集失败。建议用户授权麦克风访问权限。 90100018 capture failed, Constraint parameter invalid
SP用户限制 表1 限制说明 限制项 说明 开放范围 SP用户仅对大客户开放申请和使用。 功能范围 SP用户仅支持购买大颗粒度资源包,并分配资源给关联租户使用。 SP用户不支持访问MetaStudio控制台,进行控制台操作。 父主题: 使用限制
完后,转按需付费。 分身数字人名片的含义:客户根据其单张正面照(头肩像),调用相关服务,进行形象复刻生成分身数字人名片,该数字人名片形式是介绍名片或公司信息的一段视频。 须知: 当前资源默认置灰,即不支持购买。如需购买,仅支持企业用户联系产品经理或者提交工单开通购买,个人用户不支持。