检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
手机录制音频 请根据手机类型,执行相应操作: 苹果手机操作 安卓手机 苹果手机操作 苹果手机推荐下载软件“简易录音机(Easy Voice Recorder)”进行录音,如图1所示。 图1 简易录音机 音频录制说明,如表1所示。 表1 音频录制说明 音频录制 说明 采样率 推荐使用48kHz采样率录制音频。
参数解释: 字幕框高度。 约束限制: 参数h用于方便前端计算字幕框左上角坐标,后台不使用该参数。 取值范围: 0-1920 w Integer 参数解释: 字幕框宽度。 约束限制: 字幕框宽度固定为屏幕宽度的80% 参数w用于方便前端计算字幕框左上角坐标,后台不使用该参数 取值范围:
稿一:华为云MetaStudio介绍 基于盘古数字人大模型,华为云MetaStudio打造了一站式、全流程的数字人直播服务,通过高效的训练和推理服务,重塑千行百业的电商直播。 数字人模型生成和驱动:基于一张照片或者一段3-5分钟视频,可以生成分身数字人模型,生成效率相比业界提升3
服务概览 登录华为云控制台,单击界面左上角的图标,在弹出的服务列表界面中,搜索并单击“数字内容生产线 MetaStudio”服务,进入MetaStudio服务概览页面,如图1所示。 图1 服务概览页面 MetaStudio服务概览页面一共包含3块区域,详细说明如下所示: 服务介绍
常见问题 智能交互SDK安装包里为什么有图片资源? SDK里面包含图片资源,是因为智能交互的动效、背景可能需要图片资源才能展示更好的效果。所以智能交互Web SDK为了方便用户集成使用,会同时包含UI相关资源。 speechRecognized和semanticRecognized通知的流式返回有什么差异?
参数解释: 字幕框高度。 约束限制: 参数h用于方便前端计算字幕框左上角坐标,后台不使用该参数。 取值范围: 0-1920 w 否 Integer 参数解释: 字幕框宽度。 约束限制: 字幕框宽度固定为屏幕宽度的80% 参数w用于方便前端计算字幕框左上角坐标,后台不使用该参数 取值范围:
智能交互支持富媒体吗? 支持的富媒体格式 用户与数字人进行智能交互问答时,支持展示如下格式的富媒体: 图片:JPG、PNG、BMP、GIF、SVG。 视频:MP4。 导入富媒体操作 支持通过问答库导入富媒体,示例如表1所示。以奇妙问知识库为例,可以通过新增知识库来补充富媒体知识。
(可选)提升问答交互次数 科大讯飞免费赠送500次/天的问答交互次数,如需提升问答交互次数,需订购套餐包。 操作步骤 在AIUI开放平台界面上方的主菜单中,选择“产品接入 > 我的应用”。 单击新增应用所在行的图标,进入“应用配置”页面。 在左侧导航栏中,选择“应用数据统计 >
算法备案公示 下述内容为MetaStudio服务提供的算法备案信息、基本原理、运行机制和目的意图等内容,以保障用户的知情权,方便用户更好的选择和使用MetaStudio服务。 华为云MetaStudio分身数字人驱动算法 表1 分身数字人驱动算法 算法项 描述 算法名称 华为云MetaStudio分身数字人驱动算法
合成的视频可以下载至本地吗? 可以下载至本地。在MetaStudio控制台“我的创作 > 视频制作 > 我的视频”页面,找到需要下载的视频卡片,单击卡片右下角的图标,从下拉框中选择“下载”即可。 父主题: 视频制作
标准版数字人可以用实景拍摄吗? 可以,详见拍摄真人视频中的“实景数字人拍摄要求”。 使用实景拍摄,不支持抠图和更换背景,后期使用数字人会一直带着拍摄的背景。只有绿幕素材后续可以更换背景,蓝幕也不支持更换背景。 父主题: 声音和形象制作
示例1:上传资产 本节提供通过API Explorer和Postman工具,将资产上传至OBS桶的操作。 总体流程 调用创建资产接口创建资产ID。 调用创建文件并获取上传URL接口创建文件ID,并生成文件上传的URL地址。 使用Postman工具,参考OBS的PUT上传接口,将资产文件上传至URL地址中。
为什么会欠费? 除用户在资源购买页面,付费购买的资源外,用户还需查看如图1所示的服务概览页面。查看是否有计费项开通了按需计费,在计费项卡片右上角会有已开通按需计费的提示。超出套餐包的资源会自动走按需计费。 图1 服务概览页面 父主题: 计费咨询
创建分身数字人定制任务 MetaStudio服务已预置多个数字人形象,可在视频制作界面或直播间界面查看。如果预置形象无法满足用户的需求,可以参考本节操作,自定义生成分身数字人。 注意事项 MetaStudio不支持个人用户定制形象,仅支持企业用户。 定制分身形象时,从平台下载的授
创建Flexus分身数字人定制任务 本节提供MetaStudio服务Flexus数字人及其声音的制作过程。 注意事项 Flexus形象制作限制,如Flexus形象制作限制所示。 操作前准备 用户创建Flexus分身数字人定制任务前,需要准备如下内容: 1~5分钟的真人实景拍摄视频
创建声音制作任务(第三方模型) MetaStudio已经预置了各种类型的声音,可以在视频制作界面或视频直播界面查看。如果预置声音仍无法满足用户需求,可使用第三方模型“出门问问”自定义生成声音。第三方模型“出门问问”的详细说明,如下所示: 输入的语言不受限制。默认支持19种输入语言
None 特性讲解 数字内容生产线 MetaStudio产品介绍 17:43 详细了解MetaStudio服务 服务访问路径 数字内容生产线 访问MetaStudio服务 00:50 访问MetaStudio服务 声音制作和形象制作 声音制作 操作指导 00:50 分身数字人声音制作操作指导
视频制作界面说明 用户启动制作视频时,可以先了解下视频制作界面详情。 视频制作界面如图1所示。各区域详细说明,如表1所示。 用户使用数字人形象创作的视频,都会自动保存在MetaStudio控制台首页“最近项目”区域的“视频项目”页签中。用户可以根据实际情况,进行二次创作。 图1 视频制作界面
拍摄真人视频 您好!欢迎使用华为云数字人服务,本指南将协助您完成分身数字人形象的采集工作。 请注意,分身数字人形象制作的效果与您的录制效果有较大关联,为了获取更好的数字人效果,我们建议您使用以下标准进行拍摄。 以下是数字人拍摄标准概览,但是我们也建议您详细阅读每一块具体内容: 拍摄规格
多语言的计费规则? 文本转语音是以字数来计费的,多语言不是计费项,无需另外付费。 自研声音目前只有中英文,声音合成按需计费标准为:¥200.00/百万字,可以在MetaStudio服务概览页面的“声音合成”卡片中查看,如图1所示。 图1 声音合成计费项 第三方声音的计费标准,详见云商店语音合成商品页面的价格表。