检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
主要功能如下所示,详见功能特性。 数字内容生产线Metastudio通过AI学习真人形象和声音,来生成数字人模型,相应功能为形象制作、声音制作和Flexus分身数字人。再将模型用于音视频内容的创作,相应功能为视频制作、视频直播和智能交互,主要是生成画面内容。也可以直接通过静态的人脸照片生成视频,对应功能为照片数字人。
每个单场景上传音频的时长需大于1分钟,大小不超过100M。 视频格式 视频支持的格式为:MP4、M4V、MKV、MOV、FLV、3GP、WMV和AVI。 说明: 在直播间制作界面,如果添加视频,且视频格式为FLV、3GP、WMV、AVI时,无法展示视频播放效果,仅能图片展示。这是浏览器不兼容导致的,但是不
MetaStudio控制台默认不展示“子账户隔离配置”菜单,需提交工单,并提供当前华为云账号所在Region的项目ID(详见获取项目ID),申请开通后展示。 开通成功后,仅华为云账号下展示“子账户隔离配置”菜单,IAM子账户均不展示。 注意事项 如果华为云账号已通过API接口字段“X-A
传等。 通过分身数字人进行教育宣传和教育资源推广,进行线上教学和培训,不仅可以大幅节约师资成本,还可以提升教学质量。通过减少对人力的依赖,使教育机构可以将更多精力投入到创新和教学内容的优化上,从而实现更高效的教育体系。 医疗健康 医学科普是近年来政策倡导的一大方向。通过医学科普,
直播任务管理 用户创建的直播间会以列表的形式,展示在分身视频直播首页面的“直播任务管理”页签中。支持通过直播任务进入直播间,修改直播内容后,重新开播。 操作步骤 登录MetaStudio控制台。 在“工作台”界面,单击“分身视频直播”下方的“开始创建”,进入分身数字人直播首页面。
语音上传:本地录制音频后上传。音频格式需要为WAV或MP3格式,音频大小不超过20MB,时长不超过5分钟。 在线录音:在线录制音频。录音时长不能超过5分钟,为保证音频生成的效果,请保持录音环境安静无噪音。支持试听录制生成的语音。 文本驱动:通过输入文本,选择声音的方式,生成播报内容。不能超过2000字。
分身形象和声音制作的处理方式相同,均需根据实际情况进行处理。下面以形象制作为例,进行说明。 如果当前分身形象制作的素材质量不佳,管理员会通过用户提交训练任务时输入的手机号联系用户。用户可以在管理员驳回任务后重新提交训练视频,进行数字人形象训练。形象制作任务制作完成前,形象制作资源一直处于占用状态,并未真正扣除。
第三方平台开播指南 MetaStudio直播功能的主要作用是生成数字人直播的音视频内容,并非直播平台。 可以通过下述2种方式在第三方平台开播: 窗口捕获方式开播:MetaStudio直播返回的窗口可供第三方直播平台(淘宝、抖音、拼多多等)抓取用于开播。 RTMP推流:即RTMP直
激发公众参与环境保护的热情, 并通过民间组织、学校和媒体等渠道促进信息的传播与共享。 各国通过国际组织、跨国合作机制和多边环境协议等平台加强合作与协调, 共同制定环境保护政策、分享经验和技术,并解决跨国界环境问题。 国际社会关注灾害风险管理, 通过建立早期预警系统、加强应急响应和灾后重建等措施,
语音上传:本地录制音频后上传。音频格式需要为WAV或MP3格式,音频大小不超过20MB,时长不超过5分钟。 在线录音:在线录制音频。录音时长不能超过5分钟,为保证音频生成的效果,请保持录音环境安静无噪音。支持试听录制生成的语音。 文本驱动:通过输入文本,选择声音的方式,生成播报内容。不能超过2000字。
分钟,否则审核会不通过。 说明: 通过该地址上传时,需设置content-type为application/octet-stream audio_upload_url String 音频数据训练上传URL。该url在文件上传成功后失效,只能上传一次 说明: 通过该地址上传时,需设
如何调用MetaStudio接口? Flexus支持通过API集成使用吗? 为什么调用API时提示“APIG.0301”? 使用API时返回“APIGW”开头的错误码,该如何处理? 智能交互SDK从哪里下载? 通过API合成的视频封面为什么看不到插入的视频素材缩略图? 通过API上传的视频和图片素材,为啥视频制作时不可见?
算法基本原理 分身数字人驱动算法是指通过深度学习生成数字人驱动模型,模型生成后,输入音频来合成数字人视频的一种技术。 其基本情况包括: 输入数据:真人视频、音频。 算法原理:通过深度学习算法来学习真人视频,生成驱动该真人形象的数字人模型。通过该模型输入音频,合成数字人视频。 输出结果:数字人视频。
参数解释: 组件名称。 约束限制: 不涉及。 取值范围: 字符长度1-256位。 默认取值: 不涉及。 component_type String 参数解释: 组件类型。 约束限制: 不涉及。 取值范围: 字符长度1-256位。 默认取值: 不涉及。 component_desc
建议使用对应版本预置的文案样例:文案样例(基础版)、文案样例(进阶版)、文案样例(高品质)。 支持自定义文案,单句文案长短需和样例相当。 不建议临场即兴发挥录制,避免出现较多嗯、啊等语气词,影响连贯性。 进阶版 高品质 专业录音棚+高保真MIC录制。 开始录音 必须录制单人高质量
6所示。 用户凭证的查询方式,如获取第三方声音使用凭证所示。 图16 更新凭证 单击“确认修改”,界面提示“修改成功”。 修改成功后,自动生效,无需重新激活第三方声音。 父主题: 购买声音套餐
约束限制: 不涉及。 取值范围: 只能使用中英文字符,字符长度0-256位。 默认取值: 不涉及。 asset_description 否 String 参数解释: 资产描述。 约束限制: 不涉及。 取值范围: 只能使用中英文字符,字符长度0-4096位。 默认取值: 不涉及。 asset_type
标准版形象模型 数字人定制任务提交成功后,会在1个工作日内完成审核。任务审核通过后,才能进行算法训练,会在3个工作日内训练完成并生成数字人。 Flexus分身数字人 数字人定制任务提交成功后,会在1个工作日内完成审核。任务审核通过后,才能进行算法训练,会在3个工作日内训练完成并生成数字人。 父主题:
”。 查看“分身数字人”页签的数字人定制任务列表,找到被驳回的数字人定制任务。 任务状态为“审核未通过”。 单击任务右侧的“查看原因”,在弹出的“审核未通过”对话框中,查看审核未通过的原因。 按照规范重新录制或提供符合规范的视频。 单击任务右侧的“重新上传”,上传更新后的视频。 数字人定制任务重新进入审核流程。
查看分身数字人定制任务审核进展,当前状态为“系统审核中”。数字人定制任务提交成功后,会在1个工作日内完成审核。 图4 定制任务详情 审核通过后,任务状态变更为“算法训练中”,如图所示。 数字人定制任务审核通过后,启动算法训练,会在3个工作日内训练完成并生成数字人。 图5 数字人定制任务 等待数字人模型训练完成后