检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
产品咨询 数字内容生产线MetaStudio是什么? MetaStudio支持哪些区域? 开发者如何获取技术支持? 用户如何举报平台违规内容? 如何集成MetaStudio服务? 数字人相关问题
text 是 String 台词脚本。取值最小长度1,最大长度131072。 支持如下两种模式: 纯文本模式 使用纯文本,示例:大家好,我是人工智能小A,是位虚拟主播。 标签模式 标签模式使用SSML(Speech Synthesis Markup Language)标记语言。 需要使用的标签,如下所示:
照片建模任务出现异常问题怎么办? 风格化照片建模的照片有什么要求? 风格化照片建模生成的模型文件是什么格式? 表情驱动数据格式如何定义? 肢体驱动数据格式如何定义?
资产管理 如何接收并激活声音和分身模型资产?
String 上传训练数据的地址。训练数据需打包成zip文件后,上传至该url。 create_type取值为package时设置。 说明: 通过该obs地址上传时,需设置content-type为application/zip。 segment_uploading_url segment_uploading_url
标准版数字人可以用实景拍摄吗? 分身数字人定制任务提交后,审核未通过怎么办? 模型审核和制作可以加快吗? 部分浏览器提交H265训练视频失败如何处理? 声音和形象模型支持在其他平台使用吗? 声音和形象模型和音视频内容的关系? Flexus数字人在走动录制时需要注意什么?
著降低技术门槛,且购买简单,为中小企业提供超简单、超高性价比数字人。 使用限制 Flexus分身数字人目前仅支持视频制作,不支持视频直播和智能交互。 产品特性 轻量规格 购买简单,一次下单即可完成形象、声音和视频制作资源的购买。针对额外需求,支持客户选择不同档位套餐包进行充值。 极简体验
String 上传训练数据的地址。训练数据需打包成zip文件后,上传至该url。 create_type取值为package时设置。 说明: 通过该obs地址上传时,需设置content-type为application/zip。 segment_uploading_url segment_uploading_url
视频直播 直播剧本保存失败怎么办? 提示模板不可用怎么办? 直播业务媒体流如何应对防火墙限制? 第三方平台的直播画面不清晰怎么办? 第三方平台的直播画面突然中断是怎么回事? 第三方平台的直播画面没有声音怎么办?
音频驱动:上传音频,通过音频驱动数字人说话。 即兴直播:无需设置剧本,直接开播。开播后数字人是不说话的,需要发送互动内容,或者开启真人接管,驱动数字人说话。 互动设置:支持弹幕、用户入场 、点赞和送礼设置。 直播配置:支持开播设置、输出设置、风控设置和更多设置。 界面下方的“加载完自动直播”,默认勾
安卓手机的超级录音机的录音参数设置方式,如下所示: 打开超级录音机软件。 为了能正常录音和保存文件,需要先授权给软件录音和存储权限,即允许“超级录音机”访问媒体。 进入软件设置页面。 设置如下选项: 录制设置 > 录音音质:选择“高清”。 录制设置 > 录音保存格式:选择“WAV”或“MP3”。
场景1”小窗口下方的“+”图标,新增场景,并参考前一个场景,设置生成下一个场景的画面布局和剧本内容。 图9 直播间界面 所有场景的画面布局和剧本设置完成后,单击界面右侧的“互动设置”页签,如图10所示。 图10 互动设置 单击“导入”,弹出“导入互动”对话框。 勾选需要使用的互动
如果还需要制作更多场景,可单击“场景”区域的“+”图标,新增场景。制作过程参考第一个场景即可。 图3 场景区域 所有场景设置完成后,单击界面右上角的“合成视频”,弹出“合成设置”对话框。 参数设置说明如下所示: 分辨率:根据实际情况,选择视频的分辨率。 导出为:输入导出文件的名称。 画质增强:开启
PPT,再插入需要分享的PPT页,详情请参见PPT。每页PPT会对应生成一个场景,依次设置完成所有场景即可。 所有场景设置完成后,单击界面右上角的“合成视频”,弹出“合成设置”对话框。 参数设置说明如下所示: 分辨率:根据实际情况,选择视频的分辨率。 导出为:输入导出文件的名称。
使用接口查询音色ID(方式三) 支持使用查询资产列表接口,查询音色ID。需要设置如下参数: offset=0:从第一个音色开始查询,可以根据实际情况设置。 limit=60:一次可以查询的声音数据,可以根据实际情况设置。 asset_type=VOICE_MODEL:资产类型为音色模型。
文本驱动:通过输入文本的方式生成音频。文本支持插入停顿、调整语速,如果是多音字可设置正确的发音,还可以选择不同的声音,试听生成的音频效果。支持开启字幕展示功能。 音频驱动:从本地上传音频文件,作为视频的语音。音频驱动方式,仅支持中文普通话的场景下能开启字幕。 还可以设置音频的音量,和调整画布的横竖屏展示。 4 视频场景区域
高品质:约5个工作日。 自定义声音应用方式,如下所示: 自定义声音生成后,会自动展示在MetaStudio控制台声音列表中,可用于分身数字人视频制作、视频直播或智能交互等场景中。 通过MetaStudio的API调用自定义声音。 父主题: 声音制作
播画面中。 在左侧的“文本设置”界面,设置文本内容和字体样式,如图7所示。 在视频直播画面预览区域,如果存在多种视频直播素材,支持对文本进行图层管理,如:上移一层、下移一层、置顶、置底、复制、应用到全局、删除等。还支持设置大小,拖动位置。 图7 文本设置 父主题: 视频直播
子账户隔离配置 账户设置 资产归属分配 父主题: IAM权限管理
一致,建议将PPT转存为PDF文件后再导入。 操作详情请参考PPT如何转为PDF文件?。 如果PPT中有动画、动效,是不支持在MetaStudio控制台展示的,建议将PPT导出为视频后再导入。 操作详情请参考如何在MetaStudio控制台呈现PPT的动画效果?。 父主题: 使用限制