检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
设置任务批次 功能介绍 用户设置任务批次,该接口用于批量任务管理场景,设置任务的批次 需要开通NA租户权限后才能正常调用 调用方法 请参见如何调用API。 URI PUT /v1/{project_id}/voice-training-manage/user/batch 表1 路径参数
音频数据训练上传URL。该url在文件上传成功后失效,只能上传一次 说明: 通过该地址上传时,需设置content-type为application/zip。 cover_upload_url String 模型封面上传URL。该URL在文件上传成功后失效,只能上传一次。 说明:
音频数据训练上传URL。该url在文件上传成功后失效,只能上传一次 说明: 通过该地址上传时,需设置content-type为application/zip。 cover_upload_url String 模型封面上传URL。该URL在文件上传成功后失效,只能上传一次。 说明:
贴图支持动态图片吗? 不支持。目前仅支持上传PNG、JPG、JPEG和BMP格式的图片文件,不支持GIF等动态图片格式。 父主题: 视频制作
窗口捕获方式开播:MetaStudio直播返回的窗口可供第三方直播平台(淘宝、抖音、拼多多等)抓取用于开播。 RTMP推流:即RTMP直推(华为云服务器直接把画面传到直播平台服务器,不需要用户一直打开控制台),从直播平台获取推流地址。获取方式各平台入口不一,建议咨询对应的直播平台。在MetaStudi
在“直播管理”页签,单击“创建直播间”,进入视频直播制作界面。 选择“互动设置”,单击右侧的“设置”,弹出“智能交互”对话框,如图1所示。 参数配置说明,如表1所示。 图1 智能交互设置 表1 参数说明 参数 说明 应用 请先参考后续步骤5,创建完成应用后,再从下拉框中选择此应用。 弹幕触发间隔时间
方法一:通过剪映将H265(HEVC)视频的格式转码为H264,再上传至MetaStudio控制台,进行形象制作。 详细操作如下所示: 方法二:通过ffmpeg将H265(HEVC)视频的格式转码为H264,再上传至MetaStudio控制台,进行形象制作。 详细操作如下所示: 输入命令行:ffmpeg
设置TTS租户级自定义读法配置 功能介绍 该接口用于设置TTS租户级自定义读法配置。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/ttsc/vocabulary-configs 表1 路径参数 参数 是否必选 参数类型 描述 project_id
创建大文件 功能介绍 该接口用于创建大文件(超过5G),获取分段上传URL。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/large-files 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID,获取方法请参考获取项目ID。
资产存储计费说明,如表1所示。 表1 资产存储计费说明 资产存储 计费说明 免费存储空间 MetaStudio服务免费赠送每个租户5GB资产存储空间,用于上传各类音视频、图片等素材。如果租户需要更多的存储空间,请购买单独的资产管理包月产品。 定制形象模型存储 基于MetaStudio服务定制生成
前一个场景,设置生成下一个场景的画面布局和剧本内容。 图7 直播间界面 所有场景的画面布局和剧本设置完成后,单击界面右侧的“互动设置”页签,如图8所示。 互动设置包含4类设置:弹幕、用户入场、点赞和送礼。支持直接导入互动管理中设置好的互动库,也支持在当前直播间逐条设置互动规则。所有类型总计可添加100个互动规则。
须知:“单独上传语料包”的方式生成Flexus声音的效果会更好。 数字人名称 生成的Flexus数字人名称。 示例:云笙。 联系方式 请输入有效的11位手机号码。 身份证照片 需要分别上传身份证人像面和国徽面的照片。 单击“点击上传人像面”,从本地选择身份证人像面照片上传。 单击“
创建角色 支持在奇妙问平台创建角色,并配置已上传的外部知识库和问答库给大模型学习使用,让角色的问答信息更丰富。 创建智能交互数字人中的“第三方应用”选择“奇妙问”时,才需要执行本节操作。 用户使用奇妙问前,需要联系奇妙问的客户经理注册开通服务。 客户经理的联系方式,可以在云商店语音合成商品页面查看,如图1所示。
资产归属分配 开启AM子账户隔离能力后,华为云账号可以在资产归属分配页面,修改所有资产的归属。 注意事项 开启AM子账户隔离能力后,各IAM子账户历史上传或制作的资产归属均已自动变更为华为云账号。 视频制作剧本、直播间、智能交互对话项目,暂不支持修改资产归属。 企业联邦虚拟用户,不支持修改资产归属。
用使用麦克风之后,将您的音频数据或文本数据上传到客户指定的第三方系统或模型,用于识别语义并做出应答,给您提供交互功能。 产品运营和维护 为了保障SDK稳定运行,改善产品的运营策略,SDK会直接收集客户应用调用SDK接口的信息并上传至服务器进行统计分析。处理的个人信息包括应用信息(浏览器User
选择主播或助播进行回复,具体回复内容支持通过下述方式设置。 文本:通过文本方式设置回复内容,最多可增加5条回复。直播间开播后按照触发次数,从前往后依次命中答复,每次仅回复一条文本内容。 示例:关于产品的链接、型号和优惠等问题,请看界面上方的说明,按照说明操作,就可以详细了解了。 音频:从本地上传一个音频文件,支持
io控制台展示,建议将PPT转存为PDF文件后,在导入本地PPT的位置,重新导入PDF文件,进行视频制作。 MetaStudio平台仅支持上传通过PPT转存的PDF文件,不支持使用Adobe导出的PDF文件。 PPT转PDF的操作如下所示: 本地打开PPT文件,在左上方的导航栏中,选择“文件
000212007 无法从mps设置配额 mps设置配额失败 请联系技术支持 500 MSS.000212008 无法从vcms设置配额 vcms设置配额失败 请联系技术支持 500 MSS.000212009 无法从dhtm设置配额 dhtm设置配额失败 请联系技术支持 500
真人声音录制 客户录制真人音频,上传至MetaStudio进行AI训练,即可得到和真人音色1:1复刻的声音模型。 声音模型可实现文本转语音,应用于数字人视频制作、直播、交互问答等场景中。不同版本录制规格如下: 基础版:整段录制生成一个WAV或MP3格式音频,总时长3~10分钟,建议5分钟。
在弹出的“头像调整”对话框中,可以调整图片大小和图片位置。 单击“确认”,头像上传完成。 性别 选择性别“男生”或“女生”。 声音 提供下述种方式,生成名片预览语音片段。 播报内容生成后,单击右侧的“试听”,可以试听播报效果。 语音上传:本地录制音频后上传。音频格式需要为WAV或MP3格式,音频大小不超过20MB,时长不超过5分钟。