检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
配置特殊词表 支持全局设置自定义读法,设置完成后,所有视频制作剧本自动生效。 操作步骤 登录MetaStudio控制台。 在左侧导航栏中,单击“我的创作”。 选择“声音”页签,单击界面右侧的“特殊词表”,进入如图1所示的界面。 图1 特殊词表 单击“新建词表”,界面新增一行自定义读法,如图2所示。
窗口捕获方式开播:MetaStudio直播返回的窗口可供第三方直播平台(淘宝、抖音、拼多多等)抓取用于开播。 RTMP推流:即RTMP直推(华为云服务器直接把画面传到直播平台服务器,不需要用户一直打开控制台),从直播平台获取推流地址。获取方式各平台入口不一,建议咨询对应的直播平台。在
内容: 1~5分钟的真人实景拍摄视频,详见Flexus分身数字人形象采集指南。 身份证正反面照片。 形象授权签署文件,如授权书所示。 操作步骤 登录MetaStudio控制台。 单击“Flexus分身数字人”,进入Flexus分身数字人流程介绍页面,如图1所示。 请认真阅读界面上
说明 用户限制 MetaStudio不支持个人用户定制声音,仅支持企业用户。 定制声音时,从平台下载的授权书中有明确说明,定制音色需授权给公司使用。 使用限制 制作好的声音模型不支持下载或导出至本地。 声音模型不是通用模型,不与第三方服务兼容。用户在MetaStudio制作的模型,仅支持在本服务内使用。
用户限制 MetaStudio不支持个人用户定制形象,仅支持企业用户。 定制分身形象时,从平台下载的授权书中有明确说明,定制分身形象需授权给公司使用。 使用限制 制作好的数字人模型不支持下载或导出至本地。 数字人模型不是通用模型,不与第三方服务兼容。用户在MetaStudio制作的模型,仅支持在本服务内使用。
name 否 String 应用名称。 app_type 否 Integer 对接第三方应用厂商类型。 说明: 0:科大讯飞AIUI;1:华为云CBS;2:科大讯飞星火交互认知大模型;5:第三方驱动;6:第三方语言模型;8:奇妙问 取值范围: 0-32 room_id 否 String
本节提供通过API Explorer和Postman工具,将资产上传至OBS桶的操作。 总体流程 调用创建资产接口创建资产ID。 调用创建文件并获取上传URL接口创建文件ID,并生成文件上传的URL地址。 使用Postman工具,参考OBS的PUT上传接口,将资产文件上传至URL地址中。 调用确认文件已上传接口,确认文件已上传成功。
调用方法 请参见如何调用API。 URI GET /v1/{project_id}/voice-training-manage/user/jobs/{job_id}/audit-result 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID,获取方法请参考获取项目ID。
单击“合成成功”状态右侧的图标,进入视频详情页面,如图3所示。 单击“预览”,可以看到合成的视频。预览过程中,可全屏播放,或下载视频到本地。 图3 视频详情 如果用户对合成的视频不满意,可以参考下述步骤,进行二次制作,重新合成。 在左侧导航栏中,选择“工作台”。 在“最近项目”区域,选择“视频项目”页签
对接第三方应用厂商类型。 说明: 0:科大讯飞AIUI;1:华为云CBS;2:科大讯飞星火交互认知大模型;6:第三方语言模型;8:奇妙问 取值范围: 0-32 huawei_ei_cbs 否 HuaweiEiCbs object 华为云CBS应用配置 iflytek_aiui_config
name 是 String 应用名称。 app_type 是 Integer 对接第三方应用厂商类型。 说明: 0:科大讯飞AIUI;1:华为云CBS;2:科大讯飞星火交互认知大模型;5:第三方驱动;6:第三方语言模型;8:奇妙问 取值范围: 0-32 room_id 否 String
ShootScriptAudioFiles object 用于语音驱动的音频文件上传URL列表。 script_cover_url String 剧本封面下载url。 表5 VoiceConfig 参数 参数类型 描述 voice_asset_id String 参数解释: 音色资产ID,可以从资产库中查询。
表2 请求Body参数 参数 是否必选 参数类型 描述 audio_file_download_url 是 String 语音驱动音频文件下载URL,格式为AAC或者MP3 frame_rate 是 Integer 期望的输出帧率 取值范围: 15-120 默认取值: 60 emotion
该接口用于创建驱动数字人表情、动作及语音的任务。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/ttsa-jobs 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID,获取方法请参考获取项目ID。 请求参数
SP用户仅对大客户开放申请和使用。 SP用户不支持自己使用购买的资源包。 SP用户不支持访问MetaStudio控制台,进行控制台操作。 操作步骤 注册华为账号:单击进入注册页面。 完成实名认证:单击进入实名认证。 获取所在Region的项目ID,操作方法如获取项目ID所示。 大客户
刻自己的真人形象和声音,全程手机录制无需专业相机和专业绿幕环境。 高性价比 不到千元即可完成形象、声音定制,性价比超越业界。 应用场景 华为云Flexus版数字人为中小企业提供了一种高效、经济的解决方案,覆盖了教育、医疗、广电传媒和电商等多个行业场景。中小企业对换背景诉求较低,F
如果账号已经能满足您的要求,不需要创建独立的IAM用户进行权限管理,您可以跳过本章节,不影响您使用MetaStudio服务的其他功能。 IAM是华为云提供权限管理的基础服务,无需付费即可使用,您只需要为您账号中的资源进行付费。关于IAM的详细介绍,请参见《IAM产品介绍》。 MetaStudio不支持企业项目。
an-training-manage/user/jobs?query_project_id=***&offset=0&limit=10 响应示例 状态码:200 处理成功返回。 { "count" : 101, "jobs" : [ { "job_id" : "6
但是后续的数字人播报为啥没有声音? 原因请参考媒体和Web Audio API 的自动播放指南,所以出现数字人没声音的问题时,建议按照下述步骤排查并做出相应处理。 添加按钮点击触发create接口后,测试是否有声音。如果有声音,就是浏览器的安全策略导致,需要引导用户在create之前点击页面。
响应Body参数 参数 参数类型 描述 count Integer 参数解释: 视频制作任务总数。 取值范围: 0-2147483647 jobs Array of DigitalHumanVideo objects 视频制作任务列表。 表6 DigitalHumanVideo 参数