检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
音频命名 所有语料录制生成一个长音频WAV或MP3文件,命名示例:Voice.wav。 音频导出 操作如下所示: 打开超级录音机软件,进入音频文件列表页面。 通过长按音频文件的方式,选中所有文件,单击分享图标,可选择隔空投送或其他第三方应用导出音频文件至PC中。 一个长音频文件无需压缩,
text_list 否 Array of ProductTextInfo objects 文本列表 asset_list 否 Array of ProductMediaInfo objects 资产列表,仅支持图片、视频、音频资产 state 否 String 商品状态枚举 ACTIVED:已激活
UNACTIVE:取消激活 ACTIVE:激活 SHARE:共享 UNSHARE:取消共享 asset_ids 是 Array of strings 资产ID列表 params 否 String 操作参数 响应参数 状态码: 200 表4 响应Header参数 参数 参数类型 描述 X-Request-Id
device_names 否 Array of strings 参数解释: 已执行编译任务设备类型列表。 约束限制: 支持走动的数字人,当前仅用于视频制作,不能用于直播和智能交互 取值范围: 设备名称列表最多16个。 设备名称字符长度1-64位。 默认取值: false is_with_action_library
“所有问法”最多支持添加500个相似问题,每个问题不能超过64个字符。 一个技能可以最多添加40个问答对。 单击界面右上方的“保存”,界面左侧的“问答列表”中新增一个问答项,示例如图5所示。 图5 添加问答 请参考7~8,依次录入所有问答。 单击界面右上方的“导出”,将技能文件下载至本地,待后续使用。
text_list Array of ProductTextInfo objects 文本列表 asset_list Array of ProductMediaDetailInfo objects 资产列表,仅支持图片、视频、音频资产 create_time String 商品创建时间,格式遵循:RFC
响应参数 状态码: 200 表2 响应Body参数 参数 参数类型 描述 csv_file_download_url String csv文件下载地址 state String 任务的状态。 PROCESSING:处理中 SUCCEED:成功 FAILED:失败 error_message
技能ID。 question_list 是 Array of KnowledgeQuestionCreateInfo objects 问法列表 表4 KnowledgeQuestionCreateInfo 参数 是否必选 参数类型 描述 question 是 String 问法。
进阶版:约1~3个工作日。 高品质:约5个工作日。 自定义声音应用方式,如下所示: 自定义声音生成后,会自动展示在MetaStudio控制台声音列表中,可用于分身数字人视频制作、视频直播或智能交互等场景中。 通过MetaStudio的API调用自定义声音。 父主题: 声音制作
声音制作任务提交成功后,需要等待1天左右的时间审核。任务审核通过后,启动声音制作。声音模型制作耗时约5个工作日。 图2 制作任务提交成功 用户可以单击“查看制作任务列表”,查看声音制作任务审核进展。 当状态变更为“系统审核完成”,自动启动算法训练。如果系统存在多个算法训练任务,可能会存在排队和延迟的现象,请耐心等待。
Flexus分身数字人训练任务提交后,会同时生成一个Flexus分身数字人训练任务和声音制作任务。 查看Flexus分身数字人训练任务。 用户可以单击“查看制作任务列表”,进入“任务中心 > 分身数字人”页面。 查看生成的Flexus分身数字人训练任务,其“服务类型”为“Flexus版”,任务名称为设置的
配置特殊词表 支持全局设置多音字或者别名,设置完成后,所有视频草稿自动生效。 操作步骤 登录MetaStudio控制台。 在左侧导航栏中,单击“我的创作”。 选择“声音”页签,单击界面右侧的“特殊词表”,进入如图1所示的界面。 图1 特殊词表 单击“新建词表”,界面新增一行特殊词,如图2所示。
互动规则。params结构定义:interaction_rules。 GET_CURRENT_PLAYING_SCRIPTS:查询本轮剧本列表。响应为:LivePlayingScriptList结构。 SHOW_LAYER:显示导播素材,用于直播导播。params结构定义:LiveGuideRuleInfo。
device_names Array of strings 参数解释: 已执行编译任务设备类型列表。 约束限制: 支持走动的数字人,当前仅用于视频制作,不能用于直播和智能交互 取值范围: 设备名称列表最多16个。 设备名称字符长度1-64位。 默认取值: false is_with_action_library
字人讲话。 jobInfoChange通知新增websocketAddr参数,用来拼接三方驱动场景websocket请求URL。 更新字幕列表头像。 SDK心跳超时支持自动恢复。 解决vue2脚手架引入SDK报错问题。 解决部分BUG,优化部分错误提示。 2024-05-06 本次变更如下:
智能交互支持富媒体吗? 支持的富媒体格式 用户与数字人进行智能交互问答时,支持展示如下格式的富媒体: 图片:JPG、PNG、BMP、GIF、SVG。 视频:MP4。 导入富媒体操作 支持通过问答库导入富媒体。以奇妙问知识库为例,参考新增知识库,补充富媒体知识,示例如表1所示。 如
构造请求 本节介绍REST API请求的组成,并以调用IAM服务的管理员创建IAM用户来说明如何调用API,该API获取用户的Token,Token可以用于调用其他API时鉴权。 您还可以通过这个视频教程了解如何构造请求调用API:https://bbs.huaweicloud.com/videos/102987。
style_id 是 String 风格ID name 是 String 模型名称 notify_url 否 String 照片建模任务结束的回调地址。 响应参数 状态码: 200 表4 响应Header参数 参数 参数类型 描述 X-Request-Id String 请求ID。 表5
system_female_002:女性风格02 name 是 String 数字人模型名称,首次创建时使用。 notify_url 否 String 照片建模任务结束的回调地址。 响应参数 状态码: 200 表4 响应Header参数 参数 参数类型 描述 X-Request-Id String 请求ID。 表5
操作前提 注册操作 注册华为账号:单击进入注册页面。 完成实名认证:单击进入实名认证。 账户充值:为确保正常使用MetaStudio,您需要进行账户充值。 开通MetaStudio服务:单击进入MetaStudio控制台,根据开通引导完成服务开通。 推荐浏览器 推荐使用Chrom