检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
0-86400 audio_codec String 参数解释: 音频编码格式。 约束限制: 用户无需填写,系统自行提取。 取值范围: 字符长度0-32位。 默认取值: 不涉及 audio_bit_rate Integer 参数解释: 音频平均码率,单位kbps。 约束限制: 用户无需填写,系统自行提取。
获取语音文件上传地址 20次/秒 10次/秒 10次/秒 获取语音训练任务审核结果 20次/秒 10次/秒 10次/秒 确认在线录音结果 10次/秒 3次/秒 3次/秒 获取在线录音确认结果 20次/秒 10次/秒 10次/秒 语音合成管理 创建TTS试听任务 5次/秒 3次/秒 3次/秒 获取TTS试听文件
rl String 文本对应音频文件下载链接 表24 ShootScriptAudioFiles 参数 参数类型 描述 audio_file_url Array of ShootScriptAudioFileItem objects 用于语音驱动的音频文件上传URL。 表25 S
asset_id String 参数解释: 插入音频资产的资产id,外部资产信息无需填写。若填写,可以从资产库中查询。 约束限制: 不涉及 取值范围: 字符长度0-64位。 默认取值: 不涉及。 audio_url String 参数解释: 音频URL。 约束限制: 仅支持MP3格式,大
audio_codec 否 String 参数解释: 音频编码格式。 约束限制: 用户无需填写,系统自行提取。 取值范围: 字符长度0-32位。 默认取值: 不涉及 audio_bit_rate 否 Integer 参数解释: 音频平均码率,单位kbps。 约束限制: 用户无需填写,系统自行提取。
0-86400 audio_codec String 参数解释: 音频编码格式。 约束限制: 用户无需填写,系统自行提取。 取值范围: 字符长度0-32位。 默认取值: 不涉及 audio_bit_rate Integer 参数解释: 音频平均码率,单位kbps。 约束限制: 用户无需填写,系统自行提取。
华为云提供了MetaStudio服务端SDK,您可以直接集成服务端SDK来调用MetaStudio的相关API,从而实现对MetaStudio服务的快速操作。 在线生成SDK代码 API Explorer能根据需要动态生成SDK代码功能,降低您使用SDK的难度,推荐使用。 您可以在API Explor
敏感词话术 数字人回复内容触发敏感信息时,使用的回复话术。 示例:哎呦,这个问题我没有听懂哦!请您重新提问。 单击“在线演示”,可以在界面右侧演示模型对话效果,如图4所示。 图4 在线演示 单击界面右上角的“保存”,在弹出的“保存成功”提示框中,单击“确定”。 角色创建完成。 查看角色信息
而且能说80多种不同国家的语言,只需要输入一段文案,就能让数字人帮你念出来,生成一段数字人视频。 万兴喵影则是专为高级视频剪辑而生的工具,不仅如此,它还能处理音频,让你的视频在听觉和视觉上都更吸引人。 支持多轨道编辑,不仅有各种特效和转场效果,还有高级的色彩校正工具,各种炫酷的特效和过渡效果,都让视
asset_id 否 String 参数解释: 插入音频资产的资产id,外部资产信息无需填写。若填写,可以从资产库中查询。 约束限制: 不涉及 取值范围: 字符长度0-64位。 默认取值: 不涉及。 audio_url 否 String 参数解释: 音频URL。 约束限制: 仅支持MP3格式,
-manage/user/training-segment 确认在线录音结果 GET /v1/{project_id}/voice-training-manage/user/training-segment 获取在线录音确认结果 语音合成管理 表25 语音合成管理接口 接口 说明
普通观看方,可选择原始视频流或者数字人动画视频流观看 INFERENCE_USER: 数字人推理端用户。从RTC房间接收音频流,并推送视频流到RTC房间 END_USER: 端侧用户。从推送音频流到RTC房间,并从RTC房间接收视频流 user_id 否 String RTC用户ID。 signature
用于互动回复。数字人不变,背景不变。params结构定义:PlayTextInfo。 INSERT_PLAY_AUDIO:插入驱动音频。用于音频直接驱动。数字人不变,背景不变。params结构定义:PlayAudioInfo。 REWRITE_PLAY_SCRIPT:动态编辑未
object 用于语音驱动的音频文件上传URL列表。 表24 ShootScriptAudioFiles 参数 参数类型 描述 audio_file_url Array of ShootScriptAudioFileItem objects 用于语音驱动的音频文件上传URL。 表25
object 用于语音驱动的音频文件上传URL列表。 表24 ShootScriptAudioFiles 参数 参数类型 描述 audio_file_url Array of ShootScriptAudioFileItem objects 用于语音驱动的音频文件上传URL。 表25
lse。 默认取值: false audio_source_type 否 String 声音来源类型 VIDEO:视频中抽取音频 AUDIO:单独上传的音频 默认取值: VIDEO voice_properties 否 VoiceProperties object 声音配置信息,
查看名片 如果用户需要查看已生成的分身数字人名片,可参考本节操作。 操作步骤 登录MetaStudio控制台。 在左侧导航栏中,单击“我的创作”。 选择“分身名片”页签,如图1所示。 在“分身名片”页面,可以看到已生成的名片列表,以卡片形式排列展示。 支持对名片进行如下操作: 单击,查看分身数字人的语音表达形态。
普通观看方,可选择原始视频流或者数字人动画视频流观看 INFERENCE_USER: 数字人推理端用户。从RTC房间接收音频流,并推送视频流到RTC房间 END_USER: 端侧用户。从推送音频流到RTC房间,并从RTC房间接收视频流 user_id String RTC用户ID。 signature
普通观看方,可选择原始视频流或者数字人动画视频流观看 INFERENCE_USER: 数字人推理端用户。从RTC房间接收音频流,并推送视频流到RTC房间 END_USER: 端侧用户。从推送音频流到RTC房间,并从RTC房间接收视频流 user_id String RTC用户ID。 signature
MetaStudio有哪些计费项? MetaStudio的计费项分为分身数字人费用、3D数字人费用和资产管理费用三类。 分身数字人费用:包括分身数字人形象制作、声音制作、分身数字人视频制作、分身数字人视频直播、照片数字人视频制作和分身数字人名片制作的费用。 3D数字人费用:包括照片建模、语音驱动和视觉驱动的费用。