检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
时不可再重训。 取值范围: 0-10 audio_source_type String 声音来源类型 VIDEO:视频中抽取音频 AUDIO:单独上传的音频 supported_service Array of strings 该任务所生成的模型支持的业务类型,可多选。 Flex
普通观看方,可选择原始视频流或者数字人动画视频流观看 INFERENCE_USER: 数字人推理端用户。从RTC房间接收音频流,并推送视频流到RTC房间 END_USER: 端侧用户。从推送音频流到RTC房间,并从RTC房间接收视频流 user_id String RTC用户ID。 signature
普通观看方,可选择原始视频流或者数字人动画视频流观看 INFERENCE_USER: 数字人推理端用户。从RTC房间接收音频流,并推送视频流到RTC房间 END_USER: 端侧用户。从推送音频流到RTC房间,并从RTC房间接收视频流 user_id String RTC用户ID。 signature
第三方声音的费用均不同,详见语音合成界面下方的声音价格表。如魔郎朗声音的价格为30元/百万字符,那么使用魔郎朗声音进行视频制作合成时,生成音频的费用会从上面购买的套餐包中扣除。 图1 云商店 选择“语音合成体验套餐”,单击“立即购买”,进入购买页面。 下面以购买“语音合成体验套餐”为例,进行操作说明。
请求参数 表2 请求Body参数 参数 是否必选 参数类型 描述 audio_file_download_url 是 String 语音驱动音频文件下载URL,格式为AAC或者MP3 frame_rate 是 Integer 期望的输出帧率 取值范围: 15-120 默认取值: 60
VOICE_MODEL:音色模型(仅系统管理员可上传,普通租户仅可查询) VIDEO:视频文件 IMAGE:图片文件 PPT:幻灯片文件 MUSIC: 音乐 AUDIO: 音频 COMMON_FILE:通用文件 分身数字人资产: HUMAN_MODEL_2D: 分身数字人模型 BUSINESS_CARD_TEMPLET:
asset_id 否 String 资产ID asset_type 否 String 资产类型 IMAGE:图片 VIDEO:视频 AUDIO:音频 order 否 Integer 参数解释: 资产次序。不设置或者0表示按照加入时间先后排序。业务上将次序最靠前的图片设置为商品封面。 取值范围:
” is_tail Boolean 是否为尾部(任务数据已全部生成,后续没有新的数据) 默认取值: false audio String 音频数据,Base64编码,1秒内的数据。 blendshapes Array of strings 语音驱动的表情基数据。 animations
time="300ms"/>是联合国宪章<break time="500ms"/>最重要的原则。 audio_file_download_url 否 String 语音驱动音频文件下载URL。 speed 否 Integer 语速。 取值范围[50,200] 默认值:100 取值范围: 50-200 默认取值: 100
普通观看方,可选择原始视频流或者数字人动画视频流观看 INFERENCE_USER: 数字人推理端用户。从RTC房间接收音频流,并推送视频流到RTC房间 END_USER: 端侧用户。从推送音频流到RTC房间,并从RTC房间接收视频流 user_id String RTC用户ID。 signature