检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
文本列表 asset_list Array of ProductMediaDetailInfo objects 资产列表,仅支持图片、视频、音频资产 create_time String 商品创建时间,格式遵循:RFC 3339。 例 “2020-07-30T10:43:17Z”。
普通观看方,可选择原始视频流或者数字人动画视频流观看 INFERENCE_USER: 数字人推理端用户。从RTC房间接收音频流,并推送视频流到RTC房间 END_USER: 端侧用户。从推送音频流到RTC房间,并从RTC房间接收视频流 user_id String RTC用户ID。 signature
文件在资产中的分类。每种资产类型包含的文件分类不同。 MAIN:主文件 COVER:封面文件 PAGE:PPT内容页图片文件 SAMPLE:样例音频或样例动作文件 OTHER:其他文件 WHOLE_MODEL:全模型文件(3D数字人) USER_MODIFIED_MODEL:用户上传模型(3D数字人)
左下角展示用户已购买资源的剩余量。 声音合成 这里的声音合成,仅针对使用声音API调用,通过MetaStudio控制台声音制作方式生成的声音,来合成音频的费用。 如需使用此功能,需单击“去开通”,在弹出的“开通按需计费服务提示”对话框中,勾选同意协议。单击“确定”,开通按需计费。 如需查看
普通观看方,可选择原始视频流或者数字人动画视频流观看 INFERENCE_USER: 数字人推理端用户。从RTC房间接收音频流,并推送视频流到RTC房间 END_USER: 端侧用户。从推送音频流到RTC房间,并从RTC房间接收视频流 user_id String RTC用户ID。 signature
object 用于语音驱动的音频文件上传URL列表。 表24 ShootScriptAudioFiles 参数 参数类型 描述 audio_file_url Array of ShootScriptAudioFileItem objects 用于语音驱动的音频文件上传URL。 表25
单击图标后,商品界面缩小展示。单击图标,可恢复为默认展示。 商品列表 默认展示全量商品。 插入素材 单击商品中的“插入素材”,下方展示当前商品已有的贴图、视频、文本、音频内容。 需要选中具体的素材,单击“+”图标,将选中素材添加至当前场景的直播画面中。 支持编辑商品,操作如下所示: 单击图标,选择一种素材类型,新增素材。
object 用于语音驱动的音频文件上传URL列表。 表24 ShootScriptAudioFiles 参数 参数类型 描述 audio_file_url Array of ShootScriptAudioFileItem objects 用于语音驱动的音频文件上传URL。 表25
Array of errors objects 错误列表。 表4 errors 参数 参数类型 描述 audio_name String 音频文件名。 text_name String 文本文件名。 error_code String 异常错误码。 error_message String
授权书的上传地址。 表3 segment_url 参数 参数类型 描述 audio_uploading_url Array of strings 音频上传的地址。 说明: 通过该obs地址上传时需要设置content-type为audio/wav txt_uploading_url Array
普通观看方,可选择原始视频流或者数字人动画视频流观看 INFERENCE_USER: 数字人推理端用户。从RTC房间接收音频流,并推送视频流到RTC房间 END_USER: 端侧用户。从推送音频流到RTC房间,并从RTC房间接收视频流 user_id String RTC用户ID。 signature
部分浏览器提交H265训练视频失败如何处理? 问题描述 制作分身形象时,上传的训练视频无法播放,或提交训练任务时,提示分辨率不符合要求,如下图所示。 图1 分身形象制作 问题原因 由于Chrome等浏览器只支持硬解码H265(HEVC)视频,当您的PC硬件不支持解码H265(HE
时不可再重训。 取值范围: 0-10 audio_source_type String 声音来源类型 VIDEO:视频中抽取音频 AUDIO:单独上传的音频 supported_service Array of strings 该任务所生成的模型支持的业务类型,可多选 默认取值:
普通观看方,可选择原始视频流或者数字人动画视频流观看 INFERENCE_USER: 数字人推理端用户。从RTC房间接收音频流,并推送视频流到RTC房间 END_USER: 端侧用户。从推送音频流到RTC房间,并从RTC房间接收视频流 user_id String RTC用户ID。 signature
普通观看方,可选择原始视频流或者数字人动画视频流观看 INFERENCE_USER: 数字人推理端用户。从RTC房间接收音频流,并推送视频流到RTC房间 END_USER: 端侧用户。从推送音频流到RTC房间,并从RTC房间接收视频流 user_id String RTC用户ID。 signature
第三方声音的费用均不同,详见语音合成界面下方的声音价格表。如魔郎朗声音的价格为30元/百万字符,那么使用魔郎朗声音进行视频制作合成时,生成音频的费用会从上面购买的套餐包中扣除。 图1 云商店 选择“语音合成体验套餐”,单击“立即购买”,进入购买页面。 下面以购买“语音合成体验套餐”为例,进行操作说明。
请求参数 表2 请求Body参数 参数 是否必选 参数类型 描述 audio_file_download_url 是 String 语音驱动音频文件下载URL,格式为AAC或者MP3 frame_rate 是 Integer 期望的输出帧率 取值范围: 15-120 默认取值: 60
VOICE_MODEL:音色模型(仅系统管理员可上传,普通租户仅可查询) VIDEO:视频文件 IMAGE:图片文件 PPT:幻灯片文件 MUSIC: 音乐 AUDIO: 音频 COMMON_FILE:通用文件 分身数字人资产: HUMAN_MODEL_2D: 分身数字人模型 BUSINESS_CARD_TEMPLET:
asset_id 否 String 资产ID asset_type 否 String 资产类型 IMAGE:图片 VIDEO:视频 AUDIO:音频 order 否 Integer 参数解释: 资产次序。不设置或者0表示按照加入时间先后排序。业务上将次序最靠前的图片设置为商品封面。 取值范围:
而且能说80多种不同国家的语言,只需要输入一段文案,就能让数字人帮你念出来,生成一段数字人视频。 万兴喵影则是专为高级视频剪辑而生的工具,不仅如此,它还能处理音频,让你的视频在听觉和视觉上都更吸引人。 支持多轨道编辑,不仅有各种特效和转场效果,还有高级的色彩校正工具,各种炫酷的特效和过渡效果,都让视