检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
单击“点击上传国徽面”,从本地选择身份证国徽面照片上传。 形象授权 上传形象授权书。 操作如下所示: 单击“授权书模板”,将授权书模板下载本地。 打印授权书,由身份证本人完成签署操作。 扫描文件生成pdf文件,或拍摄文件生成jpg、png格式的图片。 单击“点击上传授权书”,
ShootScriptAudioFiles object 用于语音驱动的音频文件上传URL列表。 script_cover_url String 剧本封面下载url。 表5 VoiceConfig 参数 参数类型 描述 voice_asset_id String 参数解释: 音色资产ID,可以从资产库中查询。
设置如下参数: 语言:从下拉框中选择问答文件的语言类型,默认为:中文。 问答库名称:输入问题库名称。 图7 创建问答库 单击“问答模板下载”,下载模板文件至本地,必须按照模板格式准备问答文件。 单击“选择文件”,上传已准备好的问答文件。 支持上传xlsx、xlm格式的文件,支持同
响应参数 状态码: 200 表2 响应Body参数 参数 参数类型 描述 csv_file_download_url String csv文件下载地址 state String 任务的状态。 PROCESSING:处理中 SUCCEED:成功 FAILED:失败 error_message
app_id String 第三方应用ID。 app_type Integer 对接第三方应用厂商类型。 说明: 0:科大讯飞AIUI;1:华为云CBS;2:科大讯飞星火交互认知大模型;5:第三方驱动;6:第三方语言模型;8:奇妙问 取值范围: 0-32 app_key String
app_id String 第三方应用ID。 app_type Integer 对接第三方应用厂商类型。 说明: 0:科大讯飞AIUI;1:华为云CBS;2:科大讯飞星火交互认知大模型;5:第三方驱动;6:第三方语言模型;8:奇妙问 取值范围: 0-32 app_key String
VC),输入命令:ffmpeg -i 视频文件名。 图3 检查视频是否是hevc编码 需要先安装ffmpeg,安装方法如下。 ffmpeg下载地址:https://github.com/BtbN/FFmpeg-Builds/releases。 ffmpeg解压后,将其下bin目录加入系统环境变量。
问答类型:选择“文档问答”。 问答库名称:请自定义名称,示例:robot。 图3 创建问答库 单击“创建”,进入“知识基本信息”页面,如图4所示。 可单击“下载模板”,将模板下载至本地,基于模板修改为实际的内容后上传至当前页面。 注意:MetaStudio服务目前仅支持读取docx(包含图文)、txt和md格式,其他格式暂不支持。
message String 审核信息。 attachment_name String 附件名称。 attachment_url String 附件下载地址。 audit_time Long 操作时间。 取值范围: 0-2147483647 状态码: 400 表6 响应Body参数 参数 参数类型
可查看视频合成任务的进度,直至合成成功。 单击“合成成功”状态右侧的图标,进入视频详情页面,如图4所示。 单击“预览”,可以看到合成的视频。预览过程中,可全屏播放,或下载视频到本地。 图4 视频详情
单击“点击上传国徽面”,从本地选择身份证国徽面照片上传。 形象声音授权 上传形象授权书。 操作如下所示: 单击“授权书模板”,将授权书模板下载本地。 打印授权书,由身份证本人完成签署操作。 扫描文件生成pdf文件,或拍摄文件生成jpg、jpeg、png格式的图片。 单击“上传授权
表2 请求Body参数 参数 是否必选 参数类型 描述 audio_file_download_url 是 String 语音驱动音频文件下载URL,格式为AAC或者MP3 frame_rate 是 Integer 期望的输出帧率 取值范围: 15-120 默认取值: 60 emotion
String 输出视频资产名称。 cover_url String 视频封面URL。 preview_video_url String 预览视频下载URL。URL有效期24小时。 说明: 分身数字人视频制作不支持预览。 表8 ErrorResponse 参数 参数类型 描述 error_code
HUMAN_MODEL_2D:分身数字人 HUMAN_MODEL_3D:3D数字人 script_cover_url String 剧本封面下载url。 script_type String 脚本类型,即视频制作的驱动方式。默认TEXT TEXT: 文本驱动,即通过TTS合成语音 AUDIO:
String 输出视频资产名称。 cover_url String 视频封面URL。 preview_video_url String 预览视频下载URL。URL有效期24小时。 说明: 分身数字人视频制作不支持预览。 表7 ErrorResponse 参数 参数类型 描述 error_code
break time="500ms"/>最重要的原则。 audio_file_download_url 否 String 语音驱动音频文件下载URL。 speed 否 Integer 语速。 取值范围[50,200] 默认值:100 取值范围: 50-200 默认取值: 100 pitch
String 输出视频资产名称。 cover_url String 视频封面URL。 preview_video_url String 预览视频下载URL。URL有效期24小时。 说明: 分身数字人视频制作不支持预览。 表8 ErrorResponse 参数 参数类型 描述 error_code
参数 参数类型 描述 provider String 第三方TTS供应商类型。 XIMALAYA:喜马拉雅TTS HUAWEI_EI:华为云EI TTS MOBVOI:出门问问 TTS AUDIOX:逻辑智能 TTS SINOVOICE:捷通华声 TTS DATABAKER:标贝
界面提示“保存成功”,说明应用配置页面的修改已生效。 配置热词。 展开“语音识别”下方的“高级设置”,如图9所示。 图9 应用配置 在“识别热词”区域,单击“下载热词模板”,将模板下载至本地。 本地打开模板文件,按照模板提示,输入需要添加的热词,示例如下所示: 数字人对话,weight:4.0 文件编辑完成后,单击“上传热词”,将文件上传至应用中。
SubtitleFileInfo 参数 是否必选 参数类型 描述 subtitle_file_download_url 否 String 字幕文件下载链接。 subtitle_file_upload_url 否 String 字幕文件上传链接。 subtitle_file_state 否