检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
is_realtime_voice 否 Boolean 音色是否支持实时合成。仅在音色查询时有效。 说明: 支持实时合成的音色,可以用于直播和智能交互场景。否则只能用于视频制作。 human_model_2d_version 否 String 模型版本 include_device_name
加入RTC房间用户信息。 表7 RTCUserInfo 参数 参数类型 描述 user_type String 用户类型。 CAPTURE: 直播助手,将摄像头获取视频流推送到RTC房间 ANIMATION: VDS服务,从RTC房间拉视频流生成动作数据 RENDER: 渲染服务,将动作数据渲染成数字人动画
进阶版(100句话) ADVANCE: 高级版 THIRD_PARTY: 第三方出门问问训练版 THIRD_PARTY_LJZN: 第三方逻辑智能训练版 FLEXUS: Flexus版---用的是大模型特征提取 job_id String 任务id。 app_user_id String
ASSET_MANAGER:资产管理 MODELING_2D:形象制作 LIVE_2D:分身数字人视频直播 VIDEO_2D:分身数字人视频制作 CHAT_2D:分身数字人智能交互 BUSINESS_CARD_2D:分身数字人名片 PICTURE_2D:照片数字人视频 MODELING_3D:3D照片建模 VDS_3D:3D视觉驱动
of strings 支持的业务类型。: VIDEO_2D:分身数字人视频制作 LIVE_2D:分身数字人直播 CHAT_2D:分身数字人智能交互 表4 ReviewConfig 参数 是否必选 参数类型 描述 no_need_review 否 Boolean 免审核。 目前仅白
of strings 支持的业务类型。: VIDEO_2D:分身数字人视频制作 LIVE_2D:分身数字人直播 CHAT_2D:分身数字人智能交互 表5 AssetExtraMeta 参数 参数类型 描述 human_model_meta HumanModelAssetMeta object
高品质:约5个工作日。 自定义声音应用方式,如下所示: 自定义声音生成后,会自动展示在MetaStudio控制台声音列表中,可用于分身数字人视频制作、视频直播或智能交互等场景中。 通过MetaStudio的API调用自定义声音。 父主题: 声音制作
of strings 支持的业务类型。: VIDEO_2D:分身数字人视频制作 LIVE_2D:分身数字人直播 CHAT_2D:分身数字人智能交互 表4 ReviewConfig 参数 是否必选 参数类型 描述 no_need_review 否 Boolean 免审核。 目前仅白
ASSET_MANAGER:资产管理 MODELING_2D:形象制作 LIVE_2D:分身数字人视频直播 VIDEO_2D:分身数字人视频制作 CHAT_2D:分身数字人智能交互 BUSINESS_CARD_2D:分身数字人名片 PICTURE_2D:照片数字人视频 MODELING_3D:3D照片建模 VDS_3D:3D视觉驱动
说明操作,就可以详细了解了。 音频:从本地上传一个音频文件,支持MP4、WAV和M4A格式。当命中此规则后,使用此音频进行回复。 智能交互:通过智能交互的方式回复用户问题,相当于提供了一个第三方语言模型去答复用户问题。 回复问题的时候,支持同时在直播画面中展示图片或者视频信息,以
快门速度 至少小于等于“1/(帧率 * 4)”。 如帧率60,则快门速度小于1/240。 FAQ: 如果我的设备不能拍摄4K视频,只支持1080P怎么办? 若设备不支持,可尝试使用1080P(1080*1920)半身拍摄,以确保人脸区域的细节捕获。 我没有相机,能否使用手机拍摄 ? 目前
chat_video_start_time String 选取推理数据预处理智能交互视频起始时间。格式:“HH:MM:SS.mmm”。 chat_video_end_time String 选取推理数据预处理智能交互视频结束时间。格式:“HH:MM:SS.mmm”。 表11 InferenceActionMarkInfo
购买出门问问小语种克隆套餐的操作流程 如需使用“出门问问声音制作”方式自定义声音,并用于视频制作,需要参考下述内容进行操作。出门问问自定义声音暂不支持用于智能交互和视频直播。其支持的语言类型,如第三方声音支持的语言类型所示。 购买出门问问小语种克隆套餐包:如果用户需要使用“出门问问声音制作”方式
ASSET_MANAGER:资产管理 MODELING_2D:形象制作 LIVE_2D:分身数字人视频直播 VIDEO_2D:分身数字人视频制作 CHAT_2D:分身数字人智能交互 BUSINESS_CARD_2D:分身数字人名片 PICTURE_2D:照片数字人视频 MODELING_3D:3D照片建模 VDS_3D:3D视觉驱动
AnimationItem objects 手工指定的动作库动作数据。 motions Array of MotionItem objects 语义驱动的智能动作数据。 表6 AnimationItem 参数 参数类型 描述 animation_asset_id String 动作资产ID。 timestamp
的效率。 算法目的意图 通过学习语音与表情基系数的关系,实现使用语音生成视频的能力。在使用数据人形象生成视频的场景,包括短视频制作、直播、智能交互等,可快速生成不同台词的视频内容。
header需要增加X-Auth-Token字段用于鉴权。获取认证鉴权的方式,详见认证鉴权。 发送请求 发送请求的流程如下所示: 建立WebSocket连接。 发送TTS合成请求,详见请求参数。 请求参数 表1 请求Header参数 参数 是否必选 参数类型 参数位置 描述 X-Auth-Token