检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
获取动作编排视频分片 取值范围: 0-64 video_multipart_count 否 Integer 训练视频上传分片数(上传时对唯一训练视频文件的数据分片,用于对该文件的并发上传,不是分多个视频文件上传)。 取值范围: 1-1000 默认取值: 1 action_video_multipart_count
描述 X-Request-Id String 请求ID。 表5 响应Body参数 参数 参数类型 描述 offset Integer 与第一条数据的偏移量 取值范围: 0-2147483647 默认取值: 0 limit Integer 页面大小 取值范围: 1-1000 默认取值:
描述 X-Request-Id String 请求ID。 表5 响应Body参数 参数 参数类型 描述 offset Integer 与第一条数据的偏移量 取值范围: 0-2147483647 默认取值: 0 limit Integer 页面大小 取值范围: 1-1000 默认取值:
默认取值: UPLOAD_VIDEO video_multipart_count 否 Integer 训练视频上传分片数(上传时对唯一训练视频文件的数据分片,用于对该文件的并发上传,不是分多个视频文件上传)。 取值范围: 1-1000 默认取值: 1 action_video_multipart_count
描述 X-Request-Id String 请求ID。 表5 响应Body参数 参数 参数类型 描述 offset Integer 与第一条数据的偏移量 取值范围: 0-2147483647 默认取值: 0 limit Integer 页面大小 取值范围: 1-1000 默认取值:
描述 X-Request-Id String 请求ID。 表5 响应Body参数 参数 参数类型 描述 offset Integer 与第一条数据的偏移量 取值范围: 0-2147483647 默认取值: 0 limit Integer 页面大小 取值范围: 1-1000 默认取值:
如需使用第三方声音进行语音合成,请购买出门问问声音套餐。 图1 声音合成 功能介绍 该接口用于TTS流式合成音频,用于文本转化为语音,并实时返回合成的音频数据。 调用方法 构造请求 请求URL:wss://metastudio-api.{region}.myhuaweicloud.com:443
package_url 参数 参数类型 描述 training_data_uploading_url String 上传的训练数据地址,用户需要将训练数据打成zip包后上传到该url。 说明: 通过该obs地址上传时需要设置content-type为application/zip
描述 X-Request-Id String 请求ID。 表5 响应Body参数 参数 参数类型 描述 offset Integer 与第一条数据的偏移量 取值范围: 0-2147483647 默认取值: 0 limit Integer 页面大小 取值范围: 1-1000 默认取值:
描述 X-Request-Id String 请求ID。 表5 响应Body参数 参数 参数类型 描述 offset Integer 与第一条数据的偏移量 取值范围: 0-2147483647 默认取值: 0 limit Integer 页面大小 取值范围: 1-1000 默认取值:
CAPTURE: 直播助手,将摄像头获取视频流推送到RTC房间 ANIMATION: VDS服务,从RTC房间拉视频流生成动作数据 RENDER: 渲染服务,将动作数据渲染成数字人动画 PLAYER: 普通观看方,可选择原始视频流或者数字人动画视频流观看 INFERENCE_USER:
描述 X-Request-Id String 请求ID。 表5 响应Body参数 参数 参数类型 描述 offset Integer 与第一条数据的偏移量 取值范围: 0-2147483647 默认取值: 0 limit Integer 页面大小 取值范围: 1-1000 默认取值:
描述 X-Request-Id String 请求ID。 表5 响应Body参数 参数 参数类型 描述 offset Integer 与第一条数据的偏移量 取值范围: 0-2147483647 默认取值: 0 limit Integer 页面大小 取值范围: 1-1000 默认取值:
CAPTURE: 直播助手,将摄像头获取视频流推送到RTC房间 ANIMATION: VDS服务,从RTC房间拉视频流生成动作数据 RENDER: 渲染服务,将动作数据渲染成数字人动画 PLAYER: 普通观看方,可选择原始视频流或者数字人动画视频流观看 INFERENCE_USER:
CAPTURE: 直播助手,将摄像头获取视频流推送到RTC房间 ANIMATION: VDS服务,从RTC房间拉视频流生成动作数据 RENDER: 渲染服务,将动作数据渲染成数字人动画 PLAYER: 普通观看方,可选择原始视频流或者数字人动画视频流观看 INFERENCE_USER:
StyleAssetItem objects 风格化素材资产组合。 extra_meta StyleExtraMeta object 数字人风格额外元数据信息 style_id String 数字人风格ID create_time String 数字人风格创建时间,格式遵循:RFC 3339。
使用RTMP推流时,关闭控制台页面不等于结束直播任务,画面会持续生成并计费。如需结束直播画面,需手动单击结束直播或通过API下发结束命令。 直播平台的规定及相关政策请自行了解,部分平台可能限制虚拟内容直播。 输出设置 直播画面 选择直播画面的清晰度。 包含如下选项: 流畅 高清 超清 默认值:高清。
再说说其他的,比如你要做原型图,那你可以使用墨刀。 它是一个强大的原型设计工具,大厂的产品经理都在用,能帮你快速做出精美的原型,适用于网站、App等数字产品的设计和开发。 如果要做脑图,亿图可是不二之选,帮你整理思路、分享信息,简直就是工作的好伙伴! 当然了,万兴科技也完全不只是这几款产品,不知道大家有没
示例:4. 它不仅拥有出色的功能,还具备卓越的性能,序号4无需阅读。 音频格式 推荐使用无损音质格式保存音频文件,如WAV、MP3格式。 原始录音数据,需为48kHz采样率、16bit编码和单声道。 录制风格 录制全程保持语境风格一致,避免多种情绪混杂。如直播场景时,录制风格需接近日常直播效果。
支持流式文本消息。seq为流式文本序号,从1开始计数;is_last用于判断流式文本的最后一包数据。如果不使用流式文本消息,seq设置为“1”,is_last设置为“true”。 建议每个分包数据长度大于6个字,否则可能会导致数字人说话卡顿。 详细交互流程如下所示: 用户发送文本驱动消息。