检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
描述 X-Request-Id String 请求ID。 表5 响应Body参数 参数 参数类型 描述 offset Integer 与第一条数据的偏移量 取值范围: 0-2147483647 默认取值: 0 limit Integer 页面大小 取值范围: 1-1000 默认取值:
支持使用查询资产列表接口,查询音色ID。需要设置如下参数: offset=0:从第一个音色开始查询,可以根据实际情况设置。 limit=60:一次可以查询的声音数据,可以根据实际情况设置。 asset_type=VOICE_MODEL:资产类型为音色模型。 asset_state=ACTIVED:资产为已激活状态。
新增直播任务管理接口。 2023-08-07 第二次正式发布 本次变更如下: 更新3个接口的请求参数和响应参数,包括:查询资产列表、查询资产详情和获取语音驱动数据接口。 2022-12-27 第一次正式发布。
描述 X-Request-Id String 请求ID。 表5 响应Body参数 参数 参数类型 描述 offset Integer 与第一条数据的偏移量 取值范围: 0-2147483647 默认取值: 0 limit Integer 页面大小 取值范围: 1-1000 默认取值:
描述 X-Request-Id String 请求ID。 表5 响应Body参数 参数 参数类型 描述 offset Integer 与第一条数据的偏移量 取值范围: 0-2147483647 默认取值: 0 limit Integer 页面大小 取值范围: 1-1000 默认取值:
CAPTURE: 直播助手,将摄像头获取视频流推送到RTC房间 ANIMATION: VDS服务,从RTC房间拉视频流生成动作数据 RENDER: 渲染服务,将动作数据渲染成数字人动画 PLAYER: 普通观看方,可选择原始视频流或者数字人动画视频流观看 INFERENCE_USER:
查询参数,是可选部分,并不是每个API都有查询参数。查询参数前面需要带一个“?”,形式为“参数名=参数取值”,例如“?limit=10”,表示查询不超过10条数据。 例如您需要创建IAM用户,由于IAM为全局服务,则使用任一区域的Endpoint,比如“华北-北京四”区域的Endpoint(iam.cn-north-4
CAPTURE: 直播助手,将摄像头获取视频流推送到RTC房间 ANIMATION: VDS服务,从RTC房间拉视频流生成动作数据 RENDER: 渲染服务,将动作数据渲染成数字人动画 PLAYER: 普通观看方,可选择原始视频流或者数字人动画视频流观看 INFERENCE_USER:
CAPTURE: 直播助手,将摄像头获取视频流推送到RTC房间 ANIMATION: VDS服务,从RTC房间拉视频流生成动作数据 RENDER: 渲染服务,将动作数据渲染成数字人动画 PLAYER: 普通观看方,可选择原始视频流或者数字人动画视频流观看 INFERENCE_USER:
如需使用第三方声音进行语音合成,请购买出门问问声音套餐。 图1 声音合成 功能介绍 该接口用于TTS流式合成音频,用于文本转化为语音,并实时返回合成的音频数据。 调用方法 构造请求 请求URL:wss://metastudio-api.{region}.myhuaweicloud.com:443
package_url 参数 参数类型 描述 training_data_uploading_url String 上传的训练数据地址,用户需要将训练数据打成zip包后上传到该url。 说明: 通过该obs地址上传时需要设置content-type为application/zip
FullAccess策略内容 MetaStudio ReadOnlyAccess MetaStudio只读权限,拥有该权限的用户仅能查看MetaStudio数据。 系统策略 MetaStudio ReadOnlyAccess策略内容 相关链接 IAM产品介绍 创建用户组、用户并授予MetaStud
SUCCEED:任务处理成功 FAILED:任务处理时变 CANCELED:任务取消 BLOCKED:任务被冻结 priv_data String 私有数据,用户填写,原样带回。 confirm_state String 直播间确认状态。此状态仅用于特定用户需要人工确认场景。 UNCONFIRM:
CAPTURE: 直播助手,将摄像头获取视频流推送到RTC房间 ANIMATION: VDS服务,从RTC房间拉视频流生成动作数据 RENDER: 渲染服务,将动作数据渲染成数字人动画 PLAYER: 普通观看方,可选择原始视频流或者数字人动画视频流观看 INFERENCE_USER:
示例:4. 它不仅拥有出色的功能,还具备卓越的性能,序号4无需阅读。 音频格式 推荐使用无损音质格式保存音频文件,如WAV、MP3格式。 原始录音数据,需为48kHz采样率、16bit编码和单声道。 录制风格 录制全程保持语境风格一致,避免多种情绪混杂。如直播场景时,录制风格需接近日常直播效果。
支持流式文本消息。seq为流式文本序号,从1开始计数;is_last用于判断流式文本的最后一包数据。如果不使用流式文本消息,seq设置为“1”,is_last设置为“true”。 建议每个分包数据长度大于6个字,否则可能会导致数字人说话卡顿。 详细交互流程如下所示: 用户发送文本驱动消息。
分身数字人视频制作不需要填写该参数。 取值范围: 字符长度0-64位 默认取值: 不涉及 priv_data String 参数解释: 私有数据,用户填写,原样带回。 约束限制: 不涉及 取值范围: 字符长度0-8192位 默认取值: 不涉及 background_music_config
从中国音乐家发布的数据来看,国内有超过四千万孩子学习钢琴。 占全球总数的百分之八十,且每年以百分之十的速度增长。 近日,中国探月航天形象太空兔正式对外公布名称, 中文名“兔星星”。 据悉,今年上半年,中国造船三大指标全面增长, 造船完工量,新接订单量,手持订单量,三大指标的国际市场份额均为全球第一。
以正常调用该音色,否则无法通过API调用此音色。 智能交互接口 下述三个智能交互接口组,仅适用于科大讯飞AIUI通用语义模型和星火交互认知大模型场景。 智能交互数字人知识库技能管理 智能交互数字人知识库意图管理 智能交互数字人知识库问法管理 API流控 数字内容生产线服务对服务端
一天就是30万的播放量。 如果大家已经有了完整的视频生产流程和稳定的流量,那么可以考虑生成个人的数字人,现在很多大咖在运用数字人以后,整体数据也没有太大的下滑。 期间,省去的就是人力、时间、成本,企业可以去做更专业的事情。 目前咱们万兴播爆的会员价格,提供了月度、季度、年度三个价格。