检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
3D数字人语音驱动 创建语音驱动任务 2次/秒 2次/秒 - 获取语音驱动任务列表 20次/秒 10次/秒 - 创建语音驱动表情动画任务 2次/秒 2次/秒 - 获取语音驱动表情数据 20次/秒 10次/秒 - 获取语音驱动数据 20次/秒 10次/秒 - 3D数字人视频驱动 创建视频驱动任务
创建语音驱动表情动画任务 GET /v1/{project_id}/fas-jobs/{job_id} 获取语音驱动表情数据 GET /v1/{project_id}/ttsa-jobs/{job_id} 获取语音驱动数据 3D数字人视频驱动 表31 3D数字人视频驱动接口 接口
introduction_type 否 String 自我介绍驱动方式。 TEXT: 文本驱动,即通过TTS合成语音。文本驱动需要填写introduction_text和voice_asset_id参数。 AUDIO: 语音驱动,需要在资产库中先上传语音资产。语音驱动需要填写introduction_audio_asset_id参数。
introduction_type 否 String 自我介绍驱动方式。 TEXT: 文本驱动,即通过TTS合成语音。文本驱动需要填写introduction_text和voice_asset_id参数。 AUDIO: 语音驱动,需要在资产库中先上传语音资产。语音驱动需要填写introduction_audio_asset_id参数。
47010114 第三方文本驱动失败,文本长度超过最大值 第三方文本驱动失败,文本长度超过最大值 第三方文本驱动请携带正确长度的文本数据 400 MSS.47010115 第三方文本驱动失败,seq参数小于最小值 第三方文本驱动失败,seq参数小于最小值 第三方文本驱动请携带正确的seq参数信息
数字人主动播报与文本问答的区别是什么? 智能交互同时支持数字人主动播报和文本问答两种能力,两者都是通过文字驱动数字人讲话。 区别如下所示: 主动播报:主动播报是直接将sendDrivenText接口传入的文本作为数字人播报内容,来驱动数字人讲话。 文本问答:文本问答是使用sendTextQuestion接口输
introduction_type String 自我介绍驱动方式。 TEXT: 文本驱动,即通过TTS合成语音 AUDIO: 语音驱动,需要在资产库中先上传语音资产 默认取值: TEXT introduction_text String 自我介绍文本,用于驱动数字人口型。 voice_asset_id
限制 场景 一个视频草稿的场景数量不能超过50个。 文本驱动 每个单场景输入文字的数量不超过1万字。 所有场景输入文字的数量不超过10万字。 每个单场景如果包含语音合成标记语言SSML标签,文字数量需小于128K。 音频驱动 每个单场景上传音频的大小不超过100M。 视频格式 插
BUSINESS_CARD_2D:分身数字人名片 PICTURE_2D:照片数字人视频 MODELING_3D:3D照片建模 VDS_3D:3D视觉驱动 TTSA_3D:3D语音驱动 FLEXUS_2D:FLEXUS版本资源 请求参数 表3 请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token
直播间配置 限制 文本驱动 每个单场景中所有段落输入文字的总量需大于200字。 每个段落的文本字符数量需小于2000,如果包含语音合成标记语言SSML标签,需小于3000。 整个直播间所有段落的文本总字符数,如果包含语音合成标记语言SSML标签时,需小于30万。 音频驱动 每个单场景上传
出门问问的数字人平台对接至智能交互服务,开发者基于SDK完成web界面开发,操作请参考创建智能交互数字人(奇妙问)。 开发者自己提供LLM或者大模型,调用智能交互的文本驱动数字人能力。智能交互服务不感知用户自己的LLM或者大模型,只提供API接口和Web SDK。操作请参考创建智能交互数字人(二次开发场景)。
用于互动回复。数字人不变,背景不变。params结构定义:PlayTextInfo。 INSERT_PLAY_AUDIO:插入驱动音频。用于音频直接驱动。数字人不变,背景不变。params结构定义:PlayAudioInfo。 REWRITE_PLAY_SCRIPT:动态编辑未播
参数类型 描述 script_type String 参数解释: 脚本类型,即视频制作的驱动方式 约束限制: 不涉及 取值范围 TEXT: 文本驱动,即通过TTS合成语音 AUDIO: 语音驱动 默认取值: TEXT text_config TextConfig object 讲解词配置。
BUSINESS_CARD_2D:分身数字人名片 PICTURE_2D:照片数字人视频 MODELING_3D:3D照片建模 VDS_3D:3D视觉驱动 TTSA_3D:3D语音驱动 FLEXUS_2D:FLEXUS版本资源 resource_source 是 String 资源来源,可填多个 例如:PURCHASED
如何调用MetaStudio接口? 照片建模任务创建失败是什么原因? 照片建模任务出现异常问题怎么办? 风格化照片建模的照片有什么要求? 肢体驱动数据格式如何定义? 更多 智能客服 您好!我是有问必答知识渊博的的智能问答机器人,有问题欢迎随时求助哦! 社区求助 华为云社区是华为云用户
finish 上一轮文本驱动未结束请等待 MSS.47015015 the sis service frozen please check 语音识别服务欠费不可用,请联系管理员检查 MSS.47015016 text drive length limit 驱动文本长度过大(不大于500字)
静默状态,等待恢复剧本播放的指令。 TAKE_OVER:真人接管状态。MetaStudio直播服务会获取RTC通道中来自主播端的音频,实时驱动数字人进行直播。 PLAY_END:退出直播任务状态。 RTSA Command定义 RTC User Render用户通过COMMAND通道发送服务端状态通知。
参数类型 描述 script_type 否 String 参数解释: 脚本类型,即视频制作的驱动方式 约束限制: 不涉及 取值范围 TEXT: 文本驱动,即通过TTS合成语音 AUDIO: 语音驱动 默认取值: TEXT text_config 否 TextConfig object 讲解词配置。
新增直播任务管理接口。 2023-08-07 第二次正式发布 本次变更如下: 更新3个接口的请求参数和响应参数,包括:查询资产列表、查询资产详情和获取语音驱动数据接口。 2022-12-27 第一次正式发布。
3D数字人 照片建模 左下角展示用户已购买资源的剩余量。单击图标,可以查看剩余量详情的列表数据。 语音驱动 左下角展示用户已购买资源的剩余量。单击图标,可以查看剩余量详情的列表数据。 视觉驱动 左下角展示用户已购买资源的剩余量。 资产管理 资产管理 左下角展示资产存储空间的已使用量,单位:GB。