检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
取值范围: 最大支持5条预置话术。 单条话术字符长度0-1024位。 默认取值: 不涉及 reply_audios 否 Array of ReplyAudioInfo objects 参数解释: 回复音频集。填写audio_url。 约束限制: 不涉及 取值范围: 最大支持5条预置音频。
model_resolution String 分身数字人模型分辨率。默认是1080P。 1080P:1080P。支持1080P及720P的视频输出。 4K:4K。支持4K、1080P及720P的视频输出。 默认取值: 1080P app_user_id String 自定义用户i
取值范围: 最大支持5条预置话术。 单条话术字符长度0-1024位。 默认取值: 不涉及 reply_audios Array of ReplyAudioInfo objects 参数解释: 回复音频集。填写audio_url。 约束限制: 不涉及 取值范围: 最大支持5条预置音频。
声音制作限制 限制项 说明 Flexus形象和声音使用限制 Flexus分身数字人目前仅支持视频制作,不支持视频直播和智能交互。 视频制作限制 Flexus数字人采用实景拍摄,视频制作时不支持切换背景。 Flexus分身数字人左上角会有标识。未带有标识的数字人均为标准版形象。 需
动作视频样例可修改信息。 supported_service 否 Array of strings 该任务所生成的模型支持的业务类型,可多选。 Flexus版数字人仅支持选择“VIDEO_2D”。 默认取值: [VIDEO_2D,LIVE_2D] audio_source_type 否
真人正面照,不支持动漫卡通形象;面部占比50%以上,侧脸俯仰角度不超过15度。 五官清晰无遮挡,目视前方。 良好的亮度,确保面部细节。 照片内不能出现多张人脸。 人像照片格式要求,如下所示: 支持的格式为:PNG、JPG、JPEG、WEBP。 大小不超过16MB。 分辨率最大支持1080
产品咨询 数字内容生产线MetaStudio是什么? MetaStudio支持哪些区域? 开发者如何获取技术支持? 用户如何举报平台违规内容? 如何集成MetaStudio服务? 数字人相关问题
SP用户限制 表1 限制说明 限制项 说明 开放范围 SP用户仅对大客户开放申请和使用。 功能范围 SP用户仅支持购买大颗粒度资源包,并分配资源给关联租户使用。 SP用户不支持访问MetaStudio控制台,进行控制台操作。 父主题: 使用限制
基础版声音制作 女声 基础版媒体1.wav 基础版媒体2.wav 支持手机录制20条语料音频(5分钟),1-3天制作,快速获得类真人音色,mos分3.8。 短视频制作 进阶版声音制作 女声 进阶版媒体1.wav 进阶版媒体2.wav 支持手机录制100条语料音频(15分钟),1-3天制作,获得高还原度音色,mos分4
FAQ MetaStudio支持哪些区域? 开发者如何获取技术支持? 用户如何举报平台违规内容? 如何集成MetaStudio服务? 如何调用MetaStudio接口? 数字人相关问题 第三方平台的直播画面不清晰怎么办? 第三方平台的直播画面突然中断是怎么回事? 如何实时切换智能交互的语言和声音?
API使用限制 使用API调用声音的限制说明 用户使用视频直播或智能交互接口调用音色时,需要先确认能否在MetaStudio控制台的视频直播间编辑界面或智能交互对话设置页面,选到当前音色。 如果界面正常展示且可以选择此音色使用,说明接口可以正常调用此音色,否则接口无法调用。 API流控
多轮语境理解能力 配置数值越高,问答请求携带的历史对话个数越多,语境理解能力更强。 配置说明,如下所示: 如果设置为“1”,则问答请求时,不支持携带历史会话。 如果设置为非“1”,则问答请求时,携带历史会话。示例:取值为“3”时,问答请求中会携带1个最新问题,和历史最新的2个问题,
分身数字人名片制作支持开通或关闭按需计费。 照片数字人视频制作 左下角展示用户已购买资源的剩余量。 照片数字人视频制作支持开通或关闭按需计费。 声音合成 这里的声音合成,仅针对使用声音API调用,通过MetaStudio控制台声音制作方式生成的声音,来合成音频的费用。 声音合成支持开通或关闭按需计费。
视频文件的URL。 约束限制: 仅直播支持外部URL,其他业务通过资产库查询获取,不支持外部URL。 取值范围: 字符长度1-2048位。 默认取值: 不涉及。 video_cover_url 否 String 参数解释: 视频封面文件的URL。 约束限制: 仅直播支持外部URL,其他业务通过资产库查询获取,不支持外部URL。
视频文件的URL。 约束限制: 仅直播支持外部URL,其他业务通过资产库查询获取,不支持外部URL。 取值范围: 字符长度1-2048位。 默认取值: 不涉及。 video_cover_url 否 String 参数解释: 视频封面文件的URL。 约束限制: 仅直播支持外部URL,其他业务通过资产库查询获取,不支持外部URL。
视频文件的URL。 约束限制: 仅直播支持外部URL,其他业务通过资产库查询获取,不支持外部URL。 取值范围: 字符长度1-2048位。 默认取值: 不涉及。 video_cover_url String 参数解释: 视频封面文件的URL。 约束限制: 仅直播支持外部URL,其他业务通过资产库查询获取,不支持外部URL。
购买声音套餐 第三方声音支持的语言类型 购买出门问问声音套餐 父主题: 声音制作
示例1:上传资产 本节提供通过API Explorer和Postman工具,将资产上传至OBS桶的操作。 总体流程 调用创建资产接口创建资产ID。 调用创建文件并获取上传URL接口创建文件ID,并生成文件上传的URL地址。 使用Postman工具,参考OBS的PUT上传接口,将资产文件上传至URL地址中。
智能交互 智能交互支持富媒体吗? 如何自定义域名方式访问智能交互页面? 智能交互业务媒体流如何应对防火墙限制? 智能交互界面报错“MSS.20010135”如何处理? 如何实时切换智能交互的语言和声音?
获取账号ID 直播控制HTTP Command命令说明 直播控制RTSA Command命令说明 文本驱动SSML定义 系统资产标签定义 服务支持的字体 资源类型 使用Java代码生成文件内容的MD5值 预置音色ID列表 查询音色ID