检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
真人正面照,不支持动漫卡通形象;面部占比50%以上,侧脸俯仰角度不超过15度。 五官清晰无遮挡,目视前方。 良好的亮度,确保面部细节。 照片内不能出现多张人脸。 人像照片格式要求,如下所示: 支持的格式为:PNG、JPG、JPEG、WEBP。 大小不超过16MB。 分辨率最大支持1080
算法原理:使用深度学习算法,将人像照片转换为数字人3D模型。 输出结果:数字人3D模型。 应用领域:数字人照片建模算法可应用于影视制作、仿真形象生成、虚拟现实等领域,能加速数字人3D模型产业的生产效率。 算法运行机制 选择一张已授权的人像照片作为输入。 输入的人像照片经过安全过滤,判断是否通过安全筛选,若不通过则不进行数据生成和结果返回操作。
产品咨询 数字内容生产线MetaStudio是什么? MetaStudio支持哪些区域? MetaStudio有哪些计费项? 开发者如何获取技术支持? 用户如何举报平台违规内容?
多轮语境理解能力 配置数值越高,问答请求携带的历史对话个数越多,语境理解能力更强。 配置说明,如下所示: 如果设置为“1”,则问答请求时,不支持携带历史会话。 如果设置为非“1”,则问答请求时,携带历史会话。示例:取值为“3”时,问答请求中会携带1个最新问题,和历史最新的2个问题,
基础版声音制作 女声 基础版媒体1.wav 基础版媒体2.wav 支持手机录制20条语料音频(5分钟),1-3天制作,快速获得类真人音色,mos分3.8。 短视频制作 进阶版声音制作 女声 进阶版媒体1.wav 进阶版媒体2.wav 支持手机录制100条语料音频(15分钟),1-3天制作,获得高还原度音色,mos分4
FAQ MetaStudio支持哪些区域? 开发者如何获取技术支持? 用户如何举报平台违规内容? 如何调用MetaStudio接口? 第三方平台的直播画面不清晰怎么办? 第三方平台的直播画面突然中断是怎么回事? 如何实时切换智能交互的语言和声音? 如何接收并激活声音和分身模型资产?
callback_event_type Array of strings 参数解释: 回调的直播事件类型列表。 约束限制: 不涉及。 取值范围: 当前仅支持如下取值: SHOOT_SCRIPT_SWITCH:剧本段落切换事件。 RTMP_STREAM_STATE_CHANGE:RTMP链接发生变化回调事件。
声音制作限制 声音制作限制说明,如表1所示。 表1 声音制作限制 限制项 说明 用户限制 MetaStudio不支持个人用户定制声音,仅支持企业用户。 定制声音时,从平台下载的授权书中有明确说明,定制音色需授权给公司使用。 父主题: 使用限制
SP用户限制 表1 限制说明 限制项 说明 开放范围 SP用户仅对大客户开放申请和使用。 功能范围 SP用户仅支持购买大颗粒度资源包,并分配资源给关联租户使用。 SP用户不支持访问MetaStudio控制台,进行控制台操作。 资源使用限制 SP用户购买形象制作时,不会赠送视频制作时长。
任务状态,默认所有状态。 可多个状态查询,使用英文逗号分隔。 如state=CREATING,PUBLISHED sort_key 否 String 排序字段,支持的排序方式有: 按创建时间排序:create_time 按更新时间排序:update_time 按资产排序:asset_order sort_dir
购买声音套餐 支持的语言类型 购买出门问问声音套餐 父主题: 声音制作
Key)加密调用请求。推荐使用AK/SK认证,其安全性比Token认证要高。 Token认证:通过Token认证调用请求。 AK/SK认证 AK/SK签名认证方式仅支持消息体大小在12MB以内,12MB以上的请求请使用Token认证。 AK/SK认证就是使用AK/SK对请求进行签名,在请求时将签名信息添加到消息头,从而通过身份认证。
智能交互 如何实时切换智能交互的语言和声音? 智能交互支持富媒体吗? 如何自定义域名方式访问智能交互页面? 智能交互业务媒体流如何应对防火墙限制?
获取账号ID 直播控制HTTP Command命令说明 直播控制RTSA Command命令说明 文本驱动SSML定义 系统资产标签定义 服务支持的字体 资源类型 使用Java代码生成文件内容的MD5值
约束限制: 不涉及 取值范围: 字符长度24位。 默认取值: 不涉及 file_size 是 Long 参数解释: 文件总的大小。 约束限制: 最大支持5GB 默认取值: 不涉及 取值范围: 1-5368709120 file_type 是 String 参数解释: 文件类型 约束限制: 不涉及
任务状态,默认所有状态。 可多个状态查询,使用英文逗号分隔。 如state=CREATING,PUBLISHED sort_key 否 String 排序字段,支持的排序方式有: 按创建时间排序:create_time 按更新时间排序:update_time 按资产排序:asset_order sort_dir
取值范围: 最大支持5条预置话术。 单条话术字符长度0-1024位。 默认取值: 不涉及 reply_audios 否 Array of ReplyAudioInfo objects 参数解释: 回复音频集。填写audio_url。 约束限制: 不涉及 取值范围: 最大支持5条预置音频。
任务状态,默认所有状态。 可多个状态查询,使用英文逗号分隔。 如state=CREATING,PUBLISHED sort_key 否 String 排序字段,支持的排序方式有: 按创建时间排序:create_time 按更新时间排序:update_time 按资产排序:asset_order sort_dir
可以参考本章节,查看已创建角色的对话记录。 操作步骤 登录奇妙问,左侧导航栏中,选择“会话记录”,如图1所示。 会话记录页面会展示所有角色的历史会话记录。 图1 会话记录 支持对会话进行如下操作。 可以通过项目名称、会话开始时间、会话结束时间,快速查询或者导出需要查看的角色会话信息。其中项目名称与角色名称相同。
voice_name 否 String 音色名称。该名称会作为资产库中音色模型资产名称。 language 否 String 训练语言,当前仅支持中文。 CN: 中文 EN: 英文 phone 否 String 手机号 app_user_id 否 String 第三方用户id 响应参数