检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
图层位置配置。 size LayerSizeConfig object 图层大小配置。 image_config ImageLayerConfig object 素材图片图层配置。 video_config VideoLayerConfig object 素材视频图层配置。 text_config
声音制作任务管理 查询用户配置的个性化音频时长 创建基础版语音训练任务 创建进阶版语音训练任务 创建高级版语音训练任务 查询语音训练任务列表 提交语音训练任务 查询语音训练任务详情 删除语音训练任务 查询任务操作日志 获取语音文件上传地址 获取语音训练任务审核结果 设置任务批次 确认在线录音结果
limit 否 Integer 每页显示的条目数量。 取值范围: 1-100 默认取值: 10 state 否 String 任务状态,默认所有状态。 可多个状态查询,使用英文逗号分隔。 如state=CREATING,PUBLISHED sort_key 否 String 排序字段,支持的排序方式有:
LayerPositionConfig object 图层位置配置。 size 否 LayerSizeConfig object 图层大小配置。 image_config 否 SmartImageLayerConfig object 素材图片图层配置。 video_config 否 SmartVideoLayerConfig
文件类型为mp3,Content-Type填写audio/mp3 文件类型为wav,Content-Type填写audio/wav 其余所有类型,Content-Type填写application/octet-stream 状态码:400 表6 响应Body参数 参数 参数类型
LayerPositionConfig object 图层位置配置。 size LayerSizeConfig object 图层大小配置。 image_config SmartImageLayerConfig object 素材图片图层配置。 video_config SmartVideoLayerConfig
数,需订购套餐包。 操作步骤 在AIUI开放平台界面上方的主菜单中,选择“产品接入 > 我的应用”。 单击新增应用所在行的图标,进入“应用配置”页面。 在左侧导航栏中,选择“应用数据统计 > 服务统计”,进入“服务统计”页面,如图1所示。 通过下图可以看出,科大讯飞免费赠送500次/天的问答交互。
选中左侧的互动库,单击界面右侧的“新建”,弹出“新建互动”对话框,如图3所示。 可以给当前互动库,新增1条互动规则。参数配置说明,如表1所示。 图3 互动规则 表1 互动规则配置说明 参数 说明 类型 互动类型。 包含如下选项: 弹幕 用户入场 点赞 送礼 互动名称(可选) 互动名称。 触发方式
limit 否 Integer 每页显示的条目数量。 取值范围: 1-100 默认取值: 10 state 否 String 任务状态,默认所有状态。 可多个状态查询,使用英文逗号分隔。 如state=CREATING,PUBLISHED sort_key 否 String 排序字段,支持的排序方式有:
limit 否 Integer 每页显示的条目数量。 取值范围: 1-100 默认取值: 10 state 否 String 任务状态,默认所有状态。 可多个状态查询,使用英文逗号分隔。 如state=CREATING,PUBLISHED sort_key 否 String 排序字段,支持的排序方式有:
object 华为云CBS应用配置 iflytek_aiui_config 否 IflytekAiuiConfig object 科大讯飞AIUI应用配置 iflytek_spark 否 IflytekSpark object 科大讯飞星火大模型应用配置 third_party_model_config
照片数字人限制 照片数字人视频制作限制说明,如表1所示。 表1 照片数字人视频制作限制 照片数字人视频制作配置 限制 人像照片 制作照片数字人的人像照片拍摄要求,如下所示: 真人正面照,不支持动漫卡通形象;面部占比50%以上,侧脸俯仰角度不超过15度。 五官清晰无遮挡,目视前方。
不能使用短音频复制拼接成长音频,会影响训练效果,无法通过审核。 录制提交 表3 录音内容提交规范 声音类型 音频说明 音频命名 基础版 需整段录制所有语料生成一个长音频WAV或MP3格式文件,每句之间有2~3秒的停顿。WAV或MP3格式文件可直接上传MetaStudio控制台,无需压缩,无需提供语料txt文件。
CONFIRM_MULTIPART_UPLOADED:确认训练视频所有分片文件已上传 GET_ACTION_VIDEO_MULTIPART_UPLOADED:获取动作编排视频分片上传地址 CONFIRM_ACTION_VIDEO_MULTIPART_UPLOADED:确认动作编排视频所有分片文件已上传 说明: CON
目前MetaStudio提供了Java、Python和Go语言SDK供开发者使用,如表1所示。您可以在GitHub仓库查看SDK更新历史、获取安装包以及查看指导文档。 SDK已知安全漏洞及修复版本、规避方案,请单击表1中的SDK对应语言的Github地址进行查看。 表1 服务端SDK
制作页面。 界面左侧是声音制作页面,右侧为声音制作流程。声音制作录制教程,可以帮助用户快速制作声音。 图1 定制声音 在“华为模型”页签,配置声音制作参数。 界面操作详情,如表1所示。 表1 界面操作说明 区域 说明 声音制作方式 MetaStudio提供下述声音制作方式: 基础
五、最小化使用功能要求 我们的SDK针对扩展功能和可选的个人信息的处理提供了配置能力,您可以基于业务诉求选择开启或关闭相关功能。 1. 如何开启或关闭扩展功能 您可以通过setConfig或者create接口配置开启或关闭字幕、语音交互等扩展功能,以为您提供字幕、语音交互等服务。 2
object 华为云CBS应用配置 iflytek_aiui_config 否 IflytekAiuiConfig object 科大讯飞AIUI应用配置 iflytek_spark 否 IflytekSpark object 科大讯飞星火大模型应用配置 third_party_model_config
object 华为云CBS应用配置 iflytek_aiui_config 否 IflytekAiuiConfig object 科大讯飞AIUI应用配置 iflytek_spark 否 IflytekSpark object 科大讯飞星火大模型应用配置 third_party_model_config
默认取值: VIDEO voice_properties 否 VoiceProperties object 声音配置信息,为Flexus版声音的配置项,标准版声音不支持此配置。 supported_service 否 Array of strings 该任务所生成的模型支持的业务类型,可多选。