方式一:逐个新建问题分类及其语料。 单击图标,弹出“新建问题类别”对话框。 输入“问题类别名称”,示例:闲聊语料。 单击“确定”,“问题类别”区域新增“闲聊语料”。 单击“闲聊语料”,在右侧界面,单击“新建”,弹出“新建知识”对话框。 请根据实际情况输入问答内容,配置示例如图4所示。其中,“答案”必须选择“纯文本”。
单击“关联租户”,进入“关联租户”页面,如图2所示。 参数说明如下所示: 租户id:请输入项目ID,获取方式如获取项目ID所示。租户的项目ID必须与SP用户申请成为SP用户时,提供的项目ID所在Region保持一致。 租户名称:输入自定义租户名称,方便SP用户识别租户身份。 图2 关联租户 单击“创建”,租户创建完成,如图3所示。
视频中的语言仅支持中文和英文。 须知:“单独上传语料包”的方式生成Flexus声音的效果会更好。 数字人名称 生成的Flexus数字人名称。 示例:云笙。 联系方式 请输入有效的11位手机号码。 身份证照片 需要分别上传身份证人像面和国徽面的照片。 单击“点击上传人像面”,从本地选择身份证人像面照片上传。
基础版声音制作:需整段录制生成一个WAV或MP3格式的音频文件,时长3~10分钟,建议5分钟。 进阶版声音制作:需整段录制生成一个WAV或MP3格式的音频文件,时长10~30分钟,建议15分钟。 高品质声音制作:需整段录制生成一个WAV或MP3格式的音频文件,时长1小时以上,建议1小时。
您承诺在您开始使用本服务时是成年人。如您是未成年人,则需要您的父母或监护人同意您使用本服务并同意相关服务条款。 如果未成年人在未经父母或监护人同意的情况下向我们提供其个人信息,则父母或监护人可以联系我们以停止收集、使用或披露其个人信息。 如果我们发现在未事先获得可证实的父母或监护人同意的情况下收集了未成年人的个人信息,则会设法尽快删除相关数据。
区域 参数 说明 分身数字人训练数据上传 角色名称 输入分身数字人的角色名称。 示例:云笙。 训练视频 从本地上传已录制好,且符合拍摄要求的人像视频。 录制的视频要求4K,时长建议5~6分钟,分辨率≥1080P,宽高比16:9(横屏)或9:16(竖屏),建议优先使用竖屏拍摄,人物须
界面操作说明 区域 参数 说明 分身数字人训练数据上传 角色名称 输入分身数字人的角色名称。 示例:云笙。 须知: 形象训练完成后,可以在“我的创作 > 资源”页面,找到训练好的形象卡片,单击右下角的图标,从下拉框中选择“重命名”,修改角色名称。 训练视频 从本地上传已录制好,且符合拍摄要求的真人人像视频,训练生成数字人形象。
音字的发音或英文单词发音。 语法 1 2 <phoneme ph="string">文字</phoneme> The <phoneme ph="W EH1 DH AH0">weather</phoneme> is very good. 属性 表2 属性说明 属性名称 属性类型 属性值
String 过滤创建时间<=输入时间的记录。 create_since 否 String 过滤创建时间>=输入时间的记录。 update_until 否 String 过滤更新时间<=输入时间的记录。 update_since 否 String 过滤更新时间>=输入时间的记录。 state
image/jpeg:jpg或jpeg图片格式 image/png:png图片格式 audio/mp3:mp3音频格式 audio/wav:wav音频格式 video/mp4:mp4视频格式 application/octet-stream:二进制流数据,如ppt、pdf或其它格式视频。 B
选择“基础版声音制作”,音频格式为WAV或MP3文件。需整段录制,每句之间有2~3秒的停顿。音频时长3~10分钟,建议5分钟。 请完善声音信息 输入声音名称,示例:欢快女声。 请制作声音 使用“语料上传”的方式,直接上传一个已录制好的长音频WAV或MP3文件,无需压缩,无需携带文案txt文件。
默认取值: 0 limit 否 Integer 每页显示的条目数量。 取值范围: 1-100 默认取值: 10 name 否 String 按名称模糊查询。 script_catalog 否 String 剧本类型。默认查询VIDEO_DRAFT。 VIDEO_DRAFT:视频草稿。
界面元素 说明 定制数字人 单击“定制数字人”,跳转至形象制作页面,界面详情和操作指导,详见创建分身数字人定制任务。 数字人搜索框,可输入数字人名称进行精准搜索。 示例:云岚。 刷新图标。如果有关键词,按照关键词进行刷新展示;如果没有关键词,恢复为默认展示。 筛选条件 支持通过角色
duplicate 请修改房间名称。 20050038 mobvoi app not exist. 出门问问AK不存在,请更换其他音色或联系技术支持。 20050039 mobvoi account balance insufficient 出门问问账户余额不足,请更换其他音色或联系技术支持。 MSS
是男性声音还是女性声音。 FEMALE: 女性 MALE: 男性 默认取值: FEMALE voice_name 是 String 音色名称。该名称会作为资产库中音色模型资产名称。 language 否 String 训练语言,当前仅支持中文。 CN: 中文 EN: 英文 默认取值: CN create_type
支持新增、复制场景,并为每个场景设置对应的数字人形象、背景、声音等内容。 支持新增、复制段落,或使用txt格式文本导入剧本,平台自动解析输入内容。 直播剧本包含下述设置: 剧本驱动 支持下述三种方式任选其一: 文本驱动:输入文本,通过文本驱动数字人说话。 音频驱动:上传音频,通过音频驱动数字人说话。
X-Project-Id 否 String 使用AK/SK方式认证时必选,携带项目ID信息。 X-App-UserId 否 String 第三方用户ID。不允许输入中文。 响应参数 状态码:200 表3 响应Header参数 参数 参数类型 描述 X-Request-Id String 请求ID。 状态码:400
系统声音免费使用。第三方声音的计费方式,详见购买出门问问语音合成套餐包。 视频语音制作。 支持如下2种方式,可以按场景各选一种方式生成语音。 文本驱动 在文本输入框中,输入文本内容,以生成音频,如图1所示。 文本示例:今天是9月26日,星期二,天气晴朗,欢迎大家到访。我们精心布置了现场,室内摆放了各类植物
是否完整播放视频素材,默认关闭。 如果开启,当前场景的文本驱动或音频驱动不管是否有内容,均可合成视频,且该视频素材可以完整播放一次。 如果文本驱动或音频驱动没有内容,则直接提取视频素材中的音频去合成视频。 如果文本驱动或音频驱动有内容,那么合成的视频会同时包含文本驱动或音频驱动的声音和视频素材的声音。合成
技能。 查看应用信息:在MetaStudio服务创建“科大讯飞AIUI通用语义模型”智能交互对话项目时,需要使用这里的应用信息,包括:应用名称、APPID、APPKEY和APISECRET。 (可选)开启闲聊功能:闲聊功能可以丰富数字人问答内容,如:天气、旅游、假期等日常闲聊信息。
您即将访问非华为云网站,请注意账号财产安全