检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
获取在线录音确认结果 功能介绍 获取在线录音确认结果。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/voice-training-manage/user/training-segment 表1 路径参数 参数 是否必选 参数类型 描述 project_id
选择“资源”页签,如图1所示。 图1 资源页面 单击界面右上方的图标,进入“接收资产管理”页面,如图2所示。 图2 接收资产管理页面 选择“待接收”页签,单击资产所在行的“接收”,如图3所示。 界面提示“资产接收成功”,说明资产接收完成。 图3 待接收资产 单击界面左上方的“返回”,回到“资源 > 已激活”页面。
手机录制音频 请根据手机类型,执行相应操作: 苹果手机操作 安卓手机 苹果手机操作 苹果手机推荐下载软件“简易录音机(Easy Voice Recorder)”进行录音,如图1所示。 图1 简易录音机 音频录制说明,如表1所示。 表1 音频录制说明 音频录制 说明 采样率 推荐使用48kHz采样率录制音频。
选择“资源”页签,如图1所示。 图1 资源页面 单击界面右上方的图标,进入“接收资产管理”页面,如图2所示。 图2 接收资产管理页面 选择“待接收”页签,单击资产所在行的“接收”,如图3所示。 界面提示“资产接收成功”,说明资产接收完成。 图3 待接收资产 单击界面左上方的“返回”,回到“资源 > 已激活”页面。
确认在线录音结果 功能介绍 确认在线录音结果。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/voice-training-manage/user/training-segment 表1 路径参数 参数 是否必选 参数类型 描述 project_id
分身形象和声音制作的处理方式相同,均需根据实际情况进行处理。下面以形象制作为例,进行说明。 如果当前分身形象制作的素材质量不佳,管理员会通过用户提交训练任务时输入的手机号联系用户。用户可以在管理员驳回任务后重新提交训练视频,进行数字人形象训练。形象制作任务制作完成前,形象制作资源一直处于占用状态,并未真正扣除。
如果开发过程中遇到问题,可以提单MetaStudio服务处理。 详细操作如下所示: 访问华为云官网。 选择“开发者 > 开发支持”,进入“开发者在线提单”界面。 单击“开发业务”区域的“数字内容生产线MetaStudio”,进入“开发者在线提单”页面。 请根据界面,输入相应的问题描述和个人联系方式等信息。
创建应用 参数 说明 第三方应用 从下拉框中选择“奇妙问”。 应用名称 设置当前智能交互数字人应用的名称。 账号 注册奇妙问的账号,即用户的手机号。 APPSECRET 用户在奇妙问创建角色的AppSecret。 RoleId 用户在奇妙问创建角色的RoleId。 对话内容合规审核
相关信息后,重新生成签署后的pdf文件,或者拍摄成jpg或png格式的图片后上传。 授权书内容,可参考授权书。 联系方式(可选) 请输入手机号。 单击“提交制作”。 弹出“资源消耗提示”对话框。提示用户目前声音制作服务剩余数量,本次将消耗1个资源。 如果用户确认无误,单击“确认提交”。
拍摄成jpg或png格式的图片后上传。 授权书内容,可参考授权书。 联系方式(可选) 可输入有效的手机号。 单击“提交制作”。 弹出“资源消耗提示”对话框。提示用户目前声音制作服务剩余数量,本次将消耗1个资源。 如果用户确认无误,单击“确认提交”。 声音制作任务提交成功后,界面提示“制作任务提交成功”,如图2所示。
抠除拍摄背景:制作分身数字人视频时,可以更换背景。 保留拍摄背景:分身数字人使用拍摄时的原背景,不支持更换背景。 身份认证及授权数据上传 联系方式 请输入有效的11位手机号码。 身份证照片 需要分别上传身份证人像面和国徽面的照片。 单击“点击上传人像面”,从本地选择身份证人像面照片上传。 单击“点击上传国徽面”,从本地选择身份证国徽面照片上传。
音色名称。该名称会作为资产库中音色模型资产名称。 language 否 String 训练语言,当前仅支持中文。 CN: 中文 EN: 英文 phone 否 String 手机号 app_user_id 否 String 第三方用户id output_language 否 String 模型输出语言类型 custom_text
服务处理。 详细操作如下所示: 访问华为云官网。 选择“开发者 > 开发支持”,进入“开发者在线提单”界面。 单击“开发业务”区域的“数字内容生产线MetaStudio”,进入“开发者在线提单”页面。 请根据界面,输入相应的问题描述和个人联系方式等信息。 单击“提交问题”。 服务会在收到问题单后,联系您处理。
wav~19.wav;文本文件命名规则:0.txt~19.txt。 语音文件和文本文件逐句上传:每次上传一句语料的语音文件和文本文件,再调用“确认在线录音结果”接口确认语音和文本内容是否一致。确认成功后再上传和确认下一句。 文件上传后,调用“提交语音训练任务”接口,启动审核和训练。 调用方法
wav~99.wav;文本文件命名规则:0.txt~99.txt。 语音文件和文本文件逐句上传:每次上传一句语料的语音文件和文本文件,再调用“确认在线录音结果”接口确认语音和文本内容是否一致。确认成功后再上传和确认下一句。 文件上传后,调用“提交语音训练任务”接口,启动审核和训练。 调用方法
界面输入问题标题、描述、更新后的视频或其他问题描述附件,服务确认后,将会在48小时内给出优化方案或者直接重新提交训练任务。 查看声音训练任务。 在“任务中心 > 声音制作”页面,查看生成的Flexus声音制作任务。 “服务类型”为“Flexus版”,声音名称为设置的“数字人名称”。Flexus声音制作任务耗时较短。
登录密码”,作为在MetaStudio控制台激活第三方声音的使用凭证。 访问云商店买家中心,进入“已购买的服务”界面。 可以看到已购买的语音合成套餐信息。 图8 已购买的服务 单击已购买套餐右侧的“资源详情”,进入资源详情界面。 需要记录“用户账号”和“登录密码”,如图9所示。
说明 用户账号 需要接收资产的租户,其所在Region的项目ID,获取方法请参见获取项目ID。 备注 转移资产的备注信息。 接收方式 租户接收资产的方式。 包含如下设置: 资产转移后用户自动接收:建议勾选,这样资产转移后,租户无需再执行接收资产的操作,否则需要参考接收资产进行操作。
形象制作 MetaStudio服务支持自定义生成分身数字人。 操作前准备 用户创建分身数字人定制任务前,需要参考操作步骤准备如下内容: 5~6分钟绿幕拍摄视频。 注意:如果制作分身形象的时候,选择保留拍摄背景,则需要准备实景背景拍摄视频。 身份证正反面照片。 形象授权签署文件,如授权书所示。
资产管理 如何接收并激活声音和分身模型资产?