检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
确认在线录音结果 功能介绍 确认在线录音结果。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/voice-training-manage/user/training-segment 表1 路径参数 参数 是否必选 参数类型 描述 project_id
在右侧界面中,单击“网络设置”,进入“网络设置”页面。 在“权限”区域,单击“麦克风”,进入麦克风授权页面。 选择“网站可以请求使用您的麦克风”。如果默认已勾选此项,则已满足。 单击左上方的返回图标,返回到“网络设置”页面。 在“权限”区域,单击“摄像头”,进入摄像头授权页面。 选择“网站可以请求使用您的摄像头”。如果默认已勾选此项,则已满足。
获取在线录音确认结果 功能介绍 获取在线录音确认结果。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/voice-training-manage/user/training-segment 表1 路径参数 参数 是否必选 参数类型 描述 project_id
Windows或Android系统。 麦克风 需要有麦克风,且要保障1米以内的拾音效果。 扬声器 需要有扬声器。 触摸屏 需要有触摸屏。 带宽 4M以上。 由于浏览器的安全策略限制,仅支持通过“https://域名”方式访问,否则无法获取麦克风权限。 智能交互界面对浏览器的要求,如表2所示。
babel 7。 浏览器 浏览器使用限制,请参见表2。 由于浏览器的安全策略限制,仅支持通过“https://域名”方式访问,否则无法获取麦克风权限。 表2 浏览器适配详情 操作系统类型 浏览器类型 浏览器版本 Windows Chrome浏览器 91+ Edge浏览器 80+ Android
服务处理。 详细操作如下所示: 访问华为云官网。 选择“开发者 > 开发支持”,进入“开发者在线提单”界面。 单击“开发业务”区域的“数字内容生产线MetaStudio”,进入“开发者在线提单”页面。 请根据界面,输入相应的问题描述和个人联系方式等信息。 单击“提交问题”。 服务会在收到问题单后,联系您处理。
服务处理。 详细操作如下所示: 访问华为云官网。 选择“开发者 > 开发支持”,进入“开发者在线提单”界面。 单击“开发业务”区域的“数字内容生产线MetaStudio”,进入“开发者在线提单”页面。 请根据界面,输入相应的问题描述和个人联系方式等信息。 单击“提交问题”。 服务会在收到问题单后,联系您处理。
接口参考 主入口(HwICSUiSdk) 事件通知(EventMap) 错误码(ICSError) 授权浏览器麦克风的访问权限 父主题: Web SDK
确保环境安静无噪声,模特人声清晰,无其他人声干扰,尽量减少视频底噪。 建议使用小蜜蜂或其他专业麦克风搭配相机进行拍摄,会大幅降低视频底噪和其他环境噪声。但请注意:尽量隐藏麦克风不被拍摄到,否则生成的数字人形象会一直包含麦克风。 收音常见问题 如果我拍摄过程中有人闯入或出现突发声音,如雷声、汽车喇叭声等,要重新拍摄吗?
SDK支持华为云MetaStudio服务智能语音交互功能(以下简称“交互功能”)。为了提供交互功能,SDK会通过您主动点击聊天按钮申请客户应用或浏览器的麦克风权限,在您同意客户应用使用麦克风之后,将您的音频数据或文本数据上传到客户指定的第三方系统或模型,用于识别语义并做出应答,给您提供交互功能。 产品运营和维护
资源类型 MetaStudio计费中涉及的资源类型,包括商用资源类型、POC测试用需管理员分配的资源类型。 表1 商用资源类型(租户订购) 类别 资源名称 单位 计费模式 资源类型编码 备注 分身数字人 形象制作 个 一次性 hws.resource.type.metastudio
MetaStudio支持哪些区域? MetaStudio服务已商用,商用环境为“华北-北京四”。“华东-上海一”、“亚太-新加坡”目前仍为测试环境,如需使用,请提交工单处理。 父主题: 产品咨询
MetaStudio支持哪些区域? MetaStudio服务已商用,商用环境为“华北-北京四”。“华东-上海一”、“亚太-新加坡”目前仍为测试环境,如需使用,请提交工单处理。 父主题: FAQ
如果不具备专业录音设备,可使用手机录制音频,详情请参见手机录制音频。 录音环境安静,无回音、混响、噪声,避免出现汽车鸣笛、他人说话、走动等杂声。 可使用“分贝仪”应用来测试录音环境的底噪,建议底噪低于0dB。 同一批录音必须使用同一套录制设备和环境。 建议使用对应版本预置的文案样例:文案样例(基础版)、文案样例(进阶版)、文案样例(高品质)。
我们SDK在提供服务时会最小化的使用系统权限,您需要根据实际使用的功能申请对应的系统权限并向用户告知征得其同意。 权限 权限描述 使用目的 获取麦克风权限 获取浏览器的麦克风设备权限 开始语音交互时,用于进行语音识别文字,获取交互答案 四、延迟初始化要求 为了避免您的应用在未获取用户的同意前SDK提
通话所需的麦克风等设备是否就绪。 90100020 capture failed, maybe device is occupied by other application. 设备可能被其他应用程序占用,采集失败。请检查设备的使用状态。建议提示用户“暂时无法访问麦克风,请确保当
提交语音训练任务 查询语音训练任务详情 删除语音训练任务 查询任务操作日志 获取语音文件上传地址 获取语音训练任务审核结果 确认在线录音结果 获取在线录音确认结果
这样后面的模拟测试才能生效。 模拟测试 在“我的应用 > 应用配置”页面,单击界面右侧的“模拟测试”,如图14所示。 操作如下所示: 在界面上方的主菜单中,单击“我的应用”。 单击应用所在行的图标,进入当前应用的“应用配置”页面。 图14 应用配置页面 在“模拟测试”区域输入用户
回到“应用配置”页面,并F5刷新下当前“应用配置”页面,这样后面的模拟测试才能生效。 模拟测试 在“我的应用 > 应用配置”页面,单击界面右侧的“模拟测试”。 操作如下所示: 在界面上方的主菜单中,单击“我的应用”。 单击应用所在行的图标,进入当前应用的“应用配置”页面。 在“模拟测试”区域输入用户问题,进行用户问题模拟,查看对话效果,如图20所示。
播报内容生成后,单击右侧的“试听”,可以试听播报效果。 语音上传:本地录制音频后上传。音频格式需要为WAV或MP3格式,音频大小不超过20MB,时长不超过5分钟。 在线录音:在线录制音频。录音时长不能超过5分钟,为保证音频生成的效果,请保持录音环境安静无噪音。支持试听录制生成的语音。 文本驱动:通过输入文本,选