检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
手机录制音频 请根据手机类型,执行相应操作: 苹果手机操作 安卓手机 苹果手机操作 苹果手机推荐下载软件“简易录音机(Easy Voice Recorder)”进行录音,如图1所示。 图1 简易录音机 音频录制说明,如表1所示。 表1 音频录制说明 音频录制 说明 采样率 推荐使用48kHz采样率录制音频。
在“直播管理”页签,单击“创建直播间”,进入视频直播制作界面。 选择“互动设置”,单击右侧的“设置”,弹出“智能交互”对话框,如图1所示。 参数配置说明,如表1所示。 图1 智能交互设置 表1 参数说明 参数 说明 应用 请先参考后续步骤5,创建完成应用后,再从下拉框中选择此应用。 弹幕触发间隔时间
tudio服务概览页面。 在左侧导航栏中,选择“子账户隔离配置 > 账户设置”,进入“账户设置”页面,如图1所示。 图1 账户设置 参数配置说明,如表1所示。 表1 参数配置 区域 参数 说明 IAM用户设置 IAM子账户隔离能力 支持开启IAM子账号隔离能力。 取值如下所示:
设置任务批次 功能介绍 用户设置任务批次,该接口用于批量任务管理场景,设置任务的批次 需要开通NA租户权限后才能正常调用 调用方法 请参见如何调用API。 URI PUT /v1/{project_id}/voice-training-manage/user/batch 表1 路径参数
录音文案 基础版 优先使用专业录音设备录制音频,推荐使用Adobe Audition软件进行录音。 如果不具备专业录音设备,可使用手机录制音频,详情请参见手机录制音频。 录音环境安静,无回音、混响、噪声,避免出现汽车鸣笛、他人说话、走动等杂声。 可使用“分贝仪”应用来测试录音环境的底噪,建议底噪低于0dB。
演讲过程中不限制说话的内容,出现失误可直接略过或从错误位置继续说话,无需打断拍摄。 背景尽量维持静态,不能出现规律性或大幅度的背景变化。 画面保持稳定,建议使用手机支架或手机稳定器。 在光线充足的地方拍摄,避免出现脸部光照不均匀或“阴阳脸”。 父主题: Flexus分身数字人
设置TTS租户级自定义读法配置 功能介绍 该接口用于设置TTS租户级自定义读法配置。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/ttsc/vocabulary-configs 表1 路径参数 参数 是否必选 参数类型 描述 project_id
须知:“单独上传语料包”的方式生成Flexus声音的效果会更好。 数字人名称 生成的Flexus数字人名称。 示例:云笙。 联系方式 请输入有效的11位手机号码。 身份证照片 需要分别上传身份证人像面和国徽面的照片。 单击“点击上传人像面”,从本地选择身份证人像面照片上传。 单击“点击上传国徽面”,从本地选择身份证国徽面照片上传。
谷歌浏览器 打开Chrome浏览器,单击浏览器右上方的图标,从下拉框中选择“设置”。 进入“设置”页面。 在左侧导航栏中,选择“隐私设置和安全性”。 在右侧界面中,单击“网络设置”,进入“网络设置”页面。 在“权限”区域,单击“麦克风”,进入麦克风授权页面。 选择“网站可以请
'modelData.js', initModel: true, }); 注意:如果未设置wasmPath和dataPath或设置的不对,会报类似下面的异常。 此时语音唤醒是无法正常使用的,需要将路径设置为正确的才行。 图1 异常报错 interactionModeSwitch (static)
分身形象和声音制作的处理方式相同,均需根据实际情况进行处理。下面以形象制作为例,进行说明。 如果当前分身形象制作的素材质量不佳,管理员会通过用户提交训练任务时输入的手机号联系用户。用户可以在管理员驳回任务后重新提交训练视频,进行数字人形象训练。形象制作任务制作完成前,形象制作资源一直处于占用状态,并未真正扣除。
在智能交互编辑页面,依次设置角色和背景。 查看界面右侧的“互动问答”页签,,如图1所示。 参数配置说明如表1所示。 图1 创建应用 表1 创建应用 参数 说明 第三方应用 从下拉框中选择“奇妙问”。 应用名称 设置当前智能交互数字人应用的名称。 账号 注册奇妙问的账号,即用户的手机号。 APPSECRET
配置特殊词表 支持全局设置自定义读法,设置完成后,所有视频制作剧本自动生效。 操作步骤 登录MetaStudio控制台。 在左侧导航栏中,单击“我的创作”。 选择“声音”页签,单击界面右侧的“特殊词表”,进入如图1所示的界面。 图1 特殊词表 单击“新建词表”,界面新增一行自定义读法,如图2所示。
MetaStudio控制台的视频直播间编辑界面或智能交互对话设置页面,选到当前音色。 如果界面正常展示且可以选择此音色使用,说明接口可以正常调用此音色,否则接口无法调用。 API流控 数字内容生产线服务对服务端API设置了调用次数限制,避免出现短时间内重复调用API,服务中断的情况。
时,“作用范围”需要选择“区域级项目”,然后在指定区域(如华北-北京四)对应的项目(cn-north-4)中设置相关权限,并且该权限仅对此项目生效;如果在“所有项目”中设置权限,则该权限在所有区域项目中都生效。访问MetaStudio时,需要先切换至授权区域。 权限根据授权精细程度分为角色和策略。
String 上传训练数据的地址。训练数据需打包成zip文件后,上传至该url。 create_type取值为package时设置。 说明: 通过该obs地址上传时,需设置content-type为application/zip。 segment_uploading_url segment_uploading_url
女声 基础版媒体1.wav 基础版媒体2.wav 支持手机录制20条语料音频(5分钟),1-3天制作,快速获得类真人音色,mos分3.8。 短视频制作 进阶版声音制作 女声 进阶版媒体1.wav 进阶版媒体2.wav 支持手机录制100条语料音频(15分钟),1-3天制作,获得高还原度音色,mos分4
分身数字人Flexus版针对中小企业客户,提供1080P的实景数字人、1分钟语料声音克隆能力和120分钟1080P视频制作能力,帮助客户通过手机拍摄即可轻松制作数字人。Flexus分身数字人不仅简化制作流程,还显著降低技术门槛,且购买简单,为中小企业提供超简单、超高性价比数字人。 使用限制
附录 授权书 手机录制音频 客户声音制作案例 第三方平台开播指南 FAQ
分身数字人Flexus版针对中小企业客户,提供1080P的实景数字人、1分钟语料声音克隆能力和120分钟1080P视频制作能力,帮助客户通过手机拍摄即可轻松制作数字人。Flexus分身数字人不仅简化制作流程,还显著降低技术门槛,且购买简单,为中小企业提供超简单、超高性价比数字人。 须知: