检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
授权浏览器麦克风的访问权限 支持对Chrome浏览器和Mac系统的浏览器,授权麦克风的访问权限。 谷歌浏览器 打开Chrome浏览器,单击浏览器右上方的图标,从下拉框中选择“设置”。 进入“设置”页面。 在左侧导航栏中,选择“隐私设置和安全性”。 在右侧界面中,单击“网络设置”,进入“网络设置”页面。
设置任务批次 功能介绍 用户设置任务批次,该接口用于批量任务管理场景,设置任务的批次 需要开通NA租户权限后才能正常调用 调用方法 请参见如何调用API。 URI PUT /v1/{project_id}/voice-training-manage/user/batch 表1 路径参数
Promise<void> 【功能说明】 初始化语音唤醒资源,不使用语音唤醒能力则忽略该接口。 3.0.1之后的websdk包里面有如下两个资源文件,如果不使用语音唤醒,可忽略这两个文件。 wasmData.js:语音唤醒的算法资源文件。 modelData.js:语音唤醒的模型资源文件。 SDK内
在“直播管理”页签,单击“创建直播间”,进入视频直播制作界面。 选择“互动设置”,单击右侧的“设置”,弹出“智能交互”对话框,如图1所示。 参数配置说明,如表1所示。 图1 智能交互设置 表1 参数说明 参数 说明 应用 请先参考后续步骤5,创建完成应用后,再从下拉框中选择此应用。 弹幕触发间隔时间
查询用户配置的个性化音频时长 创建基础版语音训练任务 创建进阶版语音训练任务 创建高级版语音训练任务 查询语音训练任务列表 提交语音训练任务 查询语音训练任务详情 删除语音训练任务 查询任务操作日志 获取语音文件上传地址 获取语音训练任务审核结果 设置任务批次 确认在线录音结果 获取在线录音确认结果
使用接口查询音色ID(方式三) 支持使用查询资产列表接口,查询音色ID。需要设置如下参数: offset=0:从第一个音色开始查询,可以根据实际情况设置。 limit=60:一次可以查询的声音数据,可以根据实际情况设置。 asset_type=VOICE_MODEL:资产类型为音色模型。
接口参考 主入口(HwICSUiSdk) 事件通知(EventMap) 错误码(ICSError) 授权浏览器麦克风的访问权限 Web语音唤醒 父主题: Web SDK
本地打开OBS视频采集工具。 在界面上方的导航栏中,选择“文件 > 设置”,弹出“设置”对话框。 在左侧导航栏中,选择“视频”,检查基础分辨率和输出分辨率的取值是否一致。 如果不一致,需要修改为相同的取值。 图1 视频设置 父主题: FAQ
2次/秒 2次/秒 - 3D数字人语音驱动 创建语音驱动任务 2次/秒 2次/秒 - 获取语音驱动任务列表 20次/秒 10次/秒 - 创建语音驱动表情动画任务 2次/秒 2次/秒 - 获取语音驱动表情数据 20次/秒 10次/秒 - 获取语音驱动数据 20次/秒 10次/秒 -
提示模板不可用怎么办? 请根据实际情况判断处理: 如果是自己创建的模板不可用,请检查模板中的资产是否正常,即资产处于激活状态时正常,如果资产取消激活或已删除会导致模板不可用。 如果是分享给我的模板不可用,可能是分享者取消了模板分享,或者模板中的资产状态不正常,即资产已取消激活或被删除。
PPT文件解析失败,无法上传怎么办? 需要排查是否是下述原因导致: PPT大小超过100M。 PPT内部包含很多媒体文件,导致PPT的压缩比过大。 PPT动画等内容过于复杂。 建议排查修改后,重新上传大小内容均合理的PPT。 父主题: 视频制作
1版本,变更点如下所示: 语音唤醒能力支持设备切换实时生效。 2024-12-30 本次变更如下: 新增发布3.0.1版本SDK,相比2.2.0版本,变更点如下所示: 新增语音唤醒能力,详见Web语音唤醒。 新增接口initResourcePath,支持设置语音唤醒算法以及资源路径,保证正常使用语音唤醒能力。
单击“确认”,头像上传完成。 性别 选择性别“男生”或“女生”。 声音 提供下述种方式,生成名片预览语音片段。 播报内容生成后,单击右侧的“试听”,可以试听播报效果。 语音上传:本地录制音频后上传。音频格式需要为WAV或MP3格式,音频大小不超过20MB,时长不超过5分钟。
选择“分身名片”页签,如图1所示。 在“分身名片”页面,可以看到已生成的名片列表,以卡片形式排列展示。 支持对名片进行如下操作: 单击,查看分身数字人的语音表达形态。 单击“下载”,将名片下载至本地查看。下载后的文件为mp4格式。 单击,在弹出的下拉框中,可查看名片详情、重命名或删除名片。 图1
频属性设置对话框,如图2所示。 需要确认这里的“设备”与Windows系统的声音输出设备是否一致。如果不一致,会导致OBS无法成功捕获声音给第三方直播平台。需要修改为一致后再直播。 图2 桌面音频属性设置 检查Windows系统的声音输出设备 在Windows系统的系统设置中,找
您的身份。 设备权限调用 当您使用相应功能及服务时,我们会通过客户应用向系统申请您设备的相应权限。您可以在客户应用或浏览器的设置功能中查看权限状态,并可自行选择开启或关闭部分或全部权限。 客户在集成、使用相应开放能力时,将自行决定权限的调用范围,因此客户应对权限的调用及用途向您进
直播剧本保存失败怎么办? 直播剧本保存失败时,请您根据界面提示信息进行问题定位及修改,如表1所示。 表1 问题定位及修改 错误提示 处理办法 剧本名称包含非法字符 请您根据要求修改剧本名称中的敏感字符。 包含敏感词汇 可能是讲解词中包含敏感词汇,去除讲解词中的敏感词汇即可。 演示素材不存在或不可用
控制台自助服务,一站式快速生成所需内容 用户申请账号并上传相关授权,拍摄训练所需音视频素材,上传进行模型训练,生成自定义形象和声音。选择背景、声音、模特等内容,基于文本或语音智能驱动,实现视频制作、视频直播、智能交互等能力。 华为云盘古数字人大模型,赋能千行百业数字化营销新模式 MetaStudio服务依托华为
分身数字人费用:包括分身数字人形象制作、声音制作、分身数字人视频制作、分身数字人视频直播、照片数字人视频制作和分身数字人名片制作的费用。 3D数字人费用:包括照片建模、语音驱动和视觉驱动的费用。 资产管理费用:即服务资产管理的费用。 父主题: 计费咨询
裁剪 SDK隐私声明 三、权限使用要求 我们SDK在提供服务时会最小化的使用系统权限,您需要根据实际使用的功能申请对应的系统权限并向用户告知征得其同意。 权限 权限描述 使用目的 获取麦克风权限 获取浏览器的麦克风设备权限 开始语音交互时,用于进行语音识别文字,获取交互答案 四、延迟初始化要求