检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
用于互动回复。数字人不变,背景不变。params结构定义:PlayTextInfo。 INSERT_PLAY_AUDIO:插入驱动音频。用于音频直接驱动。数字人不变,背景不变。params结构定义:PlayAudioInfo。 REWRITE_PLAY_SCRIPT:动态编辑未
字幕文件生成任务ID。 表23 AudioInfo 参数 参数类型 描述 audio_id Integer 参数解释: 音频id。 说明: 获取方式:剧本为音频驱动时,查询剧本详情或者更新剧本会返回audio_id 约束限制: 不涉及 取值范围: 0-10000 默认取值: 不涉及
配置检查 单击“配置检查”,自动检查当前页签配置是否正确,如果有问题,会给出相应提示。 尾静音时长 云端对音频进行VAD检测,发现一句话末尾的静音时长超过500ms,会结束语音识别。建议该值大于500ms。 表2 创建应用 参数 说明 第三方应用 配置说明如下所示: 如果科大讯飞AI
audio_codec 否 String 参数解释: 音频编码格式。 约束限制: 用户无需填写,系统自行提取。 取值范围: 字符长度0-32位。 默认取值: 不涉及 audio_bit_rate 否 Integer 参数解释: 音频平均码率,单位kbps。 约束限制: 用户无需填写,系统自行提取。
reply_audios 否 Array of ReplyAudioInfo objects 参数解释: 回复音频集。填写audio_url。 约束限制: 不涉及 取值范围: 最大支持5条预置音频。 默认取值: 不涉及 reply_order 否 String 参数解释: 回复话术选择次序。 约束限制:
0-86400 audio_codec String 参数解释: 音频编码格式。 约束限制: 用户无需填写,系统自行提取。 取值范围: 字符长度0-32位。 默认取值: 不涉及 audio_bit_rate Integer 参数解释: 音频平均码率,单位kbps。 约束限制: 用户无需填写,系统自行提取。
audio_codec 否 String 参数解释: 音频编码格式。 约束限制: 用户无需填写,系统自行提取。 取值范围: 字符长度0-32位。 默认取值: 不涉及 audio_bit_rate 否 Integer 参数解释: 音频平均码率,单位kbps。 约束限制: 用户无需填写,系统自行提取。
本次变更如下: 语音合成管理接口组,新增接口:创建TTS异步任务、获取TTS异步任务。 声音制作任务管理接口组,新增接口:查询用户配置的个性化音频时长、设置任务批次。 2024-10-30 第十一次正式发布 本次变更如下: 新增接口组:租户管理。 2024-08-20 第十次正式发布
0-86400 audio_codec String 参数解释: 音频编码格式。 约束限制: 用户无需填写,系统自行提取。 取值范围: 字符长度0-32位。 默认取值: 不涉及 audio_bit_rate Integer 参数解释: 音频平均码率,单位kbps。 约束限制: 用户无需填写,系统自行提取。
普通观看方,可选择原始视频流或者数字人动画视频流观看 INFERENCE_USER: 数字人推理端用户。从RTC房间接收音频流,并推送视频流到RTC房间 END_USER: 端侧用户。从推送音频流到RTC房间,并从RTC房间接收视频流 user_id String RTC用户ID。 signature
reply_audios Array of ReplyAudioInfo objects 参数解释: 回复音频集。填写audio_url。 约束限制: 不涉及 取值范围: 最大支持5条预置音频。 默认取值: 不涉及 reply_order String 参数解释: 回复话术选择次序。 约束限制:
以文字方式向用户告知 第三方SDK名称:数字人智能交互Web SDK 第三方公司名称:华为云计算技术有限公司 收集个人信息类型:您或您的最终用户的音频数据或文本数据、应用信息(浏览器User Agent)、SDK接口调用记录。 使用目的:为华为云客户应用提供数字人智能交互服务,如果您只使
普通观看方,可选择原始视频流或者数字人动画视频流观看 INFERENCE_USER: 数字人推理端用户。从RTC房间接收音频流,并推送视频流到RTC房间 END_USER: 端侧用户。从推送音频流到RTC房间,并从RTC房间接收视频流 user_id String RTC用户ID。 signature
reply_audios 否 Array of ReplyAudioInfo objects 参数解释: 回复音频集。填写audio_url。 约束限制: 不涉及 取值范围: 最大支持5条预置音频。 默认取值: 不涉及 reply_order 否 String 参数解释: 回复话术选择次序。 约束限制:
asset_id 否 String 参数解释: 插入音频资产的资产id,外部资产信息无需填写。若填写,可以从资产库中查询。 约束限制: 不涉及 取值范围: 字符长度0-64位。 默认取值: 不涉及。 audio_url 否 String 参数解释: 音频URL。 约束限制: 仅支持MP3格式,
按需计费 按需预付费套餐包 一次性计费 声音制作 按声音制作的个数计费。 包括如下类型: 基础版:20条语料音频 进阶版:100条语料音频 高级版:1小时以上的长音频WAV文件 每成功制作1个声音,从所购预付费资源包中扣除1个。 一次性计费 分身数字人视频直播 按数字人各路直播的总时长计费。
asset_id String 参数解释: 插入音频资产的资产id,外部资产信息无需填写。若填写,可以从资产库中查询。 约束限制: 不涉及 取值范围: 字符长度0-64位。 默认取值: 不涉及。 audio_url String 参数解释: 音频URL。 约束限制: 仅支持MP3格式,大
称“交互功能”)。为了提供交互功能,SDK会通过您主动点击聊天按钮申请客户应用或浏览器的麦克风权限,在您同意客户应用使用麦克风之后,将您的音频数据或文本数据上传到客户指定的第三方系统或模型,用于识别语义并做出应答,给您提供交互功能。 产品运营和维护 为了保障SDK稳定运行,改善产
配置检查 单击“配置检查”,自动检查当前页签配置是否正确,如果有问题,会给出相应提示。 尾静音时长 云端对音频进行VAD检测,发现一句话末尾的静音时长超过500ms,会结束语音识别。建议该值大于500ms。 图2 获取访问权限 单击“确定”,创建应用,创建效果如图3所示。 可单击“修改”,修改配置。
配置检查 单击“配置检查”,自动检查当前页签配置是否正确,如果有问题,会给出相应提示。 尾静音时长 云端对音频进行VAD检测,发现一句话末尾的静音时长超过500ms,会结束语音识别。建议该值大于500ms。 单击“确定”,创建应用,创建效果如图2所示。 可单击“修改”,修改配置。 图2