检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
speechRecognized ASR对提问进行语音识别后输出为文本的事件。 semanticRecognized LLM对提问进行语义识别后输出回复文本的事件。
audio_file_download_url 否 String 语音驱动音频文件下载URL。 speed 否 Integer 语速。 取值范围[50,200] 默认值:100 取值范围: 50-200 默认取值: 100 pitch 否 Integer 基频。
描述 title String 文本标题 text String 文本 表9 ProductMediaDetailInfo 参数 参数类型 描述 asset_id String 资产ID asset_type String 资产类型 IMAGE:图片 VIDEO:视频 AUDIO:音频
在线生成SDK代码 API Explorer能根据需要动态生成SDK代码功能,降低您使用SDK的难度,推荐使用。 您可以在API Explorer中,具体API页面的“代码示例”页签查看对应编程语言类型的SDK代码,如图1 获取SDK代码示例所示。
单击“在线演示”,可以在界面右侧演示模型对话效果,如图4所示。 图4 在线演示 单击界面右上角的“保存”,在弹出的“保存成功”提示框中,单击“确定”。 角色创建完成。
从RTC房间接收音频流,并推送视频流到RTC房间 END_USER: 端侧用户。从推送音频流到RTC房间,并从RTC房间接收视频流 user_id String RTC用户ID。 signature String RTC鉴权token。 ctime Long 有效期。
BASIC: 基础版(20句话) MIDDLE: 进阶版(100句话) ADVANCE: 高级版 THIRD_PARTY: 第三方出门问问训练版 THIRD_PARTY_LJZN: 第三方逻辑智能训练版 FLEXUS: Flexus版---用的是大模型特征提取 请求参数 表3 请求
多模型数字人大脑 华为云智能问答机器人CBS 华为云盘古大模型 科大讯飞星火交互大模型及AIUI 能力开放可集成 智能交互端侧Web SDK 形象驱动API 数字人大脑API 数字人能力开放,多种合作模式灵活选择 实名安全认证后,可使用控制台在线自助完成内容制作。
展开“语音识别”下方的“高级设置”,如图9所示。 图9 应用配置 在“识别热词”区域,单击“下载热词模板”,将模板下载至本地。
科技创新引领全球发展,人工智能在各个领域取得了重大突破,包括自动驾驶、机器学习、语音识别等, 同时引发了一系列与伦理、隐私和就业等相关的讨论。 全球范围内的5G网络建设逐渐展开,提供了更快的数据传输速度和更低的延迟, 为物联网、智能城市和工业自动化等应用打下了基础。
展开“语音识别”下方的“高级设置”,如图15所示。 图15 应用配置 在“识别热词”区域,单击“下载热词模板”,将模板下载至本地。
BASIC: 基础版(20句话) MIDDLE: 进阶版(100句话) ADVANCE: 高级版 THIRD_PARTY: 第三方出门问问训练版 THIRD_PARTY_LJZN: 第三方逻辑智能训练版 FLEXUS: Flexus版---用的是大模型特征提取 job_id String
取值范围: 1-536870912000 file_type 是 String 文件类型(默认提取文件后缀)。 asset_id 是 String 资产ID。 asset_file_category 是 String 文件在资产中的分类。每种资产类型包含的文件分类不同。
说明: SIS:使用的语音识别服务为SIS时选此类型 robot_id 是 String 应用ID。
说明: SIS:使用的语音识别服务为SIS时选此类型 vocabulary_id String 热词ID(sis中配置)。 sis_project_id String SIS服务所在区域projectId region Integer 对接SIS服务的区域。
10次/秒 3次/秒 3次/秒 获取在线录音确认结果 20次/秒 10次/秒 10次/秒 语音合成管理 创建TTS试听任务 5次/秒 3次/秒 3次/秒 获取TTS试听文件 20次/秒 10次/秒 10次/秒 3D数字人风格管理 查询数字人风格列表 20次/秒 10次/秒 - 3D
如果shoot_scripts中shoot_script.script_type为"TEXT",则台词以shoot_scripts中的文本为准; 如果shoot_scripts中shoot_script.script_type为"AUDIO",则台词以script_id对应剧本中的音频为准
10次/秒 3次/秒 3次/秒 获取在线录音确认结果 20次/秒 10次/秒 10次/秒 语音合成管理 创建TTS试听任务 5次/秒 3次/秒 3次/秒 获取TTS试听文件 20次/秒 10次/秒 10次/秒 3D数字人风格管理 查询数字人风格列表 20次/秒 10次/秒 - 3D
说明: SIS:使用的语音识别服务为SIS时选此类型 vocabulary_id String 热词ID(sis中配置)。 sis_project_id String SIS服务所在区域projectId region Integer 对接SIS服务的区域。
取值范围: 1-10 默认取值: 1 is_ifly_production Boolean 是否为正式环境 默认取值: false tail_silence_time Integer 语音识别后端点静音时长默认500ms 取值范围: 0-3000 role_id String 奇妙问角色