内容选择
全部
内容选择
内容分类
  • 学堂
  • 博客
  • 论坛
  • 开发服务
  • 开发工具
  • 直播
  • 视频
  • 用户
时间
  • 一周
  • 一个月
  • 三个月
  • Python文本转化语音模块大比拼,看看青铜与王者的差别!

    使用流程如下:访问语音合成-百度AI开放平台:http://ai.baidu.com/tech/speech/tts之后使用百度账号即可登陆(没有百度账号的,自己注册一个)创建应用,添加语音识别的功能,并完成注册保存你的app_id, API_Key, Secret_Key 三项数据留着后续使用切换回语音合成首页

    作者: 技术火炬手
    发表时间: 2019-08-05 09:53:52
    18015
    1
  • DeleteDemoInfo 删除语音作业 - API

    该API属于VCM服务,描述: 删除语音作业接口URL: "/v2/{project_id}/services/audio-moderation/tasks/{task_id}"

  • 《鸿蒙Next:让人工智能语音交互听懂每一种方言和口音》

    引入语音合成技术辅助识别 - 生成标准方言语音样本:利用语音合成技术,根据方言的语音特征和语法规则,生成标准的方言语音样本,用于扩充方言语音数据集,增加语音识别模型对方言的学习和理解。

    作者: 程序员阿伟
    发表时间: 2025-01-19 23:12:26
    181
    0
  • 启动实时语音识别

    父主题: Android端调用语音交互服务

  • 调用实时语音识别

    流式一句话、实时语音识别连续模式、实时语音识别单句模式 // 选择1 流式一句话连接 // rasrClient.shortStreamConnect(request); // 选择2,实时语音识别单句模式 // rasrClient.sentenceStreamConnect

  • 什么是语音识别的语音搜索?

    前言 随着智能手机、智能音箱等智能设备的普及,语音搜索已经成为了一种趋势。语音搜索不仅方便快捷,而且可以实现双手的解放。语音搜索的实现离不开语音识别技术,本文将详细介绍语音识别的语音搜索。 语音识别的基本原理 语音识别是将语音信号转换为文本的技术。

    作者: wljslmz
    发表时间: 2023-05-11 23:05:36
    25
    0
  • 《解锁鸿蒙Next系统人工智能语音助手开发的关键步骤》

    测试与优化 - 功能测试:在不同的设备和场景下,对语音助手应用的各项功能进行全面测试,包括语音识别准确率、自然语言处理效果、语音合成质量、交互逻辑等,确保应用的稳定性和可靠性。

    作者: 程序员阿伟
    发表时间: 2025-01-12 10:08:32
    191
    0
  • 调用实时语音识别

    调用实时语音识别 初始化Client 初始化RasrClient详见表 RasrClient初始化参数。

  • 语音识别技术的最新进展与详细部署过程

    深度学习模型能够更好地捕捉语音信号中的抽象特征,从而提高准确性和鲁棒性。 应用场景 语音识别技术广泛应用于智能语音助手、自动语音识别(ASR)、语音合成等领域。最新的研究将其拓展到医疗保健、智能家居、金融服务等行业。

    作者: Y-StarryDreamer
    发表时间: 2024-01-31 22:17:39
    5
    0
  • 新手语音入门(三): 语音识别ASR算法初探 | 编码与解码 | 声学模型与语音模型 | 贝叶斯公式 | 音素

    语音识别的问题可以看做是语音到文本的对应关系,语音识别问题大体可以归结为文本基本组成单位的选择上。单位不同,则建模力度也随之改变。

    作者: 黄辣鸡
    发表时间: 2021-12-27 07:11:12
    4152
    0
  • 语音识别的隐私与安全问题

    差分隐私技术 推动差分隐私技术在语音识别领域的应用,通过在数据收集过程中引入噪声 ,保护个体隐私信息。 智能设备本地化处理 鼓励智能设备在本地进行语音识别和语音合成处理,减少云端存储和传输带来的隐私风险。

    作者: Y-StarryDreamer
    发表时间: 2024-01-31 22:42:02
    2
    0
  • [入驻式]TTS MRCP 请求发包率

    请问平台侧对于 TTS 的 MRCP 请求发包率有什么要求?

    作者: 凡小枫
    2773
    1
  • 会场TTS放音+通道收号CELL 失败

    【问题来源】 星网【问题简要】 会场TTS放音+通道收号CELL 失败【问题类别】IVR【AICC解决方案版本】  AICC 24.200【期望解决时间】2024-9-9【问题现象描述】 会场TTS放音+通道收号 CELL  播放TTS 听不到声音,Trace日志中看到TTS Voice

    作者: CP_IPCC
    104
    8
  • 基于SIS语音交互服务API合成语音 - 模板

    使用本模板可快速生成一个基于华为云SIS语音交互服务的Demo应用工程,开发者可根据SIS服务提供的API,完成一个文字合成音频的应用程序。

  • 播放输入V9.0 cell 无法播放 tts文本

    【问题来源】黑龙江农信社【问题简要】使用 播放输入V9.0 cell 实现 TTS放音  + ASR识别 + 可打断 功能【问题类别】cell 设置播放 播放TTS 后,听筒没有播报声音,日志报错【AICC解决方案版本】AICC 版本:AICC 22.200.0【问题现象描述】cell

    作者: 夜孤城
    81
    10
  • 语音分析】基于matlab线性预测系数对比【含Matlab源码 557期】

    通过使实际语音抽样和线性预测抽样之间的误差在某个准则下达到最小值来决定唯一的一组预测系数。而这组预测系数就反映了语音信号的特性,可以作为语音信号特征参数用于语音识别、语音合成等。

    作者: 海神之光
    发表时间: 2022-05-28 19:33:30
    276
    0
  • [自然语言处理|NLP] 语音识别中的应用:从原理到实践

    3.3 语音合成 语音合成是NLP技术在语音识别应用中的另一个重要方向。它通过将文本转换为自然流畅的语音,使得语音交互更加自然。这可以通过使用深度学习生成模型,如WaveNet或Tacotron,实现高质量的语音合成

    作者: Y-StarryDreamer
    发表时间: 2023-11-15 12:54:28
    37
    0
  • HarmonyOS之AI能力·语音识别技术

    语音识别技术,也称为自动语音识别(Automatic Speech Recognition, ASR),可以基于机器识别和理解,将语音信号转变为文本或命令。语音识别支持的输入文件格式有 wav 或 pcm。语音识别当前仅支持对普通话的识别。语音识别输入时长不能超过 20s。

    作者: Serendipity·y
    发表时间: 2022-02-16 16:05:13
    848
    0
  • 语音处理理论、应用与实验

    本课程就语音处理的理论及应用做了介绍,介绍了大量具体的语音识别与语音合成的模型,不同模型各有特点,适应于不同的应用场景,实际中应注意合理选用。

  • U9600对接ASR/TTS问题

    【问题来源】    湖北农信     【问题简要】      asr和tts都正常对接,心跳正常,测试失败。   

    作者: gaow
    1315
    3