内容选择
全部
内容选择
内容分类
  • 学堂
  • 博客
  • 论坛
  • 开发服务
  • 开发工具
  • 直播
  • 视频
  • 用户
时间
  • 一周
  • 一个月
  • 三个月
  • PDF 文字&表格识别与转换(一)

    # PDF 文字&表格识别与转换 相信大家和我一样也会经常遇到如下的情况: - 查找的资料是PDF格式的,无法批量处理其中的文字信息 - PDF中的表格资料很难转换为方便下一步处理的格式(csv,excel,pd.dataframe) - 网上PDF转换工具通常是收费的,使用起来有所顾虑

    作者: Ragnar
    2701
    0
  • 语音识别与语音控制的原理介绍

    向右转”、“向前走”、“向后退”命令词,语音算法sdk经过智能处理后输出识别结果,log显示如下 ​ 识别到语音命令词“向前走”、“向左转”、“向右转&rd

    作者: 二哈侠
    发表时间: 2024-09-19 23:20:30
    145
    0
  • 5分钟玩转AI语音合成

    运行成功后,返回到Explorer下,选择mp3文件,右键,选择download。 在电脑中找到刚下载的文件,打开,就能听到转换后的语音内容了。 实验过程到此结束,赶快体验吧,5分钟真的可以实现文本到语音转换转换后还是个美女小姐姐的声音哦。

    作者: 加油O幸福
    发表时间: 2022-05-29 13:43:26
    1043
    0
  • 自动语音识别(ASR)与文本转语音(TTS)技术的应用与发展

    技术实现了与用户的自然语言交互,提升了用户体验。 实时语音翻译:ASR 技术可以将一种语言的语音转录为文字,再结合机器翻译技术,实现实时语音翻译。 自动客服系统:许多客服系统利用 ASR 实现智能应答,自动处理简单的客户咨询,减轻了人工客服的压力。 什么是文本转语音(TTS)? 文本转语音(Text To Speech,简称

    作者: kwan的解忧杂货铺
    发表时间: 2024-11-16 18:34:56
    0
    0
  • 自动语音识别(ASR)与文本转语音(TTS)技术的应用与发展

    技术实现了与用户的自然语言交互,提升了用户体验。 实时语音翻译:ASR 技术可以将一种语言的语音转录为文字,再结合机器翻译技术,实现实时语音翻译。 自动客服系统:许多客服系统利用 ASR 实现智能应答,自动处理简单的客户咨询,减轻了人工客服的压力。 什么是文本转语音(TTS)? 文本转语音(Text To Speech,简称

    作者: kwan的解忧杂货铺
    发表时间: 2024-11-25 23:43:30
    63
    0
  • ListTtsaData 获取语音驱动数据 - API

    该API属于MetaStudio服务,描述: 该接口用于获取生成的数字人驱动数据,包括语音、表情、动作等。接口URL: "/v1/{project_id}/ttsa-jobs/{job_id}"

  • 语音识别

    为什么要分帧加窗 语音信号处理需要弄清楚语音中各个频率成分的分布。做这件事情的数学工具是傅里叶变换。傅里叶变换要求输入信号是平稳的。而语音在宏观上来看是不平稳的——你的嘴巴一动,信号的特征就变了。但是从微观上来看,在比较短的时间内,嘴巴动得是没有那么快的,语音信号就可

    作者: xql
    发表时间: 2021-08-25 07:06:17
    2180
    0
  • 【NLP】自然语言处理学习笔记(二)语音转换

    66 Voice Conversion 什么是语音转换语音转换就是将一段语音转换成另一段语音,内容保持不变。 比如,最常见的应用是变声器。此外,也可以实现语音降噪,语音加噪等其它应用场景。 Categories 语音数据可分为两个种类:Parallel Data和Unparallel

    作者: zstar
    发表时间: 2022-08-05 16:22:36
    273
    0
  • 语音识别(ASR)

    效果。目前的语音识别技术主要是通过DNN实现的。语音识别的效果一般用“识别率”,即识别文字与标准文字相匹配的字数与标准文字总字数的比例来衡量。目前中文通用语音连续识别的识别率最高可以达到97%。2)衍生研究内容麦克风阵列:在家庭、会议室、户外、商场等各种环境下,语音识别会有噪音、

    作者: andyleung
    2548
    3
  • 语音识别】玩转语音识别 2 知识补充

    (Speech Recognition) 的应用. 语音识别技术可以将语音转换为计算机可读的输入, 让计算机明白我们要表达什么, 实现真正的人机交互. 希望通过本专栏的学习, 大家能够对语音识别这一领域有一个基本的了解. RNN RNN (Recurrent Neural Network)

    作者: 我是小白呀iamarookie
    发表时间: 2021-11-22 15:07:32
    2567
    0
  • 语音处理

    语音处理技术的进步,是人工智能改变大众的生活的重要一环。深度学习技术的兴起,也让这一领域近年来得到了长足的发展。在过往,该领域的主要方法是为不同的任务开发不同的工具包,对于使用者来说,学习各个工具包需要大量时间,还可能涉及到学习不同的编程语言,熟悉不同的代码风格和标准等。现在,这

    作者: QGS
    743
    3
  • 语音合成技术助力搭建智能语音双录服务平台

    题责任可确认。解决问题:通过华为云语音合成技术将监管要求的固定话术及条款内容实时转换语音,有效解决各地业务员方言及录制时间长等问题。使用服务:语音合成技术如何解决:引入华为云的语音合成技术,按照不同险种及各地银保监局要求进行话术配置,利用语音合成技术实时播报,提升双录投保服务体

    作者: 马可波罗
    7053
    7
  • 浅谈语音识别

    语音识别语音识别简单来说就是把语音内容自动转换文字的过程,是人与机器交互的一种技术。涉及领域:声学、人工智能、数字信号处理、心理学等方面。语音识别的输入:对一段声音文件进行播放的序列。语音识别的输出:输出的结果是一段文本序列。语音识别的原理语音识别需要经过特征提取、声学模型、语

    作者: QGS
    48
    1
  • 【转载】语音语音识别介绍

    一、语音领域知识介绍 音频特征音频数据常见音频任务二、语音识别知识介绍技术历程语音识别的流程声学模型语言模型语音识别的挑战三、音频数据读取与处理

    作者: emilyleungbaby
    1147
    1
  • 语音识别中的语言模型:连接语音与文本

    助读者理解如何在语音识别系统中有效地应用语言模型。 I. 语音识别系统概述 A. 语音识别的基本原理 语音信号的采集与预处理: 语音信号通过麦克风等设备采集,并进行预处理(如去噪、归一化)以提高识别效果。 特征提取: 通过信号处理技术提取语音信号的特征,如梅尔

    作者: Y-StarryDreamer
    发表时间: 2024-08-10 12:51:30
    107
    0
  • LTE语音是什么

    上使用为控制层面(Control plane)和语音服务的媒体层面(Media plane)特制的配置文件(由 GSM 协会在 PRD IR.92 中定义),这使语音服务(控制和媒体层面)作为数据流在 LTE 数据承载网络中传输,而不再需维护和依赖传统的电路交换语音网络。VoLTE 的语音和数据容量超过 3G

    作者: 旧时光里的温柔
    479
    0
  • 九十三、Python使用百度云接口API实现截图,文字识别和语音合成

    是写接口API的。今天就开始第九十三篇、Python使用百度云接口API实现截图,文字识别和语音合成 文章目录 接口RESTful API 安装keyboard 文字识别 语言合成 接口RESTful

    作者: 毛利
    发表时间: 2021-07-14 23:04:31
    1486
    0
  • 语音播报】基于matlab语音播报【含Matlab源码 507期】

    81 三、运行结果 实际效果为语音播报 四、matlab版本及参考文献 1 matlab版本 2014a 2 参考文献 [1]韩纪庆,张磊,郑铁然.语音信号处理(第3版)[M].清华大学出版社,2019. [2]柳若边.深度学习:语音识别技术实践[M].清华大学出版社,2019

    作者: 海神之光
    发表时间: 2022-05-28 18:12:08
    280
    0
  • 语音编辑】基于matlab语音编辑【含Matlab源码 539期】

    二、简介 实验目的 1.掌握语音信号线性叠加的方法,实现非等长语音信号的叠加 2.熟悉语音信号卷积原理,实现两语音卷积。 3.熟悉语音信号升采样/降采样方法。 实验原理 1.信号的叠加 两个信号X1和X2,通过短时信号的补零,使两语音信号有相同的长度,叠加信号为 叠加白噪声通过生成随机信号的方法来实现

    作者: 海神之光
    发表时间: 2022-05-28 17:43:52
    245
    0
  • 语音聊天系统源码包含哪些类型?语音社交APP开发重点

    主导的熟人社交场构建了坚固的壁垒,语音社交在定位于陌生人、弱关系的社交产品领域,以黑马姿态出现。进入2019年以来,语音社交可谓一匹黑马在社交赛道中杀出重围。语音与传统的图片、文字社交不同,与文字相比,语音更为生动有趣。与图片及视频社交相比,语音社交能在一定程度上保护隐私,降低了

    作者: 山东布谷科技
    发表时间: 2019-08-03 11:42:47
    9472
    0