搜索_华为云

内容选择

内容分类

学堂博客论坛开发服务开发工具直播视频用户

时间

一周一个月三个月

内容选择

全部

内容选择

内容分类

学堂
博客
论坛
开发服务
开发工具
直播
视频
用户

时间

一周
一个月
三个月

使用OCR精准识别图片文字 - 模板

使用华为云OCR云服务精准识别图片文字

开发者 > 开发工具
浅谈语音识别
浅谈语音识别

语音识别语音识别简单来说就是把语音内容自动转换为文字的过程，是人与机器交互的一种技术。涉及领域：声学、人工智能、数字信号处理、心理学等方面。语音识别的输入：对一段声音文件进行播放的序列。语音识别的输出：输出的结果是一段文本序列。语音识别的原理语音识别需要经过特征提取、声学模型、语

开发者 > 其他

作者： QGS

51

1
浅谈语音识别
浅谈语音识别

语音识别语音识别简单来说就是把语音内容自动转换为文字的过程，是人与机器交互的一种技术。涉及领域：声学、人工智能、数字信号处理、心理学等方面。语音识别的输入：对一段声音文件进行播放的序列。语音识别的输出：输出的结果是一段文本序列。语音识别的原理语音识别需要经过特征提取、声学模型、语

开发者 > 其他

作者： QGS

52

1
实时语音识别连续模式
实时语音识别连续模式

实时语音识别连续模式初始化Client 初始化RasrClient，其中参数包含AuthInfo,SisHttpCnfig,RasrResponseListener,RasrConnProcessListener。

开发者 > 开发服务
简单好用的OCR文字图片识别软件？

形成电子图片→导入OCR识别工具中→点击识别完成识别并保存。云脉文档识别操作简单易懂，基本做到拍照→上传→识别→导出结果即可完成整体识别流程。注：当图片存在画面过暗、模糊、对比不明显等情况下，可以进行适当的“图片美化”，美化过后再进行识别，可以提高文字识别准确率。文档识别适用于广

开发者 > 博客

作者：云脉OCR

发表时间： 2019-06-27 16:28:59

7305

0
百度语音识别笔记
百度语音识别笔记

要说生活里最常见的AI应用场景，语音合成与识别当属大家最为耳熟能详的场景之一了。寻常到平时地图导航的播报、微信语音转文字、手机语音输入，以及小度智能音箱，都离不开语音技术的加持。语音技术到底是怎么实现的？有哪些现成可用的开源代码可以快速集成到项

开发者 > 博客

作者：风吹稻花香

发表时间： 2021-12-23 16:56:10

866

0
【语音识别】基于matlab GUI拨号语音识别【含Matlab源码 1753期】

一、获取代码方式获取代码方式1：完整代码已上传我的资源：【语音识别】基于matlab GUI拨号语音识别【含Matlab源码 1753期】获取代码方式2：通过订阅紫极神光博客付费专栏，凭支付凭证，私信博主，可获得此代码。

开发者 > 博客

作者：海神之光

发表时间： 2022-05-28 14:42:44

399

0
python语音识别终极指南
python语音识别终极指南

语言识别工作原理概述语音识别源于 20 世纪 50 年代早期在贝尔实验室所做的研究。早期语音识别系统仅能识别单个讲话者以及只有约十几个单词的词汇量。现代语音识别系统已经取得了很大进步，可以识别多个讲话者，并且拥有识别多种语言的庞大词汇表。语音识别的首要部分当然是

开发者 > 博客

作者：格图洛书

发表时间： 2021-11-18 16:30:18

949

0
实时语音识别 - 代码示例
实时语音识别 - 代码示例

基于websocket接口对输入的音频流进行识别，实时返回识别结果。

开发者 > 开发工具
实时语音识别 - 代码示例
实时语音识别 - 代码示例

基于websocket接口对输入的音频流进行识别，实时返回识别结果。

开发者 > 开发工具
语音识别
语音识别

语音处理语音信号处理(speech signal processing)简称语音处理。•语音处理是用以研究语音发声过程、语音信号的统计特性、语音的自动识别、机器合成以及语音感知等各种处理技术的总称。•由于现代的语音处理技术都以数字计算为基础，并借助微处理器、信号处理器或通用计算机

开发者 > 其他

作者： G-washington

1745

1
文字生成图片
文字生成图片

@[toc] 摘要根据文字生成图像，是近几年大模型领域比较热门的研究。我这篇文章主要记录如何使用百度的文心大模型实现文字生成图像。 PaddleHub能力简介 PaddleHub旨在为开发者提供丰富的、高质量的、直接可用的预训练模型【模型种类丰富】: 涵盖大模型、CV、

开发者 > 博客

作者： AI浩

发表时间： 2022-11-22 13:17:00

321

0
人工智能：语音识别技术介绍
人工智能：语音识别技术介绍

来提取语音内容以及音色的差别，用来更进一步辨别语音信息。 2、什么是语音识别语音识别简单来说就是把语音内容自动转换为文字的过程，是人与机器交互的一种技术。涉及领域：声学、人工智能、数字信号处理、心理学等方面。语音识别的输入：对一段声音文件进行播放的序列。语音识别的输出：输出的结果是一段文本序列。

开发者 > 博客

作者： IT技术分享社区

发表时间： 2022-11-29 13:34:33

199

0
PDF 文字&表格识别与转换（一）

# PDF 文字&表格识别与转换相信大家和我一样也会经常遇到如下的情况： - 查找的资料是PDF格式的，无法批量处理其中的文字信息 - PDF中的表格资料很难转换为方便下一步处理的格式（csv，excel，pd.dataframe） - 网上PDF转换工具通常是收费的，使用起来有所顾虑

开发者 > 其他

作者： Ragnar

2701

0
PDF 文字&表格识别与转换 (二)

# PDF 文字&表格识别与转换 (二) [上回](https://bbs.huaweicloud.com/forum/thread-54311-1-1.html)说到通过PDFMiner的一系列操作和处理，反馈给我们的是一个叫做*layout*的*objects*的集合，那么这

开发者 > 其他

作者： Ragnar

3037

0
AI语音处理-文字合成语音功能
AI语音处理-文字合成语音功能

提供的语音合成服务使用方法，利用提供的API接口完成语音合成功能，将合成的语音下载下来。2. 开通功能华为云的提供的语音合成，是一种将文本转换成逼真语音的服务。用户通过实时访问和调用API获取语音合成结果，将用户输入的文字合成为音频。通过音色选择、自定义音量、语速，为企业和个人提供个性化的发音服务。2

开发者 > 其他

作者： DS小龙哥

3069

5
什么是定制语音识别
什么是定制语音识别

定制语音识别定制语音识别提供了一句话识别，录音文件识别功能。一句话识别对时长较短的语音识别速度更快，录音文件识别对时长较长的录音文件识别。一句话识别：可以实现1分钟以内音频到文字的转换。对于用户上传二进制数据，系统经过处理，生成语音对应的文字，支持热词定制。录音文件识别：对于录制

开发者 > 其他

作者：极客潇

1349

1
【语音识别】基于matlab GUI HMM中文语音识别【含Matlab源码 1385期】

一、获取代码方式获取代码方式1：完整代码已上传我的资源：【语音识别】基于matlab GUI HMM中文语音识别【含Matlab源码 1385期】获取代码方式2：通过订阅紫极神光博客付费专栏，凭支付凭证，私信博主，可获得此代码。

开发者 > 博客

作者：海神之光

发表时间： 2022-05-28 16:47:25

363

0
ASR项目实战-语音识别
ASR项目实战-语音识别

对于后续语音数据的识别，影响相对比较小。依据前述假定，可以通过使用VAD有效划分语音识别会话，避免在识别过程中缓存过多的数据，改善语音识别的效率，降低实现的难度，降低对硬件资源的占用情况。另外可以基于VAD实现断句，即依据前述假定：对于10秒以内的语音数据，语音识别过程中的断

开发者 > 博客

作者： JackieAtHome

发表时间： 2021-02-11 14:34:36

9842

0
人工录入图片文字信息行不通！OCR识别工具更方便

市场上大大小小的文字识别工具给了我们新的选择。今天给大家分享一款好用简洁的图片文字识别工具——「云脉文档识别」。「云脉文档识别」是一款文字识别工具，通过光学设备（摄像机、照相机、扫描仪等）和OCR技术将纸质文档、笔记、名片、发票、图片等文件一键转换为可编辑的电子文档。①下载并打开

开发者 > 博客

作者：云脉OCR

发表时间： 2019-12-12 16:33:57

5494

0

总条数： 10000

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用OCR精准识别图片文字 - 模板

浅谈语音识别

浅谈语音识别

实时语音识别连续模式

简单好用的OCR文字图片识别软件？

百度语音识别笔记

【语音识别】基于matlab GUI拨号语音识别【含Matlab源码 1753期】

python语音识别终极指南

实时语音识别 - 代码示例

实时语音识别 - 代码示例

语音识别

文字生成图片

人工智能：语音识别技术介绍

PDF 文字&表格识别与转换（一）

PDF 文字&表格识别与转换 (二)

AI语音处理-文字合成语音功能

什么是定制语音识别

【语音识别】基于matlab GUI HMM中文语音识别【含Matlab源码 1385期】

ASR项目实战-语音识别

人工录入图片文字信息行不通！OCR识别工具更方便

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线