内容选择
全部
内容选择
内容分类
  • 学堂
  • 博客
  • 论坛
  • 开发服务
  • 开发工具
  • 直播
  • 视频
  • 用户
时间
  • 一周
  • 一个月
  • 三个月
  • 语音合成 - 代码示例

    语音合成,调用API获取语音合成结果,将用户输入的文字合成为音频。通过音色选择、自定义音量、语速、音高等,可自定义音频格式,为企业和个人提供个性化的发音服务。

  • 调用实时语音识别

    流式一句话、实时语音识别连续模式、实时语音识别单句模式 // 选择1 流式一句话连接 // rasrClient.shortStreamConnect(request); // 选择2,实时语音识别单句模式 // rasrClient.sentenceStreamConnect

  • 调用语音合成

    result 是 Object 调用成功时为合成语音内容,请参考表5。

  • 调用实时语音识别

    调用实时语音识别 初始化Client 初始化RasrClient详见表 RasrClient初始化参数。

  • 新手语音入门(三): 语音识别ASR算法初探 | 编码与解码 | 声学模型与语音模型 | 贝叶斯公式 | 音素

    语音识别的问题可以看做是语音到文本的对应关系,语音识别问题大体可以归结为文本基本组成单位的选择上。单位不同,则建模力度也随之改变。

    作者: 黄辣鸡
    发表时间: 2021-12-27 07:11:12
    4152
    0
  • python文本转女生语音

    2.1 第一次发音朗读 import pyttsx3 engine = pyttsx3.init() engine.say('我爱你,川川') engine.runAndWait() 2.2 将语音保存到mp3

    作者: 川川菜鸟
    发表时间: 2022-04-13 18:55:41
    458
    0
  • 华为手机里的 “辅助功能” 里 的“屏幕朗读”功能, 算AI的语音应用吗?

    请教一下,这个我理解可能不算吧,里面不带AI技术,应该是获取到屏幕上的文字(而不是图片),直接朗读出来而已一般是给盲人读屏用的

    作者: 黄生
    1065
    2
  • 基于SIS语音交互服务API合成语音 - 模板

    使用本模板可快速生成一个基于华为云SIS语音交互服务的Demo应用工程,开发者可根据SIS服务提供的API,完成一个文字合成音频的应用程序。

  • QT应用编程: 调用系统语音引擎完成文字转语音播报

    一、环境介绍 操作系统介绍:win10 64位 QT版本: 5.12.6 二、示例代码 在工程文件里加上代码: QT += texttospeech QTextToSpeech *m_speech=new QTextToSpeech; //异步朗读文字

    作者: DS小龙哥
    发表时间: 2021-12-09 16:38:56
    1958
    0
  • 语音

    语音来源发音器官分喉下、喉头、喉上三个部分。喉下部分是由气管到肺。从肺呼出的气流成为语音的声源。喉头部分主要是声门和声带。声带是两条韧带,起着喉的阀门作用,它的闭拢和打开成为声门。声门大开时气流畅通,声门闭合,气流冲出使声带作周期性的颤动就产生声音。

    作者: G-washington
    1961
    1
  • HarmonyOS之AI能力·语音识别技术

    语音识别技术,也称为自动语音识别(Automatic Speech Recognition, ASR),可以基于机器识别和理解,将语音信号转变为文本或命令。语音识别支持的输入文件格式有 wav 或 pcm。语音识别当前仅支持对普通话的识别。语音识别输入时长不能超过 20s。

    作者: Serendipity·y
    发表时间: 2022-02-16 16:05:13
    848
    0
  • 语音识别与语音控制的原理介绍

    语音控制 SSH连接OriginBot成功后,配置智能语音模块: #从TogetheROS的安装路径中拷贝出运行示例需要的配置文件。 cp -r /opt/tros/lib/hobot_audio/config/ .

    作者: 二哈侠
    发表时间: 2024-09-19 23:20:30
    145
    0
  • AI语音处理-文字合成语音功能

    实现源码软件采用QT设计的,核心部分主要是用到了HTTP请求相关的操作。

    作者: DS小龙哥
    3069
    5
  • ListTtsaData 获取语音驱动数据 - API

    该API属于MetaStudio服务,描述: 该接口用于获取生成的数字人驱动数据,包括语音、表情、动作等。接口URL: "/v1/{project_id}/ttsa-jobs/{job_id}"

  • LTE语音是什么

    而不再需维护和依赖传统的电路交换语音网络。

    作者: 旧时光里的温柔
    1151
    0
  • 离线语音识别与在线语音识别的区别

    离线的语音识别和在线的语音识别是有所差距的: l 离线语音识别:固定词条,不需要连接网络,但是识别率稍低 l 在线语音识别:词条不固定,需要连接网络,识别率较高,但是效果会受网络影响, 价格相对较高 产生差距的原因有两点: ① 语音识别比较重要的一个因素是:语音库,它作为识别过程中对比的数据

    作者: aiot_bigbear
    发表时间: 2022-09-24 16:33:34
    190
    0
  • 什么是语音交互服务

    例如用户通过语音识别功能,将口述音频或者语音文件识别成可编辑的文本,同时也支持通过语音合成功能将文本转换成逼真的语音等提升用户体验。适用场景如语音客服质检、会议记录、语音短消息、有声读物、电话回访等。

  • 语音识别

    如果你只做单个音素识别,(语音很短,内容只是音素),那么只用声学模型就可以做到,不用语言模型。做法就是在每个音素的声学模型上使用解码器做解码(简单的Viterbi算法即可)。 但是,通常是要识别一个比较长的语音,这段语音中包含了很多词。

    作者: xql
    发表时间: 2021-08-25 07:06:17
    2180
    0
  • 语音合成WebSocket版

    具体信息请参见《API参考》中语音合成章节。

  • 语音播报】基于matlab语音播报【含Matlab源码 507期】

    一、获取代码方式 获取代码方式1: 完整代码已上传我的资源:【语音播报】基于matlab语音播报【含Matlab

    作者: 海神之光
    发表时间: 2022-05-28 18:12:08
    280
    0