录音转文字工具介绍
华为云语音交互服务
华为云语音交互服务(Speech Interaction Service,简称SIS)是一种人机交互方式,用户通过实时访问和调用API获取语音交互结果。例如用户通过语音识别功能,将口述音频或者语音文件识别成可编辑的文本,同时也支持通过语音合成功能将文本转换成逼真的语音等提升用户体验。适用场景如语音客服质检、会议记录、语音短消息、有声读物、电话回访等。
支持的语言:
支持中文普通话的识别和合成,其中语音识别还支持带方言口音的普通话识别以及方言(四川话、粤语和上海话)的识别。
首次使用录音转文字语言交互服务SIS
如果您是首次使用SIS的用户,建议您学习并了解如下信息:
功能介绍
通过功能介绍章节的内容,了解SIS不同功能的具体介绍,主要包括实时语音识别(Real-time ASR)、一句话识别(Short Sentence Recognition)、录音文件识别(Recording File Recognition)、语音合成(Text To Speech )功能。
入门使用
SIS以开放API的方式提供给用户,您可以参考《快速入门》学习并使用SIS服务。
使用方式
如果您是一个开发工程师,熟悉代码编写,想要直接调用SIS的API或SDK使用服务,您可以参考《API参考》或《SDK参考》获取详情。
由浅入深学习
您可以参考成长地图,由浅入深学习使用SIS。
免费录音转文字-文字转换语音在线体验 免费录音转文字-文字转换语音在线体验
华为云语音交互服务,免费录音转文字-文字转换语音有哪些功能?
实时语音识别服务,用户通过实时访问和调用API获取实时语音识别结果,支持的语言包含中文普通话、方言,方言当前支持四川话、粤语和上海话。
产品优势
识别准确率高:采用最新一代语音识别技术,基于深度神经网络(Deep Neural Networks,简称DNN)技术,大大提高了抗噪性能,使识别准确率显著提升。
识别速度快:把语言模型、词典和声学模型统一集成为一个大的神经网络,同时在工程上进行了大量的优化,大幅提升解码速度,使识别速度在业内处于领先地位。
多种识别模式:支持多种实时语音识别模式,如流式识别、连续识别和实时识别模式,灵活适应不同应用场景。
定制化服务:可定制特定垂直领域的语言层模型,可识别更多专有词汇和行业术语,进一步提高识别准确率。
可以实现1分钟以内音频到文字的转换。对于用户上传的二进制音频格式数据,系统经过处理,生成语音对应的文字,支持的语言包含中文普通话、方言。方言当前支持四川话、粤语和上海话
产品优势
前沿技术:使用工业界成熟的算法,结合学术界最新研究成果,为企业提供独特竞争力优势。
支持热词:针对专业词汇,支持上传至热词表,增加专业词汇的识别准确率。
可定制化:针对客户的特定场景需求,定制垂直领域的语音识别模型,识别效果更精确。
对于录制的长语音进行识别,转写成文字,提供不同领域模型,具备良好的可扩展性,支持热词定制。
产品优势
高识别率:基于深度学习技术,对特定领域场景的语音识别进行优化,识别率达到业界领先。
稳定可靠:成功应用于各类场景,基于华为等企业客户的长期实践,经受过复杂场景考验。
语音合成支持多种音色,可调节语调,语速,音量。
产品优势
多语种多音色:中文普通话、男声、女声、童声自由切换,可以调整音量,语速。
效果出色:文本转换自然清晰,近乎真人发音,能够符合多样的应用场景。
免费录音转文字在线体验的计费项有哪些?
一句话识别、语音合成按调用次数计费;实时语音识别、录音文件识别、录音文件识别极速版按音频时长计费,时长计算精确到秒。
按音频时长计费的,累加每次调用的音频时长。
按调用次数计费的,返回失败的调用不计入次数。
录音转文字的计费模式:
按需计费:按需计费是指按照API调用次数阶梯价格计费,计费价格参见语音交互价格计算器。
折扣套餐包:折扣套餐包方式是用户可以购买套餐包,扣费时调用次数会先在套餐包内进行抵扣,抵扣完后的剩余调用量默认转回按需计费方式,计费价格参见语音交互价格计算器。。
说明:购买套餐包前,请进行账号实名认证。
如您有代金券,请在控制台“费用与成本 > 优惠折扣”中查看代金券的使用范围。
套餐包费用为一次性支付,即刻生效,暂不支持指定日期生效。
套餐包购买时长为1年,可通过叠加套餐包累加API调用次数或时长。
购买的套餐包在生效期内,扣费方式是先扣除已购买的套餐包内的额度后,超出部分以按需计费的方式进行结算。
购买的套餐包到期后如果没有购买新的套餐包,系统会自动转为按需计费。