已找到以下 74 条记录
AI智能搜索
产品选择
文字识别 OCR
没有找到结果,请重新输入
产品选择
文字识别 OCR
在搜索结果页开启AI智能搜索
开启
产品选择
没有找到结果,请重新输入
  • 在线调试 - 文字识别 OCR

    在线调试 API Explorer在线调试工具提供API的检索、调试、代码示例生成功能。同时,集成开发环境CloudIDE,可完成代码的构建、调试、运行。 本章节以通用文字识别为例,介绍如何使用API Explorer调试API。 前提条件 注册华为账号并开通华为云,并完成实名认

  • 网络图片识别 - 文字识别 OCR

    为Boolean类型,若不传该字段,默认不检测切片字体,为True时,将检测切片的字体类型,并返回最相似的5种字体名称。 detect_text_direction 否 Boolean 为Boolean类型,若不传该字段,默认为True,即检测每个字段的文字方向。为False时,则不检测文字方向。若图片中

  • 如何提高识别精度 - 文字识别 OCR

    如何提高识别精度 尽量使用文字清晰高、无反光的图片。进行图片采集时,尽量提高待识别文字区域占比,减少无关背景占比,保持图片内文字清晰人眼可辨认。 若图片有旋转角度,算法支持自动修正,建议图片不要过度倾斜。 图片尺寸方面,建议最长边不超过8192像素,最短边不小于15像素,图像长宽比例维持常见水平

  • 识别字符出现错误如何优化? - 文字识别 OCR

    情形3:多模板识别工作流出错,大部分字段为空或错误。 解决办法:先检查分类结果是否正确(返回结果中的template_id表示分类结果),若分类错误,则说明分类器中存在相似的模板导致分类出错,请在参照字段中添加模板特有的参照字段,从而提高分类的鉴别能力。若分类结果正确,但识别结果错误,请参照情形2的解决办法。

  • 评估 - 文字识别 OCR

    “分类模式”:打开“分类模式”开关时,单独对分类器的准确进行评估。上传图片后,右侧会显示模板自动分类的结果,包括“模板ID”、“模板名”、“置信度”。关闭“分类模式”开关时,默认评估状态为端到端地对待识别图片自动分类并进行结构化识别。 上传在线图片 单击“在线URL”,切换至“在线URL”页签。在“开始识别

  • 智能分类识别 - 文字识别 OCR

    detect_seal 否 Boolean 检测印章开关,开启时则返回单张票证是否含有印章,否则不返回是否含有印章。可选值包括: true:开启检测票证是否含有印章功能。 false:关闭检测票证是否含有印章功能。 说明: 该功能仅检测判断有无印章,不返回印章具体内容。 pdf_page_number

  • 功能体验与试用 - 文字识别 OCR

    功能体验与试用 文字识别(Optical Character Recognition,OCR)是指对图像文件的打印字符进行检测识别,将图像中的文字转换成可编辑的文本格式。OCR通过API提供服务能力,用户需要通过编程来处理识别结果。 在开通OCR前,请先使用OCR体验馆体验服务功

  • 评估 - 文字识别 OCR

    单击“上一步”,对当前模板进行修改。 如果识别结果正确,可单击“下一步”,部署模板。 上传在线图片 在“应用开发>评估”页面,单击“在线URL”,切换至“在线URL”页签。 图3 上传在线图片 在“开始识别”左侧输出框中输入待测试的图片URL地址,或者拖拽测试图片至虚线框内上传图片区域。

  • OCR服务使用简介 - 文字识别 OCR

    服务开通后,您可以根据以下介绍选择合适的使用方式: 通过OCR体验馆在线调用OCR服务API。 如果您没有开发基础,想快速体验OCR服务,OCR体验馆提供了在线网页调用方式,该方式无需编码,直接在网页上传图片,即可返回识别结果。 通过华为云API Explorer在线调用OCR服务API。 如果您是开发初学

  • 智能分类 - 文字识别 OCR

    智能分类 功能介绍 智能分类识别服务可以一次性对同张图片中的多个卡证、票据进行检测和识别,并返回每个卡证、票据的类别及结构化数据。 应用场景 智能分类识别服务应用在身份认证、财务报销等多种场景,使用方便,有效提升数据录入效率。 场景一:卡证、发票混合识别 场景二:相同类型发票识别

  • 什么是文字识别 - 文字识别 OCR

    什么是文字识别 文字识别(Optical Character Recognition,简称OCR)是指将图片、扫描件或PDF、OFD文档中的打印字符进行检测识别成可编辑的文本格式,以JSON格式返回识别结果。 OCR以开放API(Application Programming Interfac

  • 如何获取图片base64编码 - 文字识别 OCR

    如何获取图片base64编码 OCR服务的输入图片参数是图片的base64编码,本节以Python为例,介绍如何将本地图片,转换为base64编码。您也可以使用在线的图片转base64工具。 使用时,需要将代码的d:\demo.jpg替换为实际图片路径。 import base64 with open("d:/demo

  • 服务韧性 - 文字识别 OCR

    服务韧性 OCR提供三级可靠性架构,通过AZ之间容灾、AZ内实例冗余、实例健康检测等技术方案,保障服务的可靠性。 父主题: 安全

  • 印章识别 - 文字识别 OCR

    印章识别 功能介绍 检测和识别合同文件或常用票据中的印章,并可擦除和提取图片中的印章,通过JSON格式返回印章检测、识别、擦除和提取的结果。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 约束与限制 支持JPEG、JPG、PNG、BMP、TIFF、P

  • API概览 - 文字识别 OCR

    通过使用文字识别服务的自研API,您可以使用文字识别服务的所有功能,如表1所示。 文字识别服务当前支持通用类、证件类、票据类和智能分类四种不同类型的接口。您可以通过在线体验,体验接口的识别效果。 对于固定板式的图片,如果当前接口不满足您的业务需求,可以使用ModelArts Pro服务提供的文字识别套件,

  • 自定义字段类型 - 文字识别 OCR

    关信息。 表1 字段属性参数说明 字段属性 参数 参数说明 举例 自定义字典 取值范围 在识别当前字段类型的文字时,选择字典的取值范围中最相似的取值为最后识别结果。 例如: “字段类型名称”:“城市” “字段属性”:“自定义字典” “取值范围”:“Shenzhen”、“Beijing”、“Xi'an”

  • 什么情况下可以使用自定义模板? - 文字识别 OCR

    模板种类固定,识别不在多模板中的图片可能会返回错误的结果或无法识别。 模板间有足够的区分度,不同模板要有不同的参照字段,且参照字段差异尽量明显,相似的参照字段容易导致分类错误。 模板数量可穷举,建议不超过20种模板,过多的模板会降低分类效果(以实际测试为准,模板差异较大时允许支持更多模板)。

  • 概述 - 文字识别 OCR

    概述 文字识别(Optical Character Recognition,简称OCR)是指将图片、扫描件或PDF、OFD文档中的打印字符进行检测识别成可编辑的文本格式,以JSON格式返回识别结果。 OCR以开放API(Application Programming Interfac

  • 使用流程简介 - 文字识别 OCR

    使用流程简介 文字识别是指对图像中的打印字符进行检测识别,通过调用API,识别图片中的文字,并返回JSON格式的识别结果。 使用流程 图1 使用流程 使用前必读 用户需要具备编程能力,熟悉Java、Python、iOS、Android、Node.js编程语言。 OCR服务需要用户

  • 总览 - 文字识别 OCR

    式。 构造请求:Postman环境的构造请求请参考构造请求章节,SDK环境的API调用详见SDK参考。 除上述两种方式外,还可通过APIE在线调试的方式调用API,步骤如下。 开通服务后进入APIE界面。 选择已开通的服务和开通服务对应的Region。 Body部分填入image