已找到以下 176 条记录
AI智能搜索
产品选择
文字识别 OCR
没有找到结果,请重新输入
产品选择
文字识别 OCR
在搜索结果页开启AI智能搜索
开启
产品选择
没有找到结果,请重新输入
  • pdf转图片方法 - 文字识别 OCR

    page2pix(self, doc, page, trans): """ 根据给定参数,解析当前页作为图片数据 """ # 获取指定页面的pdf格式,注意:页面参数事先解析出来,不然会存在问题。 return doc[page].getPixmap(matrix=trans

  • OCR服务识别结果可以转化为Word、TXT、pdf吗 - 文字识别 OCR

    OCR服务识别结果可以转化为Word、TXT、pdf吗 OCR提取之后返回结果JSON格式,需要用户通过编程,将结果保存为Word、TXT、pdf格式。 父主题: API使用类

  • 智能文档解析 - 文字识别 OCR

    key-value对(键值对)中key,例如“姓名:小明”中“姓名” value String key-value对(键值对)中value,例如“姓名:小明”中“小明” words_block_count Integer 该键值对中所包含文本框数量。 words_block_list

  • OCR服务可以识别文本格式文件吗 - 文字识别 OCR

    OCR服务可以识别文本格式文件吗 增值税发票识别API支持使用pdf、ofd文件进行识别。其他API不能直接识别word、pdf、excel等文件,可将此类文件转换为图片进行识别。pdf转图片识别示例请参见识别结果后处理。 父主题: 产品咨询类

  • 印章识别 - 文字识别 OCR

    检测和识别合同文件或常用票据中印章,并可擦除和提取图片中印章,通过JSON格式返回印章检测、识别、擦除和提取结果。该接口使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 约束与限制 支持JPEG、JPG、PNG、BMP、TIFF、PDF格式,多页PDF默认识别第一页,或者您可以指定要识别的页码。

  • 银行回单识别 - 文字识别 OCR

    创建企业项目后,在传参时,有以下三类场景。 携带正确ID,正常使用OCR服务,账单企业项目会被分类到企业ID对应企业项目中。 携带格式正确但不存在ID,正常使用OCR服务,账单企业项目会显示对应不存在企业项目ID。 不携带ID或格式错误ID(包含特殊字符等),正常使用OCR服务,账单企业项目会被分类到"default"中。

  • 什么文字识别 - 文字识别 OCR

    什么文字识别 文字识别(Optical Character Recognition,简称OCR)指将图片、扫描件或PDF、OFD文档中打印字符进行检测识别成可编辑文本格式,以JSON格式返回识别结果。 OCR以开放API(Application Programming I

  • 机动车销售发票识别 - 文字识别 OCR

    携带正确的ID,正常使用OCR服务,账单企业项目会被分类到企业ID对应企业项目中。 携带格式正确但不存在ID,正常使用OCR服务,账单企业项目会显示对应不存在企业项目ID。 不携带ID或格式错误ID(包含特殊字符等),正常使用OCR服务,账单企业项目会被分类到"default"中。 表3 请求Body参数

  • 数据保护技术 - 文字识别 OCR

    OCR服务处理以下类型数据: OCR输入数据,包括图像(PNG、JPG 、JPEG和 BMP等)和文档(PDF 和 TIFF等)。 OCR结果,包括从客户图像和文档中提取文本及其位置以及置信度等。 OCR通过多种数据保护手段和特性,保障客户在使用OCR服务时数据安全。 表1 OCR数据保护手段和特性

  • 开始使用 - 文字识别 OCR

    登录华为云对象存储服务控制台,查看部署完成后,自动创建OBS桶列表。 图1 对象存储服务控制台 选择用于上传和存储发票图片或者PDF文件桶“ocr-invoice-image-bucket”,上传示例发票图片或者电子发票pdf文件。 图2 上传待识别发票 选择用于存放结果“ocr-invoice-r

  • OCR服务使用简介 - 文字识别 OCR

    Recognition,简称OCR)指将图片、扫描件或PDF、OFD文档中打印字符进行检测识别成可编辑文本格式。 OCR以开放API(Application Programming Interface,应用程序编程接口)方式提供给用户,用户使用Python、Java等编程语

  • 通用文字识别 - 文字识别 OCR

    携带正确的ID,正常使用OCR服务,账单企业项目会被分类到企业ID对应企业项目中。 携带格式正确但不存在ID,正常使用OCR服务,账单企业项目会显示对应不存在企业项目ID。 不携带ID或格式错误ID(包含特殊字符等),正常使用OCR服务,账单企业项目会被分类到"default"中。 表3 请求Body参数

  • 总览 - 文字识别 OCR

    章节。 配置环境:可选择下载Postman或下载SDK。 认证鉴权:可选择Token认证(Postman环境)或AK/SK认证(SDK环境)。根据步骤二配置环境选择认证鉴权方式。 构造请求:Postman环境构造请求请参考构造请求章节,SDK环境API调用详见SDK参考。

  • 道路运输证识别 - 文字识别 OCR

    携带正确的ID,正常使用OCR服务,账单企业项目会被分类到企业ID对应企业项目中。 携带格式正确但不存在ID,正常使用OCR服务,账单企业项目会显示对应不存在企业项目ID。 不携带ID或格式错误ID(包含特殊字符等),正常使用OCR服务,账单企业项目会被分类到"default"中。 表3 请求Body参数

  • 概述 - 文字识别 OCR

    Recognition,简称OCR)指将图片、扫描件或PDF、OFD文档中打印字符进行检测识别成可编辑文本格式,以JSON格式返回识别结果。 OCR以开放API(Application Programming Interface,应用程序编程接口)方式提供给用户,用户通过实时访

  • OCR服务SDK需要付费购买吗 - 文字识别 OCR

    OCR服务SDK需要付费购买吗 OCR服务SDK供用户免费下载,并依据API调用次数进行收费。 父主题: SDK使用类

  • 约束与限制 - 文字识别 OCR

    限制,所有子服务约束。除系统级约束限制外,各子服务还有独立约束条件。 智能文档解析 支持中英文及部分中文繁体字。 只支持识别PNG、JPG、JPEG、BMP、GIF、TIFF、WEBP、PCX、ICO、PSD格式图片以及PDF文档,PDF只支持单页识别,可通过pdf_page_number参数指定页码。

  • 营业执照识别 - 文字识别 OCR

    携带正确的ID,正常使用OCR服务,账单企业项目会被分类到企业ID对应企业项目中。 携带格式正确但不存在ID,正常使用OCR服务,账单企业项目会显示对应不存在企业项目ID。 不携带ID或格式错误ID(包含特殊字符等),正常使用OCR服务,账单企业项目会被分类到"default"中。 表3 请求Body参数

  • 增值税发票识别 - 文字识别 OCR

    携带正确的ID,正常使用OCR服务,账单企业项目会被分类到企业ID对应企业项目中。 携带格式正确但不存在ID,正常使用OCR服务,账单企业项目会显示对应不存在企业项目ID。 不携带ID或格式错误ID(包含特殊字符等),正常使用OCR服务,账单企业项目会被分类到"default"中。 表3 请求Body参数

  • 识别结果后处理 - 文字识别 OCR

    get_client() df_path = r"本地pdf文件路径,例如D:\local\test.pdf" save_path = r"转换后图片路径,例如D:\local" covert_pdf_to_jpg = CovertPdfToJpg(df_path