已找到以下 10000 条记录
产品选择
全部
没有找到结果,请重新输入
产品选择
全部
产品选择
没有找到结果,请重新输入
  • 营业执照识别 - 文字识别 OCR

    营业执照识别 功能介绍 识别营业执照首页图片文字信息,并以JSON格式返回识别的结构化结果。该接口使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 营业执照示例图 图2 营业执照示例图-横版 约束与限制 只支持识别PNG、JPG、JPEG、BMP、TIFF格式图片及PDF。

  • 出租车发票识别 - 文字识别 OCR

    出租车发票识别 功能介绍 识别出租车发票中文字信息,并以JSON格式返回识别的结构化结果。该接口使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 出租车发票示例图 如果图片中包含多张卡证票据,请调用智能分类识别服务。 约束与限制 只支持识别PNG、J

  • 评估应用 - 企业级AI应用开发专业套件 ModelArts Pro

    评估应用 确定模板图片参照字段和识别区后,需要对模板图片进行评估和考察。您可以通过上传测试图片,在线评估模板识别情况,保证能正确识别同样模板下其他图片识别文字。 前提条件 已在文字识别套件控制台选择“通用单模板工作流”新建应用,完成框选识别区步骤,详情请见框选识别区。 进入评估页面

  • 工作流介绍 - 文字识别 OCR

    上传模板图片后,需要对模板图片进行预处理,去掉冗余部分,将图片旋转至水平,保证模型识别的准确性。 定义预处理 框选参照字段 在图片模板中框选参照字段,用于矫正图片方向,进而在正确方向上,识别图片结构化信息。 框选参照字段 框选识别区 在图片模板中框选识别区,确定模板图片中需要识别文字位置。

  • 泰文身份证识别 - 文字识别 OCR

    泰文身份证识别 功能介绍 识别泰国身份证中文字信息,并以JSON格式返回识别的结构化结果。该接口使用限制请参见约束与限制。 图1 泰文身份证示例图 使用中国站账号开通泰文身份证识别时,需要在OCR控制台左上角,将区域切换至“亚太-曼谷”。 图2 切换区域至亚太曼谷 约束与限制

  • 印章识别 - 文字识别 OCR

    多页PDF默认识别第一页,或者您可以指定要识别的页码。 图像各边像素大小在15px到8192px之间。 支持单图多印章识别。 支持图像中印章任意角度水平旋转。 支持圆形章、椭圆章、方形章、三角章和菱形章检测和识别。 能处理反光、暗光等干扰图片但影响识别精度。 调用方法 请参见如何调用API。

  • 提取图片图片暗水印(文件地址版本) - 数据安全中心 DSC

    提取图片图片暗水印(文件地址版本) 功能介绍 对指定存储地址信息(目前支持OBS)已嵌入图片暗水印图片提取图片暗水印,提取出水印图片将存放在用户指定位置(目前支持OBS),支持图片格式为:*.jpg, *.jpeg, *.jpe, *.png, *.bmp, *.dib

  • 评估应用 - 企业级AI应用开发专业套件 ModelArts Pro

    图片区域,上传本地图片作为测试图片。 上传图片后,右侧会显示文字识别结果,包括“识别区”和对应识别结果”。 上传在线图片 单击“在线URL”,切换至“在线URL”页签。在“开始识别”左侧输出框中输入待测试图片URL地址,或者拖拽测试图片至虚线框内上传图片区域,上传在线图片作为测试图片。

  • 框选参照字段 - 文字识别 OCR

    框选参照字段 在识别文字过程中,套件会先对图片进行模板分类,再检查所识别图片与模板图片是否为同一种模板,并将识别图片校正后再提取结构化信息,支持图片平移、旋转与拉伸变换。 为了正确分类校正待识别图片,这就需要在模板图片中指定参照字段。通过参照字段文字内容来判断识别图片属于哪一种

  • 工作流介绍 - 企业级AI应用开发专业套件 ModelArts Pro

    在图片模板中框选识别区,确定模板图片中需要识别文字位置。 框选识别区 评估应用 通过上传与模板图片同一板式测试图片,评估图片识别结果是否正确。 评估应用 部署服务 模板图片评估后,可以部署模板至文字识别开发套件中,开发属于自己文字识别应用,此应用用于识别自己所上传模板样式图片。 部署服务 父主题: 通用单模板工作流

  • 识别结果后处理 - 文字识别 OCR

    est.xlsx", response) 使用PDF进行文字识别 本示例将PDF文件转换为图片调用网络图片识别API,获取识别结果。 前提条件 开通网络图片识别。 参考本地调用,安装OCR Python SDK。执行pip install fitz命令和pip install

  • API概览 - 文字识别 OCR

    格式返回识别的结构化结果。 手写文字识别 识别手写文字图片文字内容。 证件类 身份证识别 识别身份证图片中正面与反面的文字内容,返回识别文字和坐标。 户口本识别 识别户口本中文字信息,返回识别的结构化结果。 行驶证识别 识别行驶证图片中主页与副页文字内容,返回识别的文字和坐标。

  • 车辆通行费发票识别 - 文字识别 OCR

    请保证被检测图片所在存储服务稳定可靠,推荐使用OBS服务存储图片数据。 url中不能存在中文字符,若存在,中文需要进行utf8编码。 return_text_location 否 Boolean 识别文字区域位置信息。可选值包括: true:返回各个文字块区域 false:不返回各个文字块区域

  • 调用SDK实现通用表格识别 - 文字识别 OCR

    调用SDK实现通用表格识别 文字识别服务软件开发工具包(OCR SDK)是对文字识别服务提供REST API进行封装,以简化用户开发工作。 本章节以通用表格识别API为例,介绍如何使用OCR Python SDK。 使用OCR SDK详细步骤如下所示: 步骤1:开通服务 步骤2:安装SDK

  • 准备数据 - 文字识别 OCR

    受技术与成本多种因素制约,文字识别服务存在一些约束限制。 以通用文字识别API为例,输入数据存在以下约束。其他API使用约束请参见约束与限制。 只支持识别PNG、JPG、JPEG、BMP、TIFF格式图片。 图像各边像素大小在15px到8192px之间。 图像中识别区域有效占比超过

  • 评估 - 文字识别 OCR

    评估 确定模板图片参照字段和识别区后,需要对模板图片进行评估和考察。您可以通过上传测试图片,在线评估模板识别情况,保证能正确识别同样模板下其他图片识别文字。 前提条件 已在自定义OCR控制台选择“通用单模板工作流”创建应用,完成框选识别区步骤,详情请见框选识别区。 进入评估页面

  • OCR服务能否实时处理视频流中文字 - 文字识别 OCR

    OCR服务能否实时处理视频流中文字 OCR不支持读取视频流数据,您可将视频流进行提取帧图片操作,提取出图片后进行识别。 父主题: 产品咨询类

  • 哥伦比亚身份证识别 - 文字识别 OCR

    哥伦比亚身份证识别 功能介绍 识别哥伦比亚身份证中文字信息,并将识别的结构化结果返回给用户。 约束与限制 支持哥伦比亚身份证识别。 只支持识别PNG、JPG、JPEG、BMP、TIFF格式图片。 图像各边像素大小在15px到8000px之间。 图像中身份证区域有效占比超过8

  • 附录 - AI

    础设施,函数以弹性、免运维、高可靠方式运行。此外,按函数实际执行资源计费,不执行不产生费用。 文字识别 OCR:提供在线文字识别服务,将图片或扫描件中文字识别成可编辑文本。OCR文字识别支持证件识别、票据识别、定制模板识别、通用表格文字识别等。

  • IAM用户登录验证权限 - 文字识别 OCR

    IAM用户登录验证权限 使用新创建IAM账户登录控制台,切换至授权区域,进行验证权限。 假设IAM用户只具备“OCR ReadOnlyAccess”权限,即只读访问权限,使IAM用户仅具备使用服务能力,开通/关闭服务需要主账户操作。 进入OCR控制台界面,单击“开通服务”,如