华为云用户手册

  • 相关API列表 开放接口 接口定义链接 查询汇总账单 https://support.huaweicloud.com/api-oce/mbc_00008.html 查询资源详单 https://support.huaweicloud.com/api-oce/mbc_00003.html 查询资源消费记录 https://support.huaweicloud.com/api-oce/mbc_00004.html
  • 相关API列表 开放接口 接口定义链接 查询资源包列表 https://support.huaweicloud.com/api-oce/api_order_00027.html 查询资源包使用量 https://support.huaweicloud.com/api-oce/api_order_00028.html 查询资源包使用明细 https://support.huaweicloud.com/api-oce/api_order_00029.html
  • 华为云环境地址 环境 说明 地址 BSS请求地址 BSS提供的客户运营能力接口的访问路径(Endpoint)。 客户通过拼接该地址和具体接口的URI访问具体接口。 https://bss.myhuaweicloud.com 说明: 该Endpoint为全局Endpoint,中国站所有区域均可使用。 账号中心 华为云提供给普通客户查看账号基本信息、用户认证、首选项设置、查看我的特权与推荐的运营管理界面。 https://account.huaweicloud.com/usercenter/#/accountindex/accountInfo 费用中心 华为云提供给普通客户充值、续费、查看订单、查看财务信息、查看优惠券与折扣、申请合同、开具发票、退订与变更的运营管理界面。 https://account.huaweicloud.com/usercenter 控制台 华为云普通客户可以登录华为云管理控制台,对华为云各服务进行查看、购买、使用等操作。 https://console.huaweicloud.com/console/ 我的凭证 我的凭证是将客户的安全凭证信息进行集中展示与管理的服务。通过我的凭证,用户可以查询所需的项目ID、账号名称,可以修改已验证手机、邮箱、密码,还可以管理访问密钥(AK/SK)等。 https://console.huaweicloud.com/iam/#/myCredential 父主题: 附录
  • 相关API列表 开放接口 接口定义链接 查询云服务类型列表 https://support.huaweicloud.com/api-oce/zh-cn_topic_0000001256679455.html 查询资源类型列表 https://support.huaweicloud.com/api-oce/zh-cn_topic_0000001256519451.html 根据云服务类型查询资源列表 https://support.huaweicloud.com/api-oce/qct_00003.html 查询使用量类型列表 https://support.huaweicloud.com/api-oce/qct_00004.html 查询度量单位列表 https://support.huaweicloud.com/api-oce/qct_00006.html 查询度量单位进制 https://support.huaweicloud.com/api-oce/qct_00007.html
  • 相关API列表 开放接口 接口定义链接 查询订单列表 https://support.huaweicloud.com/api-oce/api_order_00013.html 查询订单详情 https://support.huaweicloud.com/api-oce/api_order_00014.html 查询订单可用优惠券 https://support.huaweicloud.com/api-oce/api_order_00015.html 查询订单可用折扣 https://support.huaweicloud.com/api-oce/api_order_00025.html 支付包年/包月产品订单 https://support.huaweicloud.com/api-oce/api_order_00030.html 取消待支付订单 https://support.huaweicloud.com/api-oce/api_order_00017.html 查询退款订单的金额详情 https://support.huaweicloud.com/api-oce/api_order_00020.html
  • OCR权限 默认情况下,管理员创建的 IAM 用户没有任何权限,需要将其加入用户组,并给用户组授予策略或角色,才能使得用户组中的用户获得对应的权限,这一过程称为授权。授权后,用户就可以基于被授予的权限对云服务进行操作。 OCR部署时通过物理区域划分,为项目级服务。授权时,“作用范围”需要选择“区域级项目”,然后在指定区域(如华北-北京四)对应的项目(cn-north-4)中设置相关权限,并且该权限仅对此项目生效;如果在“所有项目”中设置权限,则该权限在所有区域项目中都生效。访问OCR时,需要先切换至授权区域。 如表1所示,包括了OCR的所有系统角色。 表1 OCR系统策略 策略名称 描述 策略类型 依赖关系 OCR FullAccess 所有权限 系统策略 无 OCR ReadOnlyAccess 只读访问权限 系统策略 无 表2列出了OCR常用操作与系统策略的授权关系,您可以参照该表选择合适的系统策略。 表2 OCR操作与系统策略关系 Action Action说明 OCR FullAccess OCR ReadOnlyAccess ocr:financialStatement:subscribe 开通财报识别服务 √ × ocr:financialStatement:unsubscribe 取消开通财报识别服务 √ × ocr:financialStatement:getSubscribeUserList 查询开通财报识别的用户列表 √ √ ocr:financialStatement:subscribeAllUsers 为其余子用户开通财报识别服务 √ × ocr:financialStatement:unsubscribeAllUsers 为其余子用户取消开通财报识别服务 √ × ocr:autoClassification:subscribe 开通智能分类识别服务 √ × ocr:autoClassification:unsubscribe 取消开通智能分类识别服务 √ × ocr:autoClassification:getSubscribeUserList 查询开通智能分类识别的用户列表 √ √ ocr:autoClassification:subscribeAllUsers 为其余子用户开通智能分类识别服务 √ × ocr:autoClassification:unsubscribeAllUsers 为其余子用户取消开通智能分类识别服务 √ × ocr:idCard:subscribe 开通身份证识别服务 √ × ocr:idCard:unsubscribe 取消开通身份证识别服务 √ × ocr:idCard:getSubscribeUserList 查询开通身份证识别的用户列表 √ √ ocr:idCard:subscribeAllUsers 为其余子用户开通身份证识别服务 √ × ocr:idCard:unsubscribeAllUsers 为其余子用户取消开通身份证识别服务 √ × ocr:driverLicense:subscribe 开通驾驶证识别服务 √ × ocr:driverLicense:unsubscribe 取消开通驾驶证识别服务 √ × ocr:driverLicense:getSubscribeUserList 查询开通驾驶证识别的用户列表 √ √ ocr:driverLicense:subscribeAllUsers 为其余子用户开通驾驶证识别服务 √ × ocr:driverLicense:unsubscribeAllUsers 为其余子用户取消开通驾驶证识别服务 √ × ocr:vehicleLicense:subscribe 开通 行驶证识别 服务 √ × ocr:vehicleLicense:unsubscribe 取消开通行驶证识别服务 √ × ocr:vehicleLicense:getSubscribeUserList 查询开通行驶证识别的用户列表 √ √ ocr:vehicleLicense:subscribeAllUsers 为其余子用户开通行驶证识别服务 √ × ocr:vehicleLicense:unsubscribeAllUsers 为其余子用户取消开通行驶证识别服务 √ × ocr:vatInvoice:subscribe 开通增值税发票识别服务 √ × ocr:vatInvoice:unsubscribe 取消开通增值税发票识别服务 √ × ocr:vatInvoice:getSubscribeUserList 查询开通增值税发票识别的用户列表 √ √ ocr:vatInvoice:subscribeAllUsers 为其余子用户开通增值税发票识别服务 √ × ocr:vatInvoice:unsubscribeAllUsers 为其余子用户取消开通增值税发票识别服务 √ × ocr:invoiceVerification:subscribe 开通发票验真服务 √ × ocr:invoiceVerification:unsubscribe 取消开通发票验真服务 √ × ocr:invoiceVerification:getSubscribeUserList 查询开通发票验真的用户列表 √ √ ocr:invoiceVerification:subscribeAllUsers 为其余子用户开通发票验真服务 √ × ocr:invoiceVerification:unsubscribeAllUsers 为其余子用户取消开通发票验真服务 √ × ocr:mvsInvoice:subscribe 开通机动车销售发票识别服务 √ × ocr:mvsInvoice:unsubscribe 取消开通机动车销售发票识别服务 √ × ocr:mvsInvoice:getSubscribeUserList 查询开通机动车销售发票识别的用户列表 √ √ ocr:mvsInvoice:subscribeAllUsers 为其余子用户开通机动车销售发票识别服务 √ × ocr:mvsInvoice:unsubscribeAllUsers 为其余子用户取消开通机动车销售发票识别服务 √ × ocr:generalText:subscribe 开通 通用文字识别 服务 √ × ocr:generalText:unsubscribe 取消开通通用 文字识别 服务 √ × ocr:generalText:getSubscribeUserList 查询开通通用文字识别的用户列表 √ √ ocr:generalText:subscribeAllUsers 为其余子用户开通通用文字识别服务 √ × ocr:generalText:unsubscribeAllUsers 为其余子用户取消开通通用文字识别服务 √ × ocr:generalTable:subscribe 开通通用 表格识别 服务 √ × ocr:generalTable:unsubscribe 取消开通通用表格识别服务 √ × ocr:generalTable:getSubscribeUserList 查询开通通用表格识别的用户列表 √ √ ocr:generalTable:subscribeAllUsers 为其余子用户开通通用表格识别服务 √ × ocr:generalTable:unsubscribeAllUsers 为其余子用户取消开通通用表格识别服务 √ × ocr:tollInvoice:subscribe 开通车辆通行费发票识别服务 √ × ocr:tollInvoice:unsubscribe 取消开通车辆通行费发票识别服务 √ × ocr:tollInvoice:getSubscribeUserList 查询开通车辆通行费发票识别的用户列表 √ √ ocr:tollInvoice:subscribeAllUsers 为其余子用户开通车辆通行费发票识别服务 √ × ocr:tollInvoice:unsubscribeAllUsers 为其余子用户取消开通车辆通行费发票识别服务 √ × ocr:quotaInvoice:subscribe 开通定额发票识别服务 √ × ocr:quotaInvoice:unsubscribe 取消开通定额发票识别服务 √ × ocr:quotaInvoice:getSubscribeUserList 查询开通定额发票识别的用户列表 √ √ ocr:quotaInvoice:subscribeAllUsers 为其余子用户开通定额发票识别服务 √ × ocr:quotaInvoice:unsubscribeAllUsers 为其余子用户取消开通定额发票识别服务 √ × ocr:flightItinerary:subscribe 开通飞机行程单识别服务 √ × ocr:flightItinerary:unsubscribe 取消开通飞机行程单识别服务 √ × ocr:flightItinerary:getSubscribeUserList 查询开通飞机行程单识别的用户列表 √ √ ocr:flightItinerary:subscribeAllUsers 为其余子用户开通飞机行程单识别服务 √ × ocr:flightItinerary:unsubscribeAllUsers 为其余子用户取消开通飞机行程单识别服务 √ × ocr:taxiInvoice:subscribe 开通出租车发票识别服务 √ × ocr:taxiInvoice:unsubscribe 取消开通出租车发票识别服务 √ × ocr:taxiInvoice:getSubscribeUserList 查询开通出租车发票识别的用户列表 √ √ ocr:taxiInvoice:subscribeAllUsers 为其余子用户开通出租车发票识别服务 √ × ocr:taxiInvoice:unsubscribeAllUsers 为其余子用户取消开通出租车发票识别服务 √ × ocr:trainTicket:subscribe 开通火车票识别服务 √ × ocr:trainTicket:unsubscribe 取消开通火车票识别服务 √ × ocr:trainTicket:getSubscribeUserList 查询开通火车票识别的用户列表 √ √ ocr:trainTicket:subscribeAllUsers 为其余子用户开通火车票识别服务 √ × ocr:trainTicket:unsubscribeAllUsers 为其余子用户取消开通火车票识别服务 √ × ocr:bankCard:subscribe 开通银行卡识别服务 √ × ocr:bankCard:unsubscribe 取消开通银行卡识别服务 √ × ocr:bankCard:getSubscribeUserList 查询开通银行卡识别的用户列表 √ √ ocr:bankCard:subscribeAllUsers 为其余子用户开通银行卡识别服务 √ × ocr:bankCard:unsubscribeAllUsers 为其余子用户取消开通银行卡识别服务 √ × ocr:passport:subscribe 开通护照识别服务 √ × ocr:passport:unsubscribe 取消开通护照识别服务 √ × ocr:passport:getSubscribeUserList 查询开通护照识别的用户列表 √ √ ocr:passport:subscribeAllUsers 为其余子用户开通护照识别服务 √ × ocr:passport:unsubscribeAllUsers 为其余子用户取消开通护照识别服务 √ × ocr:transportationLicense:subscribe 开通道路运输证识别服务 √ × ocr:transportationLicense:unsubscribe 取消开通道路运输证识别服务 √ × ocr:transportationLicense:getSubscribeUserList 查询开通道路运输证识别的用户列表 √ √ ocr:transportationLicense:subscribeAllUsers 为其余子用户开通道路运输证识别服务 √ × ocr:transportationLicense:unsubscribeAllUsers 为其余子用户取消开通道路运输证识别服务 √ × ocr:businessLicense:subscribe 开通营业执照识别服务 √ × ocr:businessLicense:unsubscribe 取消开通营业执照识别服务 √ × ocr:businessLicense:getSubscribeUserList 查询开通营业执照识别的用户列表 √ √ ocr:businessLicense:subscribeAllUsers 为其余子用户开通营业执照识别服务 √ × ocr:businessLicense:unsubscribeAllUsers 为其余子用户取消开通营业执照识别服务 √ × ocr:licensePlate:subscribe 开通车牌识别服务 √ × ocr:licensePlate:unsubscribe 取消开通车牌识别服务 √ × ocr:licensePlate:getSubscribeUserList 查询开通车牌识别的用户列表 √ √ ocr:licensePlate:subscribeAllUsers 为其余子用户开通车牌识别服务 √ × ocr:licensePlate:unsubscribeAllUsers 为其余子用户取消开通车牌识别服务 √ × ocr:webImage:subscribe 开通网络图片识别服务 √ × ocr:webImage:unsubscribe 取消开通网络图片识别服务 √ × ocr:webImage:getSubscribeUserList 查询开通网络图片识别的用户列表 √ √ ocr:webImage:subscribeAllUsers 为其余子用户开通网络图片识别服务 √ × ocr:webImage:unsubscribeAllUsers 为其余子用户取消开通网络图片识别服务 √ × ocr:handwriting:subscribe 开通手写文字识别服务 √ × ocr:handwriting:unsubscribe 取消开通手写文字识别服务 √ × ocr:handwriting:getSubscribeUserList 查询开通手写文字识别的用户列表 √ √ ocr:handwriting:subscribeAllUsers 为其余子用户开通手写文字识别服务 √ × ocr:handwriting:unsubscribeAllUsers 为其余子用户取消开通手写文字识别服务 √ × ocr:vin:subscribe 开通vin码识别服务 √ × ocr:vin:unsubscribe 取消开通vin码识别服务 √ × ocr:vin:getSubscribeUserList 查询开通vin码识别的用户列表 √ √ ocr:vin:subscribeAllUsers 为其余子用户开通vin码识别服务 √ × ocr:vin:unsubscribeAllUsers 为其余子用户取消开通vin码识别服务 √ × ocr:businessCard:subscribe 开通名片识别服务 √ × ocr:businessCard:unsubscribe 取消开通名片识别服务 √ × ocr:businessCard:getSubscribeUserList 查询开通名片识别的用户列表 √ √ ocr:businessCard:subscribeAllUsers 为其余子用户开通名片识别服务 √ × ocr:businessCard:unsubscribeAllUsers 为其余子用户取消开通名片识别服务 √ × ocr:insurancePolicy:subscribe 开通保险单识别服务 √ × ocr:insurancePolicy:unsubscribe 取消开通保险单识别服务 √ × ocr:insurancePolicy:getSubscribeUserList 查询开通保险单识别的用户列表 √ √ ocr:insurancePolicy:subscribeAllUsers 为其余子用户开通保险单识别服务 √ × ocr:insurancePolicy:unsubscribeAllUsers 为其余子用户取消开通保险单识别服务 √ × ocr:transportationQualificationCertificate:subscribe 开通道路运输从业资格证服务 √ × ocr:transportationQualificationCertificate:unsubscribe 取消开通道路运输从业资格证服务 √ × ocr:transportationQualificationCertificate:getSubscribeUserList 查询开通道路运输从业资格证的用户列表 √ √ ocr:transportationQualificationCertificate:subscribeAllUsers 为其余子用户开通道路运输从业资格证服务 √ × ocr:transportationQualificationCertificate:unsubscribeAllUsers 为其余子用户取消开通道路运输从业资格证服务 √ ×
  • IAM用户登录并验证权限 使用新创建的IAM账户登录控制台,切换至授权区域,进行验证权限。 假设IAM用户只具备“OCR ReadOnlyAccess”权限,即只读访问权限,使IAM用户仅具备使用服务能力,开通/关闭服务需要主账户操作。 进入OCR控制台界面,单击“开通服务”,如果无法开通,提示权限不足,则表示“OCR ReadOnlyAccess”已生效。 IAM用户不管是否具备“OCR ReadOnlyAccess”权限,只要具备 “OCR FullAccess”权限,便可以在控制台进行开通、关闭服务。 父主题: 权限管理
  • 解读识别结果 本章节通过网络图片识别API介绍如何解读调API返回的JSON格式识别结果。请参照API参考“响应参数”章节比对查看。 以下图识别结果为例,讲解图片内容如何与API的返回字段对应。 调用网络图片API成功后,在“JSON返回结果”中,可见result字段,该字段包含了图片中的文字块数目、文字块排列顺序、具体文本内容、所在位置、置信度等信息。 result字段仅在API调用成功后返回。 words_block_count表示文字块识别结果,本示例中,识别出2个文字块,分别代表图片中的2行文字。 words_block_list表示文字块列表,按照图片文字从上到下、从左到右排列。 words为识别出来的文本内容,confidence表示该字段的置信度。 location表示文字块的区域位置信息,采用图像坐标系,第一个文字块左上角顶点为[140,45]。 extracted_data表示图片中包含的联系人信息,仅在设置了入参extract_type,且图片中有联系人信息时支持提取。 { "result": { "words_block_count": 2, "words_block_list": [ { "words": "真材实料/舒柔养足", "confidence": 0.9491, "location": [ [ 140, 45 ], [ 380, 45 ], [ 380, 75 ], [ 140, 75 ] ] }, { "words": "选自优质头层牛皮,皮质柔软富弹性,耐折抗拉伸,穿着不变形", "confidence": 0.9897, "location": [ [ 58, 84 ], [ 462, 84 ], [ 462, 102 ], [ 58, 102 ] ] } ], "extracted_data": {} }} 父主题: 获取识别结果
  • 操作步骤 登录 云审计 服务控制台。 单击左侧导航树的“事件列表”,进入事件列表信息页面。 事件列表支持通过筛选来查询对应的操作事件。当前事件列表支持四个维度的组合查询,详细信息如下: 事件来源、资源类型和筛选类型。 在下拉框中选择查询条件。 其中筛选类型选择事件名称时,还需选择某个具体的事件名称。 选择资源ID时,还需选择或者手动输入某个具体的资源ID。 选择资源名称时,还需选择或手动输入某个具体的资源名称。 操作用户:在下拉框中选择某一具体的操作用户,此操作用户指用户级别,而非租户级别。 事件级别:可选项为“所有事件级别”、“normal”、“warning”、“incident”,只可选择其中一项。 时间范围:可选择查询最近七天内任意时间段的操作事件。 展开需要查看的事件,查看详细信息。 图1 展开记录 在需要查看的记录右侧,单击“查看事件”,弹窗中显示了该操作事件结构的详细信息。
  • OCR自定义策略 如果系统预置的权限,不满足您的授权要求,可以创建自定义策略。自定义策略中可以添加的授权项(Action)请参见权限管理。 目前华为云支持以下两种方式创建自定义策略: 可视化视图创建自定义策略:无需了解策略语法,按可视化视图导航栏选择云服务、操作、资源、条件等策略内容,可自动生成策略。 JSON视图创建自定义策略:可以在选择策略模板后,根据具体需求编辑策略内容;也可以直接在编辑框内编写JSON格式的策略内容。 具体创建步骤请参见:创建自定义策略。 父主题: 权限管理
  • 使用工作流开发应用流程 自定义OCR提供了单模板工作流和多模板工作流,您可以通过预置的工作流,自主构建文字识别模板,识别模板图片中的文字,提供高精度的文字识别模型,保证结构化信息提取精度。 图1 使用预置工作流开发应用 表1 使用工作流开发应用流程 流程 说明 详细指导 自定义OCR 根据您的实际使用需求选择自定义OCR。您可以通过查看产品文档选择所需使用的工作流。 在“文字识别”控制台界面,单击左侧菜单“自定义OCR”,进入自定义OCR应用页面。 创建应用 基于已选择的工作流创建应用,填写应用基本信息、选择工作流。 创建应用 开发应用 通用单模板工作流 根据工作流指引,创建单模板服务,通过模板训练文字识别模型,实现单模板图像的文字信息结构化提取。 通用单模板工作流 多模板分类工作流 根据工作流指引,创建多模板服务,通过多模板训练模板分类器和文字识别模型,实现多模板图像的文字信息结构化提取。 多模板分类工作流 调用API 调用指南,支持通过API调用当前模板服务。 调用API
  • 工作流 自定义OCR当前提供了单模板工作流和多模板工作流,自主构建文字识别模板,识别模板图片中的文字,提供高精度的文字识别模型,保证结构化信息提取精度。 通用单模板工作流 通过构建文字识别模板,识别单个板式图片中的文字,提供高精度的文字识别模型,保证结构化信息提取精度。 多模板分类工作流 支持用户自定义多个文字识别模板,通过AI分类算法,自动识别图片所需使用的模板,从而支持从大量不同板式图像中提取结构化信息。
  • 提取特定字段导入Excel 本示例调用身份证识别API,并从获取到的JSON结果中,提取所需的字段,填入至Excel。 前提条件 开通身份证识别。 参考本地调用,安装OCR Python SDK。并执行pip install xlsxwriter命令安装依赖包。 登录访问密钥页面,获取AK、SK。可以新增访问密钥,或使用已有的访问密钥。访问密钥为credentials.csv文件,包含AK/SK信息。 代码示例 # -*- coding: utf-8 -*-import base64import xlsxwriterfrom huaweicloudsdkcore.auth.credentials import BasicCredentialsfrom huaweicloudsdkocr.v1.region.ocr_region import OcrRegionfrom huaweicloudsdkcore.exceptions import exceptionsfrom huaweicloudsdkocr.v1 import *from huaweicloudsdkcore.http.http_config import HttpConfigdef recognize_id_card_request(): try: request = RecognizeIdCardRequest() request.body = IdCardRequestBody( image=image_base64 ) response = client.recognize_id_card(request) return response except exceptions.ClientRequestException as e: print(e.status_code) print(e.request_id) print(e.error_code) print(e.error_msg)def get_credential(): return BasicCredentials(ak, sk)def get_client(): config = HttpConfig.get_default_config() config.ignore_ssl_verification = True return OcrClient.new_builder(OcrClient) \ .with_credentials(credentials) \ .with_region(OcrRegion.CN_NORTH_4) \ .with_http_config(config) \ .build()def image_to_base64(imagepath): """ 将本地图片转化为base64编码 """ with open(imagepath, "rb") as bin_data: image_data = bin_data.read() base64_data = base64.b64encode(image_data).decode("utf-8") return base64_datadef response_to_execl(save_file, data): """ :param save_file: 文件名 :param data: result data """ # 处理调用API返回的result数据 keys_list = list(data["result"].keys()) values_list = list(data["result"].values()) options = {'in_memory': True} with xlsxwriter.Workbook(save_file, options) as workbook: worksheet = workbook.add_worksheet() worksheet.set_column('A1:A20', 23) worksheet.set_column('B1:B20', 100) worksheet.write_column('A1', keys_list) worksheet.write_column('B1', values_list) workbook.close()if __name__ == '__main__': # 填写访问密钥AK、SK ak = "填写AK" sk = "填写SK" # Init Auth Info credentials = get_credential() # Create OcrClient client = get_client() image_base64 = image_to_base64(r"图片的路径,例如D:\local\test.png") # request id card service response = recognize_id_card_request().to_dict() # 数据保存在execl上 response_to_execl(r"excel路径,例如D:\local\test.xlsx", response)
  • 按需计费开通服务 进入文字识别官网主页,单击“立即使用”,进入文字识别控制台。 在“总览”页面,选择需要使用的服务,执行开通操作,默认的计费方式采用按需计费。 图1 服务开通 服务开通成功后,开通状态将显示为“已开通”。 如果您需要调用 对象存储服务 (OBS)中的数据,请在开通服务页面进行服务授权。 图2 OBS服务授权 OCR服务开通后,可在控制台进行关闭。开通服务时,计费规则默认为“按需计费”。只有调用成功才会计费,其中返回的2xx状态码表示调用成功,调用失败不计费,详细的计费价格及规则请参见计费说明。 如未开通服务,直接调用OCR API会提示ModelArts.4204报错。
  • 购买套餐包开通服务 进入文字识别官网主页,单击“立即使用”,进入文字识别控制台。 在“总览”页面,选择需要使用的服务,在操作列单击“购买套餐包”,此时的计费方式采用套餐包计费,套餐包额度用完后自动转为按需计费。 图3 购买套餐包 服务开通成功后,开通状态将显示为“已开通”。 如果您需要调用对象存储服务(OBS)中的数据,请在开通服务页面进行服务授权。 图4 OBS服务授权 购买套餐包后只有调用成功才会计算调用次数,其中返回的2xx状态码表示调用成功,调用失败不计算次数。套餐包扣减规则包括计费模式、变更配置、续费、欠费类等问题请参见计费说明。 如未开通服务,直接调用OCR API会提示ModelArts.4204报错。 4.服务开通后,您可以按照官方文档数据要求,调用API或SDK步骤继续完成实际服务需求。
  • 基本概念 参照字段为模板图片和待识别图片中的公共文字部分,所有需要识别的图片中都要包含参照字段,且位置必须固定。 套件提供了自动搜索参照字段和手动框选参照字段这两种模式。 自动搜索参照字段:未手动框选任何参照字段的情况下,默认激活自动搜索参照字段模式。 手动框选参照字段:若手动框选了任意参照字段,将激活手动框选模式。 当识别图片的场景比较单一时,即只有一种模板,且参照字段不容易与其他文字混淆时,可以使用自动参照字段来简化模板制作过程,否则建议手动框选,详细步骤请参见操作步骤。
  • 创建用户组 使用主账号登录IAM服务控制台。 左侧导航窗格中,选择“用户组”页签,单击右上方的“+创建用户组”。 在“创建用户组”界面,输入“用户组名称”,创建用户组。 返回用户组列表,单击列表中的“授权”。 勾选需要授予用户组的权限,单击“确定”,完成用户组授权。 选择权限的作用服务。此处选择“文字识别(OCR)”,并为该用户组设置所需的权限。 OCR FullAccess:所有权限,可以使IAM用户具备开通/关闭/使用服务能力。 OCR ReadOnlyAccess:只读访问权限,使IAM用户仅具备使用服务能力,开通/关闭服务需要主账户操作。 单击“下一步”,设置用户组的最小授权范围。单击“确定”,完成用户组授权。 所有资源:不设置最小授权范围,授权后,用户根据权限使用账号中所有资源。 指定区域项目资源:授权后,用户根据权限使用已选区域项目中的资源。 选择指定企业项目:IAM用户可以根据权限使用该企业项目中的资源。仅开通企业项目后可选。
  • 功能体验与试用 文字识别(Optical Character Recognition,OCR)是指对图像文件的打印字符进行检测识别,将图像中的文字转换成可编辑的文本格式。OCR通过API提供服务能力,用户需要通过编程来处理识别结果。 在开通OCR前,请先使用OCR体验馆体验服务功能。该方式无需编程,只需在网页端上传图片,即可体验识别效果。 开通OCR后,默认按API成功调用次数进行收费。API使用指导请参见使用流程简介。 使用OCR体验馆前,请先 注册华为账号 并开通华为云,并实名认证。 图1 OCR体验馆
  • IAM用户缺少某个特定权限现象 当创建的IAM用户缺少某个特定权限时,执行开通操作时,会报错误原因和缺少的权限。例如,下图报ocr:webImage:subscribe permission required错误(开通网络图片识别的权限)。 图2 IAM用户缺少网络图片识别权限 出现此类报错,IAM用户可联系主账户开通相应的服务。或者由主账户使用OCR自定义策略,帮助IAM用户开通权限后,IAM用户自行开通服务。
  • 工作流简介 功能介绍 支持构建文字识别模板,识别单个板式图片中的文字,提供高精度的文字识别模型,保证结构化信息提取精度。 适用场景 用户认证识别 识别证件中关键信息,节省人工录入,提升效率,降低用户实名认证成本,准确快速便捷。 快递单自动填写 识别图片中联系人信息并自动填写快递单,减少人工输入。 合同录入与审核 自动识别结构化信息与提取签名盖章区域,有助快速审核。 优势 解决手工录入投入大、效率低、语种多等问题,提升业务效率。 一键式部署,快速输出高精度结构化数据。
  • 操作步骤 在文字识别控制台左侧导航栏选择“自定义OCR”。 默认进入“我的应用”页签。 图1 文字识别控制台 在“我的应用”页签下,单击“创建应用”。 进入“创建应用”页面。 图2 创建应用 您也可以单击“我的工作流”,切换至“我的工作流”页签,选择工作流并单击卡片中的“创建应用”。 根据业务需求填写“应用名称”、“应用负责人”和“应用描述”,仅支持英文、中文、数字、下划线、中划线。选择“所属行业”及工作流。 图3 创建应用 确认信息后,单击“确认”。 成功创建应用。
  • APIs切换步骤 V1版本APIs清单请参见表1。仅支持V2版本的API不在此表中列举。 在进行版本替换时,请在您的业务代码中搜索“v1.0”相关的API。例如,搜索“v1.0/ocr”找到代码中API请求地址所在的代码行。将“v1.0/ocr”替换为“/v2/{project_id}/ocr”。其中,{project_id}为项目ID,可以登录我的凭证页面获取。项目ID需要依据实际的OCR部署区域进行填写,例如在图1中,OCR部署区域为“cn-north-4”,即{project_id}填充为cn-north-4区域对应的项目ID。 图1 代码示例 图2 获取项目ID 表1 APIs清单 名称 V1版本API V2版本API 通用表格识别 /v1.0/ocr/general-table /v2/{project_id}/ocr/general-table 通用文字识别 /v1.0/ocr/general-text /v2/{project_id}/ocr/general-text 网络图片识别 /v1.0/ocr/web-image /v2/{project_id}/ocr/web-image 智能分类识别 /v1.0/ocr/auto-classification /v2/{project_id}/ocr/auto-classification 手写文字识别 /v1.0/ocr/handwriting /v2/{project_id}/ocr/handwriting 身份证识别 /v1.0/ocr/id-card /v2/{project_id}/ocr/id-card 行驶证识别 /v1.0/ocr/vehicle-license /v2/{project_id}/ocr/vehicle-license 驾驶证识别 /v1.0/ocr/driver-license /v2/{project_id}/ocr/driver-license 护照识别 /v1.0/ocr/passport /v2/{project_id}/ocr/passport 银行卡识别 /v1.0/ocr/bankcard /v2/{project_id}/ocr/bankcard 营业执照识别 /v1.0/ocr/business-license /v2/{project_id}/ocr/business-license 车牌识别 /v1.0/ocr/license-plate /v2/{project_id}/ocr/license-plate 增值税发票识别 /v1.0/ocr/vat-invoice /v2/{project_id}/ocr/vat-invoice 出租车发票识别 /v1.0/ocr/taxi-invoice /v2/{project_id}/ocr/taxi-invoice 火车票识别 /v1.0/ocr/train-ticket /v2/{project_id}/ocr/train-ticket 定额发票识别 /v1.0/ocr/quota-invoice /v2/{project_id}/ocr/quota-invoice 车辆通行费发票识别 /v1.0/ocr/toll-invoice /v2/{project_id}/ocr/toll-invoice 飞机行程单识别 /v1.0/ocr/flight-itinerary /v2/{project_id}/ocr/flight-itinerary 道路运输证识别 /v1.0/ocr/transportation-license /v2/{project_id}/ocr/transportation-license 机动车销售发票识别 /v1.0/ocr/mvs-invoice /v2/{project_id}/ocr/mvs-invoice 名片识别 /v1.0/ocr/business-card /v2/{project_id}/ocr/business-card VIN码识别 /v1.0/ocr/vin /v2/{project_id}/ocr/vin 保险单识别 /v1.0/ocr/insurance-policy /v2/{project_id}/ocr/insurance-policy 电子面单识别 /v1.0/ocr/waybill-electronic /v2/{project_id}/ocr/waybill-electronic
  • 识别结果容易漏字或多识别出内容怎么办? 识别结果是根据识别区来进行提取的,识别区的位置和大小均会影响识别结果。 若结果漏字,可能是由于识别区太小导致的,需在相应模板的"框选识别区"页面,把漏字的识别区调大一些。 若多识别出文字,可能是识别区太大,将周边无关的文字也框进来了,需将识别区改小一点。 若上述办法均无法解决,请检查识别区的文字是否发生了偏移,或者识别图片是否跟模板属于相同版式。 父主题: 常见问题
  • 工作流简介 功能介绍 支持用户自定义多个文字识别模板,通过模型分类,自动识别图片所需使用的模板,从而支持从大量不同板式图像中提取结构化信息。 适用场景 用户认证识别 识别证件中关键信息,节省人工录入,提升效率,降低用户实名认证成本,准确快速便捷。 快递单自动填写 识别图片中联系人信息并自动填写快递单,减少人工输入。 合同录入与审核 自动提取合同结构化信息,有助快速审核。 优势 解决手工录入投入大、效率低、语种多等问题,提升业务效率。 一键式部署,快速输出高精度结构化数据。 解决单据复杂、单据板式多、语种多问题,支持自定义多个图像板式,快速适配新板式,快速接入业务。 支持从多个不同板式图像中提取结构化信息。
  • 新增模板配置 默认进入“新增模板配置”页签。 图4 新增模板配置 单击添加多个模板,针对每个模板,选择模板类型,并且上传图片。 “上传图片”:单击“上传图片”区域,或鼠标直接拖拽图片至“上传图片”区域,上传本地一张图片作为模板,用于业务场景的文字结构化识别。 “修改模板名称”:单击图片右侧的,在弹出的输入框中输入新的模板名称,单击“确认”。 “删除模板”:单击图片右侧“删除”,在弹出的确认删除对话框中单击“确认”。 “语种”:单击图片右侧“语种”下拉选择框,选择模板对应的语种。不选择的情况下,默认为中英文。 确认信息后,单击“下一步”,进入定义预处理步骤,对上传的模板图片进行自动旋转、裁剪等预处理。
  • 如何选取参照字段? 参照字段是在所有图片中,文字位置和内容均不发生变化的文字。 参照字段有两个作用: 在单模板应用中,用于矫正识别图片,从而找准识别字段; 在多模板应用中,参照字段的内容和位置将作为相应模板的分类特征。 在框选参照字段时,首先要确保所框选的文字位置和内容都固定不变,如果不满足此要求,可能会提取到错误的识别结果,或是返回AIS.0119(输入图片与模板匹配失败)、AIS.0120(输入图片分类失败)。 为了获得更好的识别效果: 尽可能多框选参照字段,建议不少于4个参照字段,并尽量分散在四周。 在多模板应用中,为了获得较好的分类效果,还应该框选各个模板中有独有的参照字段。 如果不确定哪些文字是参照字段,或是想快速评估模板效果的,可以跳过"框选参照字段"流程,当后台检测到模板没有配置任何参照字段时,会自动寻找合适的参照字段进行识别,此功能可以提高项目开发与验证的效率。 父主题: 常见问题
  • 识别字符出现错误如何优化? 不同的错误情形需要具体分析: 情形1:大部分文字识别正确,部分形近符号的识别错误。 解决办法:产品提供了预置字段类型可以对结果进行处理,同时也提供了自定义(正则)类型、字典类型,用于纠正识别结果中的错误,适用范围详见字段类型。此外,您也可以在调用程序中使用字符串替换、正则抽取等规则来修正识别结果。 情形2:单模板工作流识别出错,且大部分字段为空或错误。 解决办法:请检查参照字段是否框选正确,或尝试框选更多参照字段(框选办法参照框选参照字段),如果新增参照字段后仍有问题,请检查识别图片与模板图片是否为同一个版式,如果为新版式,请考虑创建新模板或使用多模板分类工作流。 情形3:多模板识别工作流出错,大部分字段为空或错误。 解决办法:先检查分类结果是否正确(返回结果中的template_id表示分类结果),若分类错误,则说明分类器中存在相似的模板导致分类出错,请在参照字段中添加模板特有的参照字段,从而提高分类的鉴别能力。若分类结果正确,但识别结果错误,请参照情形2的解决办法。 父主题: 常见问题
  • 基本概念 参照字段为模板图片和待识别图片中的公共文字部分,所有需要识别的图片中都要包含参照字段,且位置必须固定。 套件提供了自动搜索参照字段和手动框选参照字段这两种模式。 自动搜索参照字段:未手动框选任何参照字段的情况下,默认激活自动搜索参照字段模式。 手动框选参照字段:若手动框选了任意参照字段,将激活手动框选模式。 当识别图片的场景比较单一时,即只有一种模板,且参照字段不容易与其他文字混淆时,可以使用自动参照字段来简化模板制作过程,否则建议手动框选,详细步骤请参见操作步骤。
  • 数据要求 受技术与成本多种因素制约,文字识别服务存在一些约束限制。 以通用文字识别API为例,输入数据存在以下约束。其他API的的使用约束请参见约束与限制。 只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。 图像各边的像素大小在15px到8192px之间。 图像中识别区域有效占比超过80%,保证所有文字及其边缘包含在图像内。 支持图像任意角度的水平旋转。 目前不支持复杂背景(如户外自然场景、防伪水印等)和文字扭曲图像的文字识别。
  • 数据传入方式 使用OCR API或SDK时,数据主要通过以下两种方法传入。 image 传入图片的base64编码。 您可以通过在线转码工具,浏览器,使用Python中的base64.b64encode函数等方法,获取图片的base64编码。 url 传入图片的url路径。 使用公网http/https url,例如https://support.huaweicloud.com/api-ocr/zh-cn_image_0288038400.png 将图片上传至华为云对象存储服务(OBS)中,使用OBS提供的url。使用OBS数据需要进行授权。包括对服务授权、临时授权、匿名公开授权,详情参见配置OBS访问权限。
共100000条
提示

您即将访问非华为云网站,请注意账号财产安全