检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
文字识别服务属于公有云服务,线上用户资源共享,如果需要多并发请求,请提前联系我们。 通用表格识别 只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。 图像各边的像素大小在15px到8192px之间。 图像中识别区域有效占比超过80%,保证整张表格及其边缘包含在图像内。 支持图像任意角度的水平旋转。
objects 被保人列表(第一个默认为主被保人)。 beneficiary_list Array of BeneficiaryItem objects 受益人列表。 insurance_list Array of InsuranceItem objects 保险项目信息列表。 表6 InsurancePolicyDetail
environment variables CLOUD_SDK_AK and CLOUD_SDK_SK in the local environment ak = os.getenv("CLOUD_SDK_AK") sk = os.getenv("CLOUD_SDK_SK")
code)。例如,200表示API调用成功,400表示调用失败,详细的状态码和响应参数说明如下。 状态码: 200 表4 响应Body参数 参数 参数类型 描述 result DriverLicenseResult object 识别结果。 调用失败时不返回此字段。 表5 DriverLicenseResult
自定义OCR介绍 OCR自定义模板将于2025.12.31正式下线,为避免影响您目前的业务,请您及时进行相关迁移工作,迁移指导详见OCR自定义模板下线公告。 自定义OCR基于丰富的文字识别算法和行业知识积累,帮助客户快速构建满足不同业务场景需求的文字识别服务,实现多种版式图像的文字信息结构化提取。
的数据安全风险。 适用计费项 按API调用次数计费,计费价格请参见价格计算器。 只有调用成功才会计算调用次数和计费,其中返回的2xx状态码表示调用成功,调用失败不计次数和计费。 计费周期 套餐包OCR资源的计费周期是根据您购买的时长来确定的(以UTC+8时间为准)。一个计费周期的
其他:成绩单、商超小票、支付凭证、账单等。 优势 简单智能 无需训练直接调用,自动输出结构化信息,简单高效。 多版式 不受版式数量影响,支持多版式卡证、票据,适用场景广泛。 多功能 键值对提取、表格识别与版面分析多功能支持,大幅降低了文档分析难度,识别精度95% 降本增效 降低版式定制成本,提升信息录入、票证信息审批等业务场景的效率。
不可预测的应用或服务。 适用计费项 按API调用次数计费,计费价格请参见价格计算器。 只有调用成功才会计算调用次数,其中返回的2xx状态码表示调用成功,调用失败不计费。 计费周期 按需计费OCR资源按成功调用次数计费,每一个小时整点结算一次费用(以UTC+8时间为准),结算完毕后进入新的计费周期。
印章位置,列表形式,包含印章区域四个顶点的二维坐标(x,y),坐标原点为图片左上角,x轴沿水平方向,y轴沿竖直方向。 words_block_list Array of SealWordsBlockList objects 印章文本块列表。 表7 SealWordsBlockList
荐使用OBS服务存储图片数据。 响应参数 状态码: 200 表4 响应Body参数 参数 参数类型 描述 result WaybillElectronicResult object 识别结果。 调用失败时无此字段。 表5 WaybillElectronicResult 参数 参数类型
传在线图片作为测试图片。 上传图片后,右侧会显示模板识别结果,包括“模板ID”、“模板名”、“置信度”。 上传图片后,您可以核对识别结果是否正确。 如果不正确,单击“上一步”,对当前模板进行修改。 如果识别结果正确,可对模板作进一步评估,详情请见评估模板。 评估模板 通过上传测试
code)。例如,200表示API调用成功,400表示调用失败,详细的状态码和响应参数说明如下。 状态码: 200 表4 响应Body参数 参数 参数类型 描述 result VINResult object 识别结果。 调用失败时不返回此字段。 表5 VINResult 参数
服务存储图片数据。 响应参数 状态码: 200 表4 响应Body参数 参数 参数类型 描述 result Array of ThailandLicensePlateItem objects 调用结果。 调用失败时不返回此字段。 表5 ThailandLicensePlateItem
因为该请求被设置为拒绝访问,建议直接修改该请求,不要重试该请求。 404 Not Found 所请求的资源不存在。 建议直接修改该请求,不要重试该请求。 405 Method Not Allowed 请求中带有该资源不支持的方法。 建议直接修改该请求,不要重试该请求。 406 Not
code)。例如,200表示API调用成功,400表示调用失败,详细的状态码和响应参数说明如下。 状态码: 200 表4 响应Body参数 参数 参数类型 描述 result IDCardResult object 识别结果。 调用失败时不返回此字段。 表5 IdCardResult
智能文档解析提供三个主要功能,分别是键值对提取、表格还原和版面分析。其中键值对提取是指提取和识别文档中存在关联的键值对信息,比如在合同文档中提取甲方-XX有限公司、金额-XX元、签署时间-20XX年X月等信息;表格还原指的是对文档中表格区域进行结构化识别并还原表格样式;版面分析指的是定位和识别文
result字段仅在API调用成功后返回。 words_block_count表示文字块识别结果,本示例中,识别出2个文字块,分别代表图片中的2行文字。 words_block_list表示文字块列表,按照图片文字从上到下、从左到右排列。 words为识别出来的文本内容,confidence表示该字段的置信度。
智能分类。 除此之外,您也可以使用ModelArts Pro服务提供的“文字识别套件”零代码搭建出专属的文字识别系统。 通用类 通用表格识别:提取表格内的文字和所在行列位置信息。 通用文字识别:提取图片内的文字及其对应位置信息。 手写文字识别:识别手写文字、印刷文字信息。 网络图
参见变更计费模式。 计费项 文字识别按API调用次数计费,计费价格请参见价格计算器。 只有调用成功才会计算调用次数,其中返回的2xx状态码表示调用成功,调用失败不计费。 如需了解实际场景下的计费样例以及各计费项在不同计费模式下的费用计算过程,请参见计费样例。 续费 套餐包文字识别
和消息体。 状态码是一组数字代码,状态码表示了请求响应的状态,如果调用后返回状态码为2xx,则表示调用成功。完整的状态码列表请参见状态码。 响应消息头 对应请求消息头,响应同样也有消息头,如“Content-type”。例如表1所示。 表1 响应消息头 名称 说明 Content-Length