文字识别 OCR-解读识别结果

时间:2025-02-12 15:02:41

解读识别结果

本章节通过网络图片识别API介绍如何解读调API返回的JSON格式识别结果。请参照API参考“响应参数”章节比对查看。

以下图识别结果为例,讲解图片内容如何与API的返回字段对应。

调用网络图片API成功后,在“JSON返回结果”中,可见result字段,该字段包含了图片中的文字块数目、文字块排列顺序、具体文本内容、所在位置、置信度等信息。

  • result字段仅在API调用成功后返回。
  • words_block_count表示文字块识别结果,本示例中,识别出2个文字块,分别代表图片中的2行文字。
  • words_block_list表示文字块列表,按照图片文字从上到下、从左到右排列。
  • words为识别出来的文本内容,confidence表示该字段的置信度。
  • location表示文字块的区域位置信息,采用图像坐标系,第一个文字块左上角顶点为[140,45]。
  • extracted_data表示图片中包含的联系人信息,仅在设置了入参extract_type,且图片中有联系人信息时支持提取。
    {    "result": {        "words_block_count": 2,        "words_block_list": [            {                "words": "真材实料/舒柔养足",                "confidence": 0.9491,                "location": [                    [                        140,                        45                    ],                    [                        380,                        45                    ],                    [                        380,                        75                    ],                    [                        140,                        75                    ]                ]            },            {                "words": "选自优质头层牛皮,皮质柔软富弹性,耐折抗拉伸,穿着不变形",                "confidence": 0.9897,                "location": [                    [                        58,                        84                    ],                    [                        462,                        84                    ],                    [                        462,                        102                    ],                    [                        58,                        102                    ]                ]            }        ],        "extracted_data": {}    }}
support.huaweicloud.com/usermanual-ocr/ocr_08_0009.html