搜索_华为云

如何选取参照字段？ - 文字识别 OCR

如何选取参照字段？参照字段是在所有图片中，文字位置和内容均不发生变化的文字。参照字段有两个作用：在单模板应用中，用于矫正识别图片，从而找准识别字段；在多模板应用中，参照字段的内容和位置将作为相应模板的分类特征。在框选参照字段时，首先要确保所框选的文字位置和内容都固定不变

 帮助中心 > 文字识别 OCR > 用户指南 > 自定义OCR > 常见问题
API是否可以混用 - 文字识别 OCR

API是否可以混用不建议混用，例如有专门的身份证识别，就不建议使用“通用文字识别”识别身份证图片，不同接口底层算法不同，混用会导致识别效果差。父主题： API使用类

 帮助中心 > 文字识别 OCR > 常见问题 > API使用类
难例图片上传 - 华为HiLens
难例图片上传 - 华为HiLens

数据集的url。 index 是 int 上传图片的序号。 model_name 是 string 上传图片对应的模型名称。 camera_name 是 string 上传图片对应的摄像头名称。 frame 是 mat 要上传的图片，必须为NV21格式。返回值返回Bool值，

帮助中心 > 华为HiLens > 开发指南 > 难例上传模块
定义预处理 - 企业级AI应用开发专业套件 ModelArts Pro

使用通用单模板工作流上传模板图片后，需要对模板图片进行预处理，通过旋转、裁剪、降噪等操作。图片预处理的目的是保留图片的关键内容，去掉冗余部分，保持图片内容清晰可见，保证模型识别的准确性。前提条件已在文字识别套件控制台选择“通用单模板工作流”新建应用，并上传模板图片，详情请见上传模板图片。定义预处理

 帮助中心 > 企业级AI应用开发专业套件 ModelArts Pro > 用户指南 > 文字识别套件 > 通用单模板工作流
图片嵌入暗水印 - 数据安全中心 DSC

图片嵌入暗水印功能介绍对图片嵌入文字暗水印或者图片暗水印，用户以formData的格式传入待加水印图片和水印相关信息，DSC服务对图片加完水印后返回给用户已嵌入水印的图片二进制流，目前支持的图片格式为：*.jpg, *.jpeg, *.jpe, *.png, *.bmp, *

帮助中心 > 数据安全中心 DSC > API参考 > API说明 > 图片水印
文字识别的监控指标 - 文字识别 OCR

文字识别的监控指标功能说明本节定义了文字识别服务上报云监控服务的监控指标的命名空间，监控指标列表和维度定义，用户可以通过云监控服务提供管理控制台或API接口来检索文字识别服务产生的监控指标和告警信息。命名空间 SYS.OCR 监控指标详情表1 OCR支持的监控指标指标ID

帮助中心 > 文字识别 OCR > 用户指南 > 监控
定义预处理 - 企业级AI应用开发专业套件 ModelArts Pro

使用多模板分类工作流上传模板图片后，需要对模板图片进行预处理，通过旋转、裁剪、降噪等操作。图片预处理的目的是保留图片的关键内容，去掉冗余部分，保持图片内容清晰可见，保证模型识别的准确性。前提条件已在文字识别套件控制台选择“多模板分类工作流”新建应用，并上传模板图片，详情请见上传模板图片。定义预处理

 帮助中心 > 企业级AI应用开发专业套件 ModelArts Pro > 用户指南 > 文字识别套件 > 多模板分类工作流
银行回单识别 - 文字识别 OCR
银行回单识别 - 文字识别 OCR

接口响应时间依赖于图片的下载时间，如果图片下载时间过长，会返回接口调用失败。请保证被检测图片所在的存储服务稳定可靠，推荐使用OBS服务存储图片数据。 url中不能存在中文字符，若存在，中文需要进行utf8编码。 page_num 否 Integer 指定PDF页码识别。传入该参数时，则识别指定页码的内容。如

 帮助中心 > 文字识别 OCR > API参考 > API
主体识别示例 - 图像识别 Image
主体识别示例 - 图像识别 Image

主体识别示例本章节对主体识别AK/SK方式使用SDK进行示例说明。主体识别示例代码只需将AK/SK信息替换为实际AK/SK，代码中可以使用ImageMainObjectDetectionReq中的withUrl或withImage方法配置图像信息（image和url参数二选一

 帮助中心 > 图像识别 Image > SDK参考 > 使用SDK（Java）
准备数据 - 企业级AI应用开发专业套件 ModelArts Pro

如果导入位置为OBS，用户需具备此OBS路径的读取权限。只支持JPG、JPEG、PNG、BMP格式的图片。针对已标注数据，刹车盘识别工作流仅支持一张图片识别单个标签，支持如下两种数据格式。相同标签的图片放在一个目录里，并且目录名字即为标签名。当存在多层目录时，则以最后一层目录为标签名。示

 帮助中心 > 企业级AI应用开发专业套件 ModelArts Pro > 用户指南 > 视觉套件 > 刹车盘识别工作流
裁剪图片 - 华为HiLens
裁剪图片 - 华为HiLens

1920], 2的倍数；高度范围[64, 1080], 2的倍数。如果输入不是NV21格式，请把输入的源图片转换为NV21格式，详情请参见转换图片颜色格式。 dst 目的图片。 x 裁剪区域左上角x坐标，范围[0, 1920], 2的倍数。 y 裁剪区域左上角y坐标，范围[0, 1080]

帮助中心 > 华为HiLens > SDK参考 > 预处理
图片处理 - 对象存储服务 OBS
图片处理 - 对象存储服务 OBS

图片文件进行图片剪切、图片缩放、图片水印、格式转换等处理。更多关于图片处理的内容，参见图片处理特性指南。以下代码展示了如何使用下载对象接口实现图片处理： // 引入依赖库 require 'vendor/autoload.php'; // 使用源码安装时引入SDK代码库 //

帮助中心 > 对象存储服务 OBS > PHP > 下载对象
什么情况下可以使用自定义模板？ - 文字识别 OCR

的文字信息。自定义模板支持识别单模板应用或是多模板应用，单模板仅支持一种版式，多模板支持识别多种版式。单模板的前提：识别图片需与模板图片版式相同，具体而言，图片中要存在文字内容和位置均固定不变的文字（参照字段）。识别文字内容不能偏离设定的识别区域，包括打印偏移、由上下文长度变化引起的偏移等。

帮助中心 > 文字识别 OCR > 用户指南 > 自定义OCR > 常见问题
识别结果 - 数据安全中心 DSC
识别结果 - 数据安全中心 DSC

识别结果敏感数据识别任务扫描完成后，可在结果明细界面查看识别结果详情，同时支持将生成的识别结果下载到本地查看，本章节介绍如何查看查看别结果以及下载识别结果。前提条件至少执行过一次敏感数据识别任务，新建敏感数据识别任务请参见新建敏感数据识别任务。查看识别结果登录管理控制台。

帮助中心 > 数据安全中心 DSC > 用户指南 > 敏感数据识别 > 敏感数据识别任务
智能文档解析 - 文字识别 OCR
智能文档解析 - 文字识别 OCR

对证件、票据、表单等多版式文档进行文字识别、版面分析、键值对提取以及表格识别等任务，并以json格式返回识别的结构化结果。约束与限制支持中英文及部分中文繁体字。只支持识别PNG、JPG、JPEG、BMP、GIF、TIFF、WEBP、PCX、ICO、PSD格式的图片以及PDF文档，PDF只支持单页识别，可通

 帮助中心 > 文字识别 OCR > API参考 > API
准备数据 - 文字识别 OCR
准备数据 - 文字识别 OCR

受技术与成本多种因素制约，文字识别服务存在一些约束限制。以通用文字识别API为例，输入数据存在以下约束。其他API的的使用约束请参见约束与限制。只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。图像各边的像素大小在15px到8192px之间。图像中识别区域有效占比超过8

帮助中心 > 文字识别 OCR > 用户指南
训练分类器 - 企业级AI应用开发专业套件 ModelArts Pro

训练分类器确定模板图片的参照字段和识别区后，多模板分类工作流在模板数量较多，或版式相似度较高的情况下，建议针对不同的模板上传对应的训练集数据，用于训练模板分类模型，使服务能够精准地分类多个模板图片，然后对多个模板图片进行文字识别和结构化提取。前提条件已在文字识别套件控制台选择“

帮助中心 > 企业级AI应用开发专业套件 ModelArts Pro > 用户指南 > 文字识别套件 > 多模板分类工作流
图片处理基本概念 - 对象存储服务 OBS

图片处理基本概念样式样式是将图片处理对图片设置的参数或界面操作设置保存成的一个集合。在对多张图片进行重复相同设置时，可以先创建一个图片样式，在不同的图片套用图片样式，就不需要进行重复的命令操作。每个桶最多支持创建100个样式。 Exif信息 Exif（Exchangeable

帮助中心 > 对象存储服务 OBS > 用户指南 > 数据处理 > 图片处理
开始使用 - AI
开始使用 - AI

联系专业工程师为您服务。图2 上传图片检查违规图片替换结果（合规图片不会替换）。图3 违规图片替换选择桶moderation-image-result-demo（实际桶名称以部署指定参数为准），查看原始图片和审核日志。图4 原始图片和审核日志父主题：实施步骤

 帮助中心 > AI > 内容审核-图片审核 > 实施步骤
API概览 - 文字识别 OCR
API概览 - 文字识别 OCR

提取、文字识别、以及表格识别等任务，实现进阶高效的自动化结构化返回。通用类通用表格识别识别表格图片上的文字内容，并返回识别的结构化结果。通用文字识别识别图片上的文字内容，并返回识别的文字和坐标。网络图片识别识别网络图片中的文字内容，并以JSON格式返回识别的结构化结果。支持横向、竖向、艺术字识别。

帮助中心 > 文字识别 OCR > API参考

总条数： 10000

上一页
1
...
6
7
8
...
500
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

如何选取参照字段？ - 文字识别 OCR

API是否可以混用 - 文字识别 OCR

难例图片上传 - 华为HiLens

定义预处理 - 企业级AI应用开发专业套件 ModelArts Pro

图片嵌入暗水印 - 数据安全中心 DSC

文字识别的监控指标 - 文字识别 OCR

定义预处理 - 企业级AI应用开发专业套件 ModelArts Pro

银行回单识别 - 文字识别 OCR

主体识别示例 - 图像识别 Image

准备数据 - 企业级AI应用开发专业套件 ModelArts Pro

裁剪图片 - 华为HiLens

图片处理 - 对象存储服务 OBS

什么情况下可以使用自定义模板？ - 文字识别 OCR

识别结果 - 数据安全中心 DSC

智能文档解析 - 文字识别 OCR

准备数据 - 文字识别 OCR

训练分类器 - 企业级AI应用开发专业套件 ModelArts Pro

图片处理基本概念 - 对象存储服务 OBS

开始使用 - AI

API概览 - 文字识别 OCR

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线