检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
文字识别套件 文字识别套件基于丰富的文字识别算法和行业知识积累,帮助客户快速构建满足不同业务场景需求的文字识别服务,实现多种版式图像的文字信息结构化提取。 文字识别套件当前提供了单模板工作流和多模板工作流,自主构建文字识别模板,识别模板图片中的文字,提供高精度的文字识别模型,保证结构化信息提取精度。
文字识别套件 行业套件介绍 新建应用 通用单模板工作流 多模板分类工作流 调用API和SDK 查看应用详情 删除应用
文字识别套件 文字识别套件使用简介 使用单模板工作流开发应用 使用多模板工作流开发应用
框选识别区 在文字识别过程中,需要确定图片中识别的文字位置,这就需要在图片模板中框选识别区。 识别区指图片中待识别的文字位置。所有需要识别的图片中都会包含此识别区的字段,且位置固定不变,因此模型可以通过识别区找到需要识别内容的位置。 前提条件 已在文字识别套件控制台选择“通用单模
框选识别区 在文字识别过程中,需要确定图片中识别的文字位置,这就需要在图片模板中框选识别区。 识别区指图片中待识别的文字位置。所有需要识别的图片中都会包含此识别区的字段,且位置固定不变,因此模型可以通过识别区找到需要识别内容的位置。 前提条件 已在文字识别套件控制台选择“多模板分
云状识别工作流 工作流介绍 准备数据 选择数据 训练模型 评估模型 部署服务 父主题: 视觉套件
文字识别套件使用简介 ModelArts Pro 是为企业级AI应用打造的专业开发套件。基于华为云的先进算法和快速训练能力,提供预置工作流和模型,提升企业AI应用的开发效率,降低开发难度。文字识别套件基于丰富的文字识别算法和行业知识积累,帮助客户快速构建满足不同业务场景需求的文字
训练分类器的数据集要求将图片放在一个目录里,并压缩成zip文件,文件大小不应大于10M。 自然语言处理套件 自然语言处理套件使用开发应用时,需要上传文本数据用于模型训练。 数据集要求如表2所示。 表2 自然语言处理套件数据集要求 工作流 数据集要求 通用文本分类工作流 文件格式要求为txt
评估应用 训练模板分类模型后,需要对模板分类器和模板图片进行评估和考察。您可以通过上传测试图片,在线评估模板分类情况和模板的文字识别情况,保证能在多个模板情况下正确分类测试图片的模板,并且能正确识别测试图片中的识别区文字。 前提条件 已在文字识别套件控制台选择“多模板分类工作流”
、“fruit_cake”、“cheese_cake”等分别作为一个蛋糕的种类。零售商品识别工作流可以识别出单张图片中的多个商品。 数据集要求 文件名规范,不能有中文,不能有+、空格、制表符。 保证图片质量:不能有损坏的图片;目前支持的格式包括JPG、JPEG、PNG、BMP。
Pro使用预置工作流开发应用之前,需要新建应用,填写应用基本信息、选择工作流。 前提条件 使用ModelArts Pro服务请根据如何使用ModelArts Pro罗列的要求,提前完成准备工作。 保证华为云帐号不欠费。在ModelArts Pro控制台开发应用时,会占用OBS资源,需要收取一定费用,收费规则请参见对象存储服务OBS。
首先需要考虑好热轧钢板表面缺陷的类型标签,即能识别出热轧钢板表面的缺陷类型。例如以“scratch”、“scar”、“pit”等作为热轧钢板表面缺陷的类型。 数据集要求 文件名规范,不能有中文,不能有+、空格、制表符。 保证图片质量:不能有损坏的图片;目前支持的格式包括JPG、JPEG、PNG、BMP。
练的数据,上传至OBS服务中。 设计车牌标签 首先需要考虑好车牌的标签类型,即希望识别出图片中车牌的一种结果。例如“plate”。 数据集要求 文件名规范,不能有中文,不能有+、空格、制表符。 保证图片质量:不能有损坏的图片;目前支持的格式包括JPG、JPEG、PNG、BMP。
果。例如可以以“cumulus”(积云)、“stratus”(层云)、“cumulonimbus”(积雨云)等分别作为云状的种类。 数据集要求 文件名规范,不能有中文,不能有+、空格、制表符。 保证图片质量,不能有损坏的图片。目前支持的格式包括JPG、JPEG、PNG、BMP。
准备数据 在使用安全帽检测技能模板开发技能之前,您需要提前准备用于模型训练的数据,上传至OBS服务中。 数据集要求 文件名规范,不能有中文,不能有+、空格、制表符。 保证图片质量:不能有损坏的图片;目前支持的格式包括jpg、jpeg、bmp、png。 为了保证模型的预测准确度,训练样本跟真实使用场景尽量相似。
首先需要考虑好刹车盘的标签类型,即希望识别出图片中刹车盘的一种结果。例如可以以“ventilation”(通风)、“physical”(实体)等分别作为刹车盘的类别。 数据集要求 文件名规范,不能有中文,不能有+、空格、制表符。 保证图片质量:不能有损坏的图片;目前支持的格式包括JPG、JPEG、PNG、BMP。
提前准备模板图片以及训练分类器的数据集,其要求请见数据要求。 数据要求 保证图片质量:不能有损坏的图片;目前支持的格式包括JPG、JPEG、PNG、BMP。 图片最大边不大于4096px,最小边不小于100px,且大小不超过4M。 训练分类器的数据集要求将图片放在一个目录里,并压缩成zip文件,文件大小不应大于10M。
已授权ModelArts服务和对象存储服务(OBS)。 已在文字识别套件控制台选择“通用单模板工作流”新建应用,详情请见新建应用。 提前准备待识别的图片,图片要求请见图片要求。 图片要求 保证图片质量:不能有损坏的图片;目前支持的格式包括JPG、JPEG、PNG、BMP。 图片最大边不大于4096px,最小边不小于100px,且大小不超过4M。
工作。 步骤1:准备数据 在本地准备好两张身份证图片,一张用于制作模板,一张用于评估模板。图片要求如下: 只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。 图像各边的像素大小在100px到4096px之间。 图像中识别区域有效占比超过80%,保证所有文字及其边缘包含在图像内。
步骤1:准备数据 在本地准备好用于制作模板的图片、用于训练多模板分类器的训练集、用于评估模板的图片,图片要求如下: 只支持PNG、JPG、JPEG、BMP、TIFF格式的图片。 图像各边的像素大小在100px到4096px之间。 图像中识别区域有效占比超过80%,保证所有文字及其边缘包含在图像内。