检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
图3 零售场景 物流场景 物流场景需要处理各种格式的票据图片,用户可以通过简单的标注生成自己的专属模板,实现关键字段的自动识别和提取。 特点:对各种格式的票据图片,可制作模板实现关键字段的自动识别和提取。 优势:支持不同格式票据图片的自动识别和结构化提取。通过可视化界面操作,轻松指
Management,简称IAM)实现认证功能。IAM的更多信息请参见《统一身份认证服务用户指南》。 与对象存储服务的关系 ModelArts Pro使用对象存储服务(Object Storage Service,简称OBS)存储使用工作流过程中训练的数据,实现安全、高可靠和低成本的存储需求。OBS的更多信息请参见《对象存储服务控制台指南》。
选择数据 创建SKU(可选) 在商品识别场景下,如果上传的数据包含未标注数据,您需要创建SKU,即商品各类单品的图片,方便后续针对数据集中的数据进行自动标注。 如果数据集是已标注数据,您可以选择不创建SKU,直接执行下一步。 创建SKU 标注数据 针对已经选择的数据和SKU,在应用
自然语言处理套件提供了通用文本分类工作流,您可以通过预置的工作流,自主上传训练数据,训练高精度的文本预测分类模型,适配不同行业场景的业务数据,快速获得定制服务。 图1 使用预置工作流开发应用 表1 使用预置工作流开发应用流程 流程 说明 详细指导 选择自然语言处理套件 根据您的实际使用需求选择自然语言处理套
能,支持自主上传图片数据,构建高精度安全帽检测模型,快速开发安全帽检测技能,实现园区自动检测工人未戴安全帽的行为。 功能介绍 面向智慧园区的安全帽检测技能,支持自主上传图片数据,构建高精度安全帽检测模型,快速开发安全帽检测技能,实现园区自动检测工人未戴安全帽的行为。 适用场景 智慧园区。
在ModelArts Pro服务中使用视觉套件的零售商品识别工作流时,如果上传的数据含有未标注数据,就需要创建SKU,方便后续对数据进行自动标注。
与OBS关系 上传训练数据集 ModelArts Pro上传的训练数据集存储在OBS中。 标注数据 ModelArts Pro标注的数据存储在OBS中。 管理数据集 数据集存储在OBS中。 数据集的标注信息存储在OBS中。 支持从OBS中导入数据。 训练模型 训练模型使用的数据集存储在OBS中。
与OBS关系 上传训练数据集 ModelArts Pro上传的训练数据集存储在OBS中。 标注数据 ModelArts Pro标注的数据存储在OBS中。 管理数据集 数据集存储在OBS中。 数据集的标注信息存储在OBS中。 支持从OBS中导入数据。 训练模型 训练模型使用的数据集存储在OBS中。
别套件等,能够快速响应不同行业、不同场景的AI落地需求。 应用开发 应用开发面向企业和行业用户开放,提供特定行业场景的预置行业工作流,用户基于自身行业、场景的需求,进行快速自定制的需求,快速进行应用开发。当前ModelArts Pro开放的预置套件有文字识别套件、自然语言处理套件
配额说明 本服务在使用数据集、在线服务、训练任务资源时涉及配额限制。 其配额查看及修改请参见关于配额。
型,使服务能够精准地分类多个模板图片,然后对多个模板图片进行文字识别和结构化提取。 训练分类器 评估应用 通过上传测试图片,在线评估模板分类情况和模板的文字识别情况,保证能在多个模板情况下正确分类测试图片的模板,并且能正确识别测试图片中的识别区文字。 评估应用 部署服务 模板图片
评估应用 确定模板图片的参照字段和识别区后,需要对模板图片进行评估和考察。您可以通过上传测试图片,在线评估模板的识别情况,保证能正确识别同样模板下其他图片中的识别区文字。 前提条件 已在文字识别套件控制台选择“通用单模板工作流”新建应用,并完成框选识别区步骤,详情请见框选识别区。
操作步骤 在ModelArts Pro控制台界面,单击“HiLens套件”卡片的“进入套件”。 默认进入“全部模板”页面。 单击“可训练模板(Beta)”,切换至“可训练模板”页签。 选择技能,单击技能模板卡片的“新建技能”。 首次使用可训练模板,弹出“访问授权”对话框,需要授权ModelArts。
片区域,上传本地的图片作为测试图片。 “分类模式”:打开“分类模式”开关时,单独对分类器的准确度进行评估。上传图片后,右侧会显示模板自动分类的结果,包括“模板ID”、“模板名”、“置信度”。关闭“分类模式”开关时,默认评估状态为端到端地对待识别图片自动分类并进行结构化识别。 上传在线图片
提前准备模板图片以及训练分类器的数据集,其要求请见数据要求。 数据要求 保证图片质量:不能有损坏的图片;目前支持的格式包括JPG、JPEG、PNG、BMP。 图片最大边不大于4096px,最小边不小于100px,且大小不超过4M。 训练分类器的数据集要求将图片放在一个目录里,并压
的取值,作为识别结果。 自定义正则提取 预过滤 对初始的待识别文字进行预处理。 左边输入框填写待识别文字中被替换字符的正则表达式。 右边输入框填写所替换的新字符。 不填写时,默认不做预处理。 如果需要多次预处理,可单击,填写新增的预处理规则。 例如: “字段类型名称”:“出生日期”
的取值,作为识别结果。 自定义正则提取 预过滤 对初始的待识别文字进行预处理。 左边输入框填写待识别文字中被替换字符的正则表达式。 右边输入框填写所替换的新字符。 不填写时,默认不做预处理。 如果需要多次预处理,可单击,填写新增的预处理规则。 例如: “字段类型名称”:“出生日期”
的取值,作为识别结果。 自定义正则提取 预过滤 对初始的待识别文字进行预处理。 左边输入框填写待识别文字中被替换字符的正则表达式。 右边输入框填写所替换的新字符。 不填写时,默认不做预处理。 如果需要多次预处理,可单击,填写新增的预处理规则。 例如: “字段类型名称”:“出生日期”
统自动旋转文字方向不正确的图片,保持图片中的文字方向正确。 单击预处理区域左上方的操作图标,调整模板图片的大小、方向等。 :单击图标重置图片为初始状态,即未进行任何处理的状态。 :单击图标,在“图片裁剪”窗口调整图片裁剪范围,然后单击“裁剪”,调整图片的大小。 :单击图标,在“图
在左侧导航栏选择“应用开发>工作台”。 默认进入“我的应用”页签。 在“我的应用”页签下,选择已创建的应用,单击操作列的“查看”。 进入应用详情页,默认进入“应用资产”页面,查看应用资产。 您也可以单击“应用开发”,切换至“应用开发”页面,查看应用开发配置。 图1 进入应用详情 查看应用资产