-
文字识别套件使用简介 - 企业级AI应用开发专业套件 ModelArts Pro
提升企业AI应用的开发效率,降低开发难度。文字识别套件基于丰富的文字识别算法和行业知识积累,帮助客户快速构建满足不同业务场景需求的文字识别服务,实现多种版式图像的文字信息结构化提取。 文字识别套件提供预置工作流供您选择,全流程可视化完成AI应用开发以及持续迭代。 选择预置工作流 单模板工作流
-
常用概念 - 企业级AI应用开发专业套件 ModelArts Pro
具体问题。 资源池 用于数据处理、模型训练、服务部署的资源池和资源类型,分为“公共资源池”和“专属资源池”。 “公共资源池”:提供公共的大规模计算集群,资源按作业隔离。 “专属资源池”:提供独享的计算资源,可用于数据处理、模型训练、服务部署。专属资源池不与其他用户共享,更加高效。
-
上传模板图片 - 企业级AI应用开发专业套件 ModelArts Pro
并提取这两种格式发票上的关键字段。 前提条件 已授权ModelArts服务和对象存储服务(OBS)。 已在文字识别套件控制台选择“多模板分类工作流”新建应用,详情请见新建应用。 提前准备模板图片以及训练分类器的数据集,其要求请见数据要求。 数据要求 保证图片质量:不能有损坏的图片
-
配置访问授权 - 企业级AI应用开发专业套件 ModelArts Pro
Pro需要访问ModelArts服务的云资源,如果没有授权,相关功能将不能正常使用。因此,没有进行访问授权的用户在使用ModelArts Pro之前,需要进行访问授权。ModelArts Pro当前仅支持使用委托授权。 使用委托授权后,即将依赖服务ModelArts的所有操作权限委托给ModelArts
-
行业套件介绍 - 企业级AI应用开发专业套件 ModelArts Pro
根据工作流指引,创建单模板服务,通过模板训练文字识别模型,实现单模板图像的文字信息结构化提取。 创建单模板 多模板分类工作流 根据工作流指引,创建多模板服务,通过多模板训练模板分类器和文字识别模型,实现多模板图像的文字信息结构化提取。 创建多模板 调用API和SDK 部署服务后,支持通过调用API和SDK调用当前模板服务。
-
选择数据 - 企业级AI应用开发专业套件 ModelArts Pro
在“数据标注”页面手动标注数据。 由于零售商品工作流标注数据时需要勾勒出商品形状,必须使用多边形标注框标注数据。 自动标注数据 单击“下一步”,创建SKU后,自动标注数据。 导入数据集 在“数据选择”页面,单击“导入数据集”。 弹出“导入数据集”对话框。 “导入数据集”对话框会
-
上传模板图片 - 企业级AI应用开发专业套件 ModelArts Pro
例如上传某一格式的发票图片作为模板,训练的文字识别模型就能识别并提取同格式发票上的关键字段。 前提条件 已授权ModelArts服务和对象存储服务(OBS)。 已在文字识别套件控制台选择“通用单模板工作流”新建应用,详情请见新建应用。 提前准备待识别的图片,图片要求请见图片要求。
-
定义预处理 - 企业级AI应用开发专业套件 ModelArts Pro
处理逻辑”快速处理图片,也可以按左上角操作指标调整图片。 图1 定义预处理 右侧“选择预处理逻辑”区域勾选对应操作,当前仅支持“自动旋转”操作,系统自动旋转文字方向不正确的图片,保持图片中的文字方向正确。 单击预处理区域左上方的操作图标,调整模板图片的大小、方向等。 :单击图标重
-
定义预处理 - 企业级AI应用开发专业套件 ModelArts Pro
板”下拉框中选择模板,对每个模板图片进行预处理。 图1 多模板定义预处理 在右侧“选择预处理逻辑”区域勾选对应操作,当前仅支持“自动旋转”操作,系统自动旋转文字方向不正确的图片,保持图片中的文字方向正确。 单击预处理区域左上方的操作图标,调整模板图片的大小、方向等。 :单击图标重
-
监控应用 - 企业级AI应用开发专业套件 ModelArts Pro
监控应用 开发并部署服务后,您可以监控应用,包括应用的基本信息、在线测试应用、查看应用历史版本、查看应用的调用指南。 前提条件 已开发并部署服务。 进入应用监控页面 登录ModelArts Pro管理控制台,单击“自然语言处理”套件卡片的“进入套件”。 进入自然语言处理套件控制台。
-
监控应用 - 企业级AI应用开发专业套件 ModelArts Pro
监控应用 在线部署的应用,您可以在开发并部署服务后监控应用,包括应用的基本信息、在线测试应用、查看应用历史版本、查看应用的调用指南。 前提条件 已开发并部署服务,详情请见部署服务。 进入应用监控页面 登录ModelArts Pro管理控制台,单击“视觉套件”卡片的“进入套件”。 进入视觉套件控制台。
-
训练模型 - 企业级AI应用开发专业套件 ModelArts Pro
数据。 训练模型 图1 模型训练 在“模型训练”页面,勾选模型训练所使用的“预训练模型”,并配置训练参数,开始训练模型。 预训练模型 当前服务提供预置预训练模型“高精版”、“均衡版”、“基础版”,在“预训练模型”列表中可查看“模型精度”、“推理速度”、“训练速度”和模型“简介”。
-
训练模型 - 企业级AI应用开发专业套件 ModelArts Pro
数据。 训练模型 图1 模型训练 在“模型训练”页面,勾选模型训练所使用的“预训练模型”,并配置训练参数,开始训练模型。 预训练模型 当前服务提供预置预训练模型“高精版”、“均衡版”、“基础版”,在“预训练模型”列表中可查看“模型精度”、“推理速度”、“训练速度”和模型“简介”。
-
查看应用详情 - 企业级AI应用开发专业套件 ModelArts Pro
单击“操作”列的“查看”,进入应用开发页面,您可以查看应用开发过程中各个步骤的配置信息,包括“数据选择”、“模型训练”、“模型评估”、“服务部署”。 图2 应用开发 您也可以在“应用总览”页签的“开发版本列表”右侧,单击“开发新版本”,进入新版本工作流的开发页面,详情请见更新应用版本。
-
怎么购买ModelArts Pro? - 企业级AI应用开发专业套件 ModelArts Pro
odelArts Pro各个套件。 由于ModelArts Pro服务依赖OBS服务和ModelArts服务,所以在使用ModelArts Pro过程中,涉及到OBS服务和ModelArts服务功能的使用,依赖服务会产生相应的费用,详情请见计费说明。 注册华为帐号并开通华为云 申请套件
-
如何上传数据至OBS? - 企业级AI应用开发专业套件 ModelArts Pro
使用ModelArts Pro进行应用开发时,您需要将数据上传至对象存储服务(OBS)桶中。您可以登录OBS管理控制台创建OBS桶,并在您创建的OBS桶中创建文件夹,然后再进行数据的上传,OBS上传数据的详细操作请参见《对象存储服务快速入门》。 您在创建OBS桶时,需保证您的OBS桶与ModelArts
-
更新应用版本 - 企业级AI应用开发专业套件 ModelArts Pro
认”,进入新版本的开发页面。 图1 开发新版本 在新版本的应用开发页面,您可以基于上一版本的工作流配置,更新工作流开发的各个步骤,重新部署服务。 模型如何提升效果 检查是否存在训练数据过少的情况,建议每个类别的图片量不少于100个,如果低于这个量级建议扩充。 检查不同标签的样本数
-
更新应用版本 - 企业级AI应用开发专业套件 ModelArts Pro
认”,进入新版本的开发页面。 图1 开发新版本 在新版本的应用开发页面,您可以基于上一版本的工作流配置,更新工作流开发的各个步骤,重新部署服务。 模型如何提升效果 检查是否存在训练数据过少的情况,建议每个标签的样本数不少于100个,如果低于这个量级建议扩充。 检查不同标签的样本数
-
训练模型 - 企业级AI应用开发专业套件 ModelArts Pro
快)”和“高精模型(精度高,但推理速度较慢)”。 “车辆场景”:可选“城市场景”和“工地场景”。 单击“训练”。 模型训练一般需要运行一段时间,等模型训练完成后,“开发应用>模型训练”页面下方显示查看训练详情。 查看训练详情 模型训练完成后,可在“模型训练”页面查看“训练详情”,包括“准确率变化情况”和“损失变化”。
-
训练模型 - 企业级AI应用开发专业套件 ModelArts Pro
“分批训练样本数”又叫批尺寸(Batch Size),指一次训练所抓取的数据样本数量,影响训练速度及模型优化效果。 确认信息后,单击“开始训练”。 模型训练一般需要运行一段时间,等模型训练完成后,“模型训练”页面下方显示训练详情。 查看训练详情 模型训练完成后,可在“模型训练”页面查看“训练详情”,包括“准确率变化情况”和“误差变化”。