-
计费说明 - 企业级AI应用开发专业套件 ModelArts Pro
与OBS关系 上传训练数据集 ModelArts Pro上传的训练数据集存储在OBS中。 标注数据 ModelArts Pro标注的数据存储在OBS中。 管理数据集 数据集存储在OBS中。 数据集的标注信息存储在OBS中。 支持从OBS中导入数据。 训练模型 训练模型使用的数据集存储在OBS中。
-
视觉套件(使用零售商品识别工作流开发应用) - 企业级AI应用开发专业套件 ModelArts Pro
步骤1:准备数据 在开发应用之前,您需要设计好商品标签,并自行准备数据集并上传至OBS桶及文件夹中。 由于数据安全原因,本样例不提供具体的样例数据,仅提供适用本次样例的数据要求。本次样例需要准备两份数据,一份训练数据集用于训练模型,一份SKU数据用于创建SKU,即商品各类单品的图片,方
-
工作流介绍 - 企业级AI应用开发专业套件 ModelArts Pro
详细指导 准备数据 在使用多语种文本分类工作流开发应用之前,您需要提前准备用于模型训练的数据,上传至OBS中。 准备数据 选择数据 在使用多语种工作流开发应用时,您需要新建或导入训练数据集,后续训练模型操作是基于您选择的训练数据集。 选择数据 训练模型 选择训练数据后,基于已标注的训练数
-
评估应用 - 企业级AI应用开发专业套件 ModelArts Pro
上传图片后,右侧会显示文字识别结果,包括“识别区”和对应的“识别结果”。 上传图片后,您可以核对识别结果是否正确。 如果不正确,单击“上一步”,对当前模板进行修改。 如果识别结果正确,可单击“下一步”,部署模板。 后续操作 评估分类器和模板之后,如果识别结果正确,可单击“下一步”,部署服务。 父主题: 多模板分类工作流
-
评估应用 - 企业级AI应用开发专业套件 ModelArts Pro
如果不正确,可单击“创建新模板”,重新创建一个模板,或者单击“上一步”,对当前模板进行修改。 如果识别结果正确,可单击“下一步”,部署模板。 上传在线图片 在“应用开发>评估”页面,单击“在线URL”,切换至“在线URL”页签。 图3 上传在线图片 在“开始识别”左侧输出框中输入待测试的图片URL地址,或者拖拽测试图片至虚线框内上传图片区域。
-
工作流介绍 - 企业级AI应用开发专业套件 ModelArts Pro
型,使服务能够精准地分类多个模板图片,然后对多个模板图片进行文字识别和结构化提取。 训练分类器 评估应用 通过上传测试图片,在线评估模板分类情况和模板的文字识别情况,保证能在多个模板情况下正确分类测试图片的模板,并且能正确识别测试图片中的识别区文字。 评估应用 部署服务 模板图片
-
定义预处理 - 企业级AI应用开发专业套件 ModelArts Pro
统自动旋转文字方向不正确的图片,保持图片中的文字方向正确。 单击预处理区域左上方的操作图标,调整模板图片的大小、方向等。 :单击图标重置图片为初始状态,即未进行任何处理的状态。 :单击图标,在“图片裁剪”窗口调整图片裁剪范围,然后单击“裁剪”,调整图片的大小。 :单击图标,在“图
-
上传模板图片 - 企业级AI应用开发专业套件 ModelArts Pro
提前准备模板图片以及训练分类器的数据集,其要求请见数据要求。 数据要求 保证图片质量:不能有损坏的图片;目前支持的格式包括JPG、JPEG、PNG、BMP。 图片最大边不大于4096px,最小边不小于100px,且大小不超过4M。 训练分类器的数据集要求将图片放在一个目录里,并压缩成zip文件,文件大小不应大于10M。
-
框选识别区 - 企业级AI应用开发专业套件 ModelArts Pro
的取值,作为识别结果。 自定义正则提取 预过滤 对初始的待识别文字进行预处理。 左边输入框填写待识别文字中被替换字符的正则表达式。 右边输入框填写所替换的新字符。 不填写时,默认不做预处理。 如果需要多次预处理,可单击,填写新增的预处理规则。 例如: “字段类型名称”:“出生日期”
-
训练模型 - 企业级AI应用开发专业套件 ModelArts Pro
模型如何提升效果 检查是否存在训练数据过少的情况,建议每个标签的样本数不少于100个,如果低于这个量级建议扩充。 检查不同标签的样本数是否均衡,建议不同标签的样本数量级相同,并尽量接近,如果有的类别数据量很高,有的类别数据量较低,会影响模型整体的识别效果。 选择适当的学习率和训练轮次。 通过
-
训练模型 - 企业级AI应用开发专业套件 ModelArts Pro
“学习率”用来控制模型的学习速度,范围为(0,1]。 “训练轮次”指模型训练中遍历数据集的次数。 “分批训练样本数”又叫批尺寸(Batch Size),指一次训练所抓取的数据样本数量,影响训练速度及模型优化效果。 确认信息后,单击“开始训练”。 模型训练一般需要运行一段时间,等模型训练
-
自定义字段类型 - 企业级AI应用开发专业套件 ModelArts Pro
如果需要多个提取规则,单击新增提取规则。提取时按从上到下优先级规则提取,选择第一个非空的提取内容作为提取后的内容。 后处理 根据实际情况,对经过“提取”后的文字进行“后处理”。 您也可以在“应用开发>框选识别区”过程中创建新的字段类型,详情请见创建新字段类型。 父主题: 多模板分类工作流
-
自定义字段类型 - 企业级AI应用开发专业套件 ModelArts Pro
如果需要多个提取规则,单击新增提取规则。提取时按从上到下优先级规则提取,选择第一个非空的提取内容作为提取后的内容。 后处理 根据实际情况,对经过“提取”后的文字进行“后处理”。 您也可以在“应用开发>框选识别区”过程中创建新的字段类型,详情请见创建新字段类型。 父主题: 通用单模板工作流
-
训练模型 - 企业级AI应用开发专业套件 ModelArts Pro
模型如何提升效果 检查是否存在训练数据过少的情况,建议每个标签的样本数不少于100个,如果低于这个量级建议扩充。 检查不同标签的样本数是否均衡,建议不同标签的样本数量级相同,并尽量接近,如果有的类别数据量很高,有的类别数据量较低,会影响模型整体的识别效果。 选择适当的学习率和训练轮次。 通过
-
框选参照字段 - 企业级AI应用开发专业套件 ModelArts Pro
框选参照字段个数须建议大于4个,越多越好,并尽量分散在图片的四周。 参考字段尽量沿着文字边缘框选,精确框住对应文本行为佳。 核对右侧“框选参照字段”中的参照字段是否与框选的参照字段一致。 框选并核对完所有模板图片的参照字段后,单击“下一步”,进入框选识别区步骤。 父主题: 多模板分类工作流
-
行业套件介绍 - 企业级AI应用开发专业套件 ModelArts Pro
练数据,快速训练高精度算法模型,并且一键部署至设备。 当前HiLens套件提供HiLens安全帽检测技能,支持自主上传图片数据,构建高精度安全帽检测模型,快速开发安全帽检测技能,实现园区自动检测工人未戴安全帽的行为。 功能介绍 面向智慧园区的安全帽检测技能,支持自主上传图片数据,
-
查看应用详情 - 企业级AI应用开发专业套件 ModelArts Pro
在“应用资产”页面下,可以查看当前应用的资产信息。 使用预置工作流开发应用,“应用资产”可查看“模板列表”和“自定义字段类型”。 图2 应用资产 在“应用资产>模板列表”页面下可以查看已创建的模板列表,操作列可执行如下操作: “评估”:单击“评估”,进入“应用开发>评估”页面,对当前模板进行评估,详情请见评估应用。
-
框选识别区 - 企业级AI应用开发专业套件 ModelArts Pro
的取值,作为识别结果。 自定义正则提取 预过滤 对初始的待识别文字进行预处理。 左边输入框填写待识别文字中被替换字符的正则表达式。 右边输入框填写所替换的新字符。 不填写时,默认不做预处理。 如果需要多次预处理,可单击,填写新增的预处理规则。 例如: “字段类型名称”:“出生日期”
-
工作流介绍 - 企业级AI应用开发专业套件 ModelArts Pro
定义预处理 上传模板图片后,需要对模板图片进行预处理,保留图片的关键内容,去掉冗余部分,保持图片内容清晰可见,保证模型识别的准确性。 定义预处理 框选参照字段 在图片模板中框选参照字段,用于矫正图片的方向,进而在正确的方向上,识别图片中的结构化信息。 框选参照字段 框选识别区 在
-
使用流程 - 企业级AI应用开发专业套件 ModelArts Pro
Pro是为企业级AI应用打造的专业开发套件。基于华为云的先进算法和快速训练能力,提供预置工作流和模型,提升企业AI应用的开发效率,降低开发难度。当前ModelArts Pro开放了文字识别套件、自然语言处理套件、视觉套件、HiLens套件,详细介绍请见产品介绍。用户基于自身行业、场景的需求,快速自