检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
首先请检查数据集是否符合要求,各个套件的数据集要求如下: 文字识别套件 自然语言处理套件 视觉套件 HiLens套件 确认数据集符合要求后,将数据集上传至OBS桶。 上传数据至OBS 文字识别套件 文字识别套件当前提供了单模板工作流和多模板工作流,开发应用时需要上传模板图片,明确以哪张图片作为模板训练文字识别模型。
作,详情请见准备工作。 步骤1:准备数据 在本地准备好用于制作模板的图片、用于训练多模板分类器的训练集、用于评估模板的图片,图片要求如下: 只支持PNG、JPG、JPEG、BMP、TIFF格式的图片。 图像各边的像素大小在100px到4096px之间。 图像中识别区域有效占比超过
建文件夹。为保证数据能正常访问,请务必确保创建的OBS桶与ModelArts Pro服务在同一区域。 参考上传文件,使用单个文件上传方式将本地准备的训练数据“test.txt”文件上传至OBS路径“mapro-nlp/data-in”下。 步骤2:新建应用 登录ModelArts
等准备工作,详情请见准备工作。 步骤1:准备数据 在本地准备好两张身份证图片,一张用于制作模板,一张用于评估模板。图片要求如下: 只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。 图像各边的像素大小在100px到4096px之间。 图像中识别区域有效占比超过80%,保证所有文字及其边缘包含在图像内。
rts Pro服务在同一区域。 参考上传文件,使用单个文件上传方式将本地准备的训练数据集“Training-Dataset”文件上传至OBS路径“mapro-vision/training-data-in”,将本地准备的SKU数据集“SKU-Dataset”上传至OBS路径“ma
图1 应用基本信息 在线测试应用 在“应用监控”页面,您可以针对“运行中”的应用使用在线测试功能,在“上传测试图片”右侧单击“选择文件”,上传本地的测试图片,下侧会显示预测结果。 查看历史版本 在“应用监控”页面,您可以查看当前应用所部署的不同版本信息,包括“更新时间”、“更新状态”
在“应用开发>评估”页面,您可以选择本地上传测试图片,也可以上传在线图片。 图3 评估分类器 本地上传图片 默认进入“本地上传”页签,根据自身需要选择打开“分类模式”和“动态识别”开关,单击“上传图片”,或者拖拽测试图片至虚线框内上传图片区域,上传本地的图片作为测试图片。 “分类模式
建文件夹。为保证数据能正常访问,请务必保证创建的OBS桶与ModelArts Pro服务在同一区域。 参考上传文件,使用单个文件上传方式将本地准备的训练数据集“Training-Dataset”文件上传至OBS路径“mapro-hilens/training-data-in” 步骤2:新建可训练技能
式包括JPG、JPEG、PNG、BMP。 图片最大边不大于4096px,最小边不小于100px,且大小不超过4M。 训练分类器的数据集要求将图片放在一个目录里,并压缩成zip文件,文件大小不应大于10M。 进入应用开发页面 登录“ModelArts Pro>文字识别套件”控制台。
表2 批量上传SKU参数说明 参数 说明 SKU存储位置(OBS) SKU数据存储至OBS的桶和文件夹。 如果数据上传方式为“选择本地文件”,则自动将本地的SKU数据上传至OBS。 如果数据上传方式为选择OBS文件,即直接选择SKU数据存储在OBS的位置。 单击“SKU存储位置(O
“未标注数据集”。 数据集模板可在选择“数据集状态”后,单击下方的“文本分类已标注数据模板”或“文本分类未标注数据模板”,下载数据集模板至本地查看。 数据集输入位置 训练数据存储至OBS的位置。 单击“数据集输入位置”右侧输入框,在弹出的“数据集输入位置”对话框中,选择“OBS桶”和“文件夹”,然后单击“确定”。
“未标注数据集”。 数据集模板可在选择“数据集状态”后,单击下方的“文本分类已标注数据模板”或“文本分类未标注数据模板”,下载数据集模板至本地查看。 数据集输入位置 训练数据存储至OBS的位置。 单击“数据集输入位置”右侧输入框,在弹出的“数据集输入位置”对话框中,选择“OBS桶”和“文件夹”,然后单击“确定”。
字段”、“框选识别区”步骤,单击“下一步”,进入“评估”页面。 本地上传图片 图2 评估模板 在“应用开发>评估”页面,默认进入“本地上传”页签。 单击“上传图片”,或者拖拽测试图片至虚线框内上传图片区域,上传本地的图片作为测试图片。 测试图片上传成功后,右侧会显示识别结果。 您可以核对识别结果是否正确。
下信息: 图2 上传模板图片 “模板名称”:输入模板名称。 “上传图片”:单击“上传图片”区域,或鼠标直接拖拽图片至“上传图片”区域,上传本地一张图片作为模板,用于业务场景的文字结构化识别。 确认信息后,单击“下一步”,进入定义预处理步骤,对上传的模板图片进行自动旋转预处理。 父主题:
在数据集详情页面,单击“未标注”页签,然后单击左上角“添加文件”。 在弹出的“添加文件”对话框中,根据需上传文件的基本情况,完成设置后选择上传文件。 选择本地环境中需要上传的文件,可以一次性选择多个文件。文件格式只支持“txt”或“csv”,且一次上传文件的总大小不能超过8MB。“文本与标签分割符”与“多标签分割符”不能选同一个。
工作流会用测试数据评估模型,在“应用开发>评估模型”页面,查看评估结果。 模型评估 图1 模型评估 训练模型的版本、标签数量、测试集数量。单击“下载评估结果”,可保存评估结果至本地。 评估参数对比 图2 评估参数对比 左侧是各个标签数据的精确率、召回率、F1值。勾选标签,右侧会显示对应标签数据经过预置模型和增量模型评估后的参数对比柱状图。
模拟在线测试 在“模型评估”页面,您可以在线测试当前模型,即通过上传测试图片,查看当前模型的预测结果。 待服务构建完成,单击“上传图片”,上传本地一张测试图片,即可查看当前模型版本的预测结果。 图3 模拟在线测试 后续操作 针对当前版本的模型,经过模型评估后,如果根据业务需求,模型还
Pro 支持将开发好的服务或技能一键部署到端、边、云的各种场景上。 在线部署:将服务或技能部署为在线推理服务,可以实现高并发,低延时,弹性伸缩,并且支持多模型灰度发布、A/B测试。将应用部署为一个Web Service,并且提供在线的测试与监控能力。 HiLens部署:将服务或技能部署在边缘设备HiLens