检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
片自动分类并进行结构化识别。 上传在线图片 单击“在线URL”,切换至“在线URL”页签。在“开始识别”左侧输出框中输入待测试的图片URL地址,或者拖拽测试图片至虚线框内上传图片区域,上传在线图片作为测试图片。 上传图片后,右侧会显示模板识别结果,包括“模板ID”、“模板名”、“置信度”。
用于训练多模板分类器的训练集,需要把各个模板的训练图片打包成一个文件夹并压缩成“zip”包,“zip”包文件大小不超过10M。 例如训练“保险单”模板的训练集,需要把同模板的保险单图片打包成一个文件夹并压缩成“zip”包。 步骤2:新建应用 登录ModelArts Pro控制台,单击“文字识别”套件卡片的“进入套件”。
BMP。 图片最大边不大于4096px,最小边不小于100px,且大小不超过4M。 训练分类器的数据集要求将图片放在一个目录里,并压缩成zip文件,文件大小不应大于10M。 进入应用开发页面 登录“ModelArts Pro>文字识别套件”控制台。 默认进入“应用开发>工作台”页面。
“字段类型”指待识别文字的内容,您可以在默认字段类型中选择,当前可选择的默认字段类型包括“姓名”、“数字”、“常规”、“电话号码”、“地址”、“金额”、“长数字”、“长字段”,每个识别区可选择多个字段类型。 如果“默认字段类型”不能满足您的业务需求,您可以在字段类型下拉框单击“创建新字段类型”,创建新字段类型。
在“应用开发>评估”页面,单击“在线URL”,切换至“在线URL”页签。 图3 上传在线图片 在“开始识别”左侧输出框中输入待测试的图片URL地址,或者拖拽测试图片至虚线框内上传图片区域。 单击“开始识别”,右侧会显示识别结果。 如果不正确,可单击“创建新模板”,重新创建一个模板,或者单击“上一步”,对当前模板进行修改。
“字段类型”指待识别文字的内容,您可以在默认字段类型中选择,当前可选择的默认字段类型包括“姓名”、“数字”、“常规”、“电话号码”、“地址”、“金额”、“长数字”、“长字段”,每个识别区可选择多个字段类型。 如果“默认字段类型”不能满足您的业务需求,您可以在字段类型下拉框单击“创建新字段类型”,创建新字段类型。
园区场景下,实现车牌识别、安全帽检测等功能。 智慧家庭 家庭检测、家居智能化场景下,实现手势识别、哭声检测等功能。 智慧商超 商店和超市场景下,实现VIP识别、客流量统计等功能。 用户群体 ModelArts Pro用户群体主要是各大政企,一般具有如下特点。 了解行业解决方案,懂得行业知识。
”,以及合并标签后新的“标签名”。 图3 合并标签 查看标签解析 新建并选择训练数据集后,针对已标注的数据,您可以在“标签解析”中查看标签样本的统计数据,横轴为“标签”,纵轴为标签对应的有效“样本数”。 图4 标签解析 后续操作 在“数据选择”页面选择训练数据集,并针对未标注的数
右上角的“开始标注”,在“数据标注”页面手动标注数据。 查看标签解析 新建并选择训练数据集后,针对已标注的数据,在“标签解析”中查看标签样本的统计数据,横轴为“标签”,纵轴为标签对应的有效“样本数”。 图5 标签解析 后续操作 选择训练数据集后,单击右下角的“下一步”,进入应用开
自动标注数据 单击“下一步”,创建SKU后,自动标注数据。 查看标签解析 新建并选择训练数据集后,针对已标注的数据,在“标签解析”中查看标签样本的统计数据,横轴为“标签”,纵轴为标签对应的有效“样本数”。 图5 标签解析 后续操作 在“数据选择”页面选择训练数据集,针对未标注的数据进
训练分类器 确定模板图片的参照字段和识别区后,多模板分类工作流在模板数量较多,或版式相似度较高的情况下,建议针对不同的模板上传对应的训练集数据,用于训练模板分类模型,使服务能够精准地分类多个模板图片,然后对多个模板图片进行文字识别和结构化提取。 前提条件 已在文字识别套件控制台选
工作流介绍 工作流简介 功能介绍 支持用户自定义多个文字识别模板,通过模型训练,自动识别图片所需使用的模板,从而支持从大量不同板式图像中提取结构化信息。 适用场景 用户认证识别 识别证件中关键信息,节省人工录入,提升效率,降低用户实名认证成本,准确快速便捷。 快递单自动填写 识别
编辑应用 对于已经创建的模板应用,您可以修改模板的配置信息以匹配业务变化。 前提条件 已存在创建的模板应用。 编辑模板配置信息 登录“ModelArts Pro>文字识别套件”控制台。 默认进入“应用开发>工作台”页面。 在“我的应用”页签下,选择应用并单击“操作”列的“查看”。
多模板分类工作流 工作流介绍 上传模板图片 定义预处理 框选参照字段 框选识别区 训练分类器 评估应用 部署服务 编辑应用 自定义字段类型 删除应用 父主题: 文字识别套件
BMP。 图片最大边不大于4096px,最小边不小于100px,且大小不超过4M。 训练分类器的数据集要求将图片放在一个目录里,并压缩成zip文件,文件大小不应大于10M。 自然语言处理套件 自然语言处理套件使用开发应用时,需要上传文本数据用于模型训练。 数据集要求如表2所示。 表2
行业套件介绍 文字识别套件基于丰富的文字识别算法和行业知识积累,帮助客户快速构建满足不同业务场景需求的文字识别服务,实现多种版式图像的文字信息结构化提取。 文字识别套件的介绍请参见产品介绍。 预置工作流 文字识别套件当前提供了单模板工作流和多模板工作流,自主构建文字识别模板,识别
HiLens套件(使用HiLens安全帽检测技能开发可训练技能) ModelArts Pro的HiLens套件提供了安全帽检测技能,通过工作流指引支持自主上传数据集,零代码构建安全帽检测技能,并一键下发到端侧设备HiLens Kit;针对难例数据,可快速迭代更新技能,提升精度。
30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 <?xml version="1.0" encoding="UTF-8" standalone="no"?> <annotation>
选择步骤1:准备数据中提前创建好的输出数据集的OBS路径“mapro-vison/data-out”。 勾选已上传的数据集。 由于本样例上传的数据为未标注数据,因此标签解析出数据集共有0个标签,0条有效样本数据。 单击右下角“下一步”。 进入“应用开发>SKU创建”页面。 步骤4:创建SKU 在“SKU创建”页面,单击“批量上传SKU”。
功能总览 功能总览 全部 ModelArts Pro 资源池 工作流 应用管理 文字识别套件 自然语言处理套件 视觉套件 HiLens套件 共享带宽 共享流量包 带宽加油包 VPC对等连接 VPC对等连接 VPC对等连接 VPC对等连接 VPC对等连接 VPC对等连接 VPC对等连接