检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
用于训练多模板分类器的训练集,需要把各个模板的训练图片打包成一个文件夹并压缩成“zip”包,“zip”包文件大小不超过10M。 例如训练“保险单”模板的训练集,需要把同模板的保险单图片打包成一个文件夹并压缩成“zip”包。 步骤2:新建应用 登录ModelArts Pro控制台,单击“文字识别”套件卡片的“进入套件”。
申请行业套件 目前ModelArts Pro已开通自然语言处理套件、视觉套件、文字识别套件、HiLens套件,其中文字识别套件和自然语言处理套件已商用,可直接进入套件使用,视觉套件和HiLens处于公测阶段,首次使用套件需要申请套件开通公测权限。 申请套件 针对处于公测阶段的套件,需要申请套件开通公测权限。
训练模型 针对已标注完成的训练数据,开始训练模型,您可以查看训练的模型交并比和误差变化。 前提条件 已在视觉套件控制台选择“第二相面积含量测定工作流”新建应用,并已执行完“数据标注”步骤,详情请见标注数据。 训练模型 在“模型训练”页面配置训练参数,开始训练模型。 在“参数配置”
度。 适用场景 用户认证识别 识别证件中关键信息,节省人工录入,提升效率,降低用户实名认证成本,准确快速便捷。 快递单自动填写 识别图片中联系人信息并自动填写快递单,减少人工输入。 合同录入与审核 自动识别结构化信息与提取签名盖章区域,有助快速审核。 优势 解决手工录入投入大、效率低、语种多等问题,提升业务效率。
度。 适用场景 用户认证识别 识别证件中关键信息,节省人工录入,提升效率,降低用户实名认证成本,准确快速便捷。 快递单自动填写 识别图片中联系人信息并自动填写快递单,减少人工输入。 合同录入与审核 自动识别结构化信息与提取签名盖章区域,有助快速审核。 优势 解决手工录入投入大、效率低、语种多等问题,提升业务效率。
特定行业下希望解决特定问题的场景。 文字识别套件 用户认证识别 识别证件中关键信息,节省人工录入,提升效率,降低用户实名认证成本,准确快速便捷。 快递单自动填写 识别图片中联系人信息并自动填写快递单,减少人工输入。 合同录入与审核 自动识别结构化信息与提取签名盖章区域,有助快速审核。 自然语言处理套件 通用文本分类场景。
功能介绍 支持自主上传文本数据,构建高精度文本分类预测模型,适配不同行业场景的业务数据,快速获得定制服务。此工作流仅支持对中文进行文本分类,且支持单标签分类和多标签分类。 适用场景 智能问答、舆情分析、内容推荐等场景。 优势 针对场景领域提供预训练模型,分类准确率高。 提供完善的文本处理
提供文本分类项目的通用工作流,仅适用于中文文本的分类场景,支持单标签分类和多标签分类。 多语种文本分类工作流 提供多语种文本分类项目的通用工作流,支持包括英语,法语,德语,西班牙语,葡萄牙语,阿拉伯语等语种的文本,支持单标签分类和多标签分类。 通用实体抽取工作流 提供实体抽取项目的
息。 适用场景 用户认证识别 识别证件中关键信息,节省人工录入,提升效率,降低用户实名认证成本,准确快速便捷。 快递单自动填写 识别图片中联系人信息并自动填写快递单,减少人工输入。 合同录入与审核 自动提取合同结构化信息,有助快速审核。 优势 解决手工录入投入大、效率低、语种多等问题,提升业务效率。
通过工作流指引支持自定义多个文字识别模板,通过模型训练,自动识别图片所属模板,从而支持从大量不同板式图像中提取结构化信息。通常适用于物流行业,实现多样化快递单场景的文字识别。详情请见使用多模板工作流开发应用。 父主题: 文字识别套件
服务部署。专属资源池不与其他用户共享,更加高效。使用专属资源池需要在ModelArts创建专属资源池。 SKU 标准化产品单元,即商品各类单品的图片。 在ModelArts Pro服务中使用视觉套件的零售商品识别工作流时,如果上传的数据含有未标注数据,就需要创建SKU,方便后续对数据进行自动标注。
txt 2.jpg 2.txt 单标签的标签文件示例,如1.txt文件内容如下所示: stratus 只支持JPG、JPEG、PNG、BMP格式的图片。单张图片大小不能超过5MB,且单次上传的图片总大小不能超过8MB。 上传数据至OBS 使用ModelArts
txt 2.jpg 2.txt 单标签的标签文件示例,如1.txt文件内容如下所示: ventilation 只支持JPG、JPEG、PNG、BMP格式的图片。单张图片大小不能超过5MB,且单次上传的图片总大小不能超过8MB。 上传数据至OBS 使用ModelArts
txt 2.jpg 2.txt 单标签的标签文件示例,如1.txt文件内容如下所示: stratus 只支持JPG、JPEG、PNG、BMP格式的图片。单张图片大小不能超过5MB,且单次上传的图片总大小不能超过8MB。 刹车盘识别工作流 文件名规范,不能有中文,不能有+、空格、制表符。
txt 2.jpg 2.txt 单标签的标签文件示例,如1.txt文件内容如下所示: rainy 只支持JPG、JPEG、PNG、BMP格式的图片。单张图片大小不能超过5MB,且单次上传的图片总大小不能超过8MB。 上传数据至OBS 使用ModelArts
择创建SKU后,自动标注数据。 选择数据 创建SKU(可选) 在商品识别场景下,如果上传的数据包含未标注数据,您需要创建SKU,即商品各类单品的图片,方便后续针对数据集中的数据进行自动标注。 如果数据集是已标注数据,您可以选择不创建SKU,直接执行下一步。 创建SKU 标注数据
如果训练数据集使用已标注数据,数据要求请见数据集要求。 SKU数据集 为保证智能标注效果,建议每个分类标签的商品准备20个以上的图片。 文件放置方式请按“父文件夹/单品文件夹/单品图”,示例如下所示。 ├─SKU-Dataset ├── cream_cake │ IMG_20180919_114732
文本数据至少包含2个及以上的标签。每个分类标签需要准备5个及以上数据,为了训练出效果较好的模型,建议每个分类标签准备100个以上的数据。 多语种文本分类工作流仅支持对单语种的文本分类,当前支持文本分类的语种包括英语、法语、德语、西班牙语、葡萄牙语、阿拉伯语等。暂不支持对同一文本中含多语种的文本进行分类训练。
中文文本的分类场景,支持单标签分类和多标签分类。 已发布北京四区域 通用文本分类工作流 OBS 2.0支持多语种文本分类工作流 自然语言处理套件提供多语种文本分类项目的通用工作流,支持包括英语,法语,德语,西班牙语,葡萄牙语,阿拉伯语等语种的文本,支持单标签分类和多标签分类。 已发布北京四区域
</object> </annotation> 只支持JPG、JPEG、PNG、BMP格式的图片,单张图片大小不能超过5MB,且单次上传的图片总大小不能超过8MB。 表1 PASCAL VOC格式说明 字段 是否必选 说明 folder 是 表示数据源所在目录。 filename