检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
框选识别区 在文字识别过程中,需要确定图片中识别的文字位置,这就需要在图片模板中框选识别区。 识别区指图片中待识别的文字位置。所有需要识别的图片中都会包含此识别区的字段,且位置固定不变,因此模型可以通过识别区找到需要识别内容的位置。 前提条件 已在文字识别套件控制台选择“多模板分类工作流
通用文本分类工作流 工作流介绍 准备数据 选择数据 标注数据 训练模型 评估模型 部署服务 发布数据集 管理数据集版本 父主题: 自然语言处理套件
准备数据 在使用通用实体抽取工作流开发应用之前,您需要提前准备用于模型训练的数据,上传至OBS服务中。 设计实体标签 首先需要确定好文本实体的标签,即希望抽取出文本的一种结果。例如“时间”、“地点”、“人物”等。 数据集要求 文件格式要求为txt或者csv,且编码格式为“UTF-8
选择数据 在使用通用实体抽取工作流开发应用时,您需要选择训练数据集,后续训练模型操作是基于您选择的训练数据集。 训练数据集可以选择创建一个新的数据集,也可以选择导入在自然语言处理套件其他应用中已创建的文本数据集。 新建数据集 导入数据集 前提条件 已在自然语言处理套件控制台选择“通用实体抽取工作流
评估模型 训练得到模型之后,整个开发过程还不算结束,需要对模型进行评估和考察。一次性很难获得一个满意的模型,需要反复的调整算法、数据,不断评估训练生成的模型。 一些常用的指标,如准确率、召回率等,能帮助您有效的评估,最终获得一个满意的模型。 前提条件 已在视觉套件控制台选择“第二相面积含量测定工作流
HiLens套件(使用HiLens安全帽检测技能开发可训练技能) ModelArts Pro的HiLens套件提供了安全帽检测技能,通过工作流指引支持自主上传数据集,零代码构建安全帽检测技能,并一键下发到端侧设备HiLens Kit;针对难例数据,可快速迭代更新技能,提升精度。 本章节介绍如何使用
上传模板图片 在使用多模板分类工作流开发应用之前,必须要明确文字识别的模板类型,明确以哪几种板式图片作为模板训练文字识别模型,基于自己的业务需求制定针对性的文字识别模型。例如上传两种不同格式的发票图片作为模板,训练的文字识别模型就能识别并提取这两种格式发票上的关键字段。 前提条件
工作流介绍 工作流简介 相是指成分和组织均匀统一的物质部分,金属材料中,一般除了基体相外,还会存在许多的第二相。而第二相对整个金属材料的影响也是巨大的。在钢铁或其下游企业,常需要对钢铁显微成像的金相图片第二相面积含量进行测定。ModelArts Pro提供第二相面积含量测定工作流,
选择数据 在使用通用文本分类工作流开发应用时,您需要选择训练数据集,后续训练模型操作是基于您选择的训练数据集。 训练数据集可以选择创建一个新的数据集,也可以选择导入在自然语言处理套件其他应用中已创建的文本数据集。 新建数据集 导入数据集 前提条件 已在自然语言处理套件控制台选择“通用文本分类工作流
标注数据 由于模型训练过程需要大量有标签的数据,如果开发应用时,上传的训练数据集是未标注的,需要对数据集中的数据进行标注。 针对文本分类场景,是对文本的内容按照标签进行分类处理,标签名是由中文、大小写字母、数字、中划线或下划线组成,且不超过32位的字符串。 进入数据标注页面 在“数据选择
准备数据 在使用通用文本分类工作流开发应用之前,您需要提前准备用于模型训练的数据,上传至OBS服务中。 设计分类标签 首先需要确定好文本分类的标签,即希望识别出文本的一种结果。例如分类用户对商品的评论,则可以以“positive”、“neutral”、“negative”等作为用户对某商品评论的分类标签
工作流介绍 工作流介绍 功能介绍 支持自主上传文本数据,构建高精度实体抽取模型,适配不同行业场景的业务数据,快速获得定制服务。 适用场景 知识图谱、文本理解、智能问答、舆情分析等实体抽取场景。 优势 针对多场景领域提供预训练模型,支持抽取文本中的实体,分类准确率高。 提供完善的文本处理能力
工作流介绍 工作流简介 功能介绍 支持构建文字识别模板,识别单个板式图片中的文字,提供高精度的文字识别模型,保证结构化信息提取精度。 适用场景 用户认证识别 识别证件中关键信息,节省人工录入,提升效率,降低用户实名认证成本,准确快速便捷。 快递单自动填写 识别图片中联系人信息并自动填写快递单
工作流介绍 工作流简介 功能介绍 支持上传通用的图像分类数据,构建图像分类模型,快速、准确的对图像进行分类。 支持一键部署模型和技能到边缘设备Atlas 500,并在华为HiLens平台上进行模型管理和技能管理。 适用场景 通用图像分类场景。 优势 模型精度高,识别速度快;更新模型简便
自定义字段类型 在应用开发过程中“框选识别区”时会选择“字段类型”,如您框选的文字内容是数字,可选择默认字段类型“数字”。 如果“默认字段类型”不能满足您的业务需求,您可以创建新的字段类型。 前提条件 已在文字识别套件控制台选择“通用单模板工作流”新建应用,详情请见新建应用。 操作步骤
工作流介绍 工作流简介 在钢铁厂中,钢板的材质、热处理工艺以及使用环境等外界因素均会影响钢板的使用寿命,而这些外界因素导致钢板缺陷。研究钢板表面的缺陷类型对钢板的使用寿命至关重要,ModelArts Pro提供热轧钢板表面缺陷检测工作流,提供高精度钢板表面缺陷识别算法,提高钢板表面缺陷检测场景上线效率
上传模板图片 在使用单模板工作流开发应用之前,必须要明确文字识别的模板类型,明确以哪张图片作为模板训练文字识别模型,基于自己的业务需求制定针对性的文字识别模型。例如上传某一格式的发票图片作为模板,训练的文字识别模型就能识别并提取同格式发票上的关键字段。 前提条件 已授权ModelArts
训练模型 选择训练数据后,基于已标注的训练数据,选择预训练模型、配置参数,用于训练文本分类模型。 前提条件 已在自然语言处理套件控制台选择“通用文本分类工作流”新建应用,并选择训练数据集,详情请见选择数据。 训练模型 图1 模型训练 在“模型训练”页面,勾选模型训练所使用的“预训练模型
评估模型 训练得到模型之后,整个开发过程还不算结束,需要对模型进行评估和考察。一次性很难获得一个满意的模型,需要反复的调整算法参数、数据,不断评估训练生成的模型。 一些常用的指标,如精准率、召回率、F1值等,能帮助您有效的评估,最终获得一个满意的模型。 前提条件 已在自然语言处理套件控制台选择
多语种文本分类工作流 工作流介绍 准备数据 选择数据 训练模型 评估模型 部署服务 父主题: 自然语言处理套件