检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
iLens控制台注册Atlas 500设备,详细注册方式请前往华为云论坛参与讨论。 确认信息后,单击“确定”。 成功新建应用。 父主题: 通用图像分类工作流
训练模型 选择训练数据后,基于已标注的训练数据,选择预训练模型、配置参数,用于训练实体抽取模型。 前提条件 已在自然语言处理套件控制台选择“通用实体抽取工作流”新建应用,并选择训练数据集,详情请见选择数据。 训练模型 图1 模型训练 在“模型训练”页面配置训练参数,开始训练模型。
训练模型 选择训练数据后,基于已标注的训练数据,选择预训练模型、配置参数,用于训练文本分类模型。 前提条件 已在自然语言处理套件控制台选择“通用文本分类工作流”新建应用,并选择训练数据集,详情请见选择数据。 训练模型 图1 模型训练 在“模型训练”页面,勾选模型训练所使用的“预训练模型”,并配置训练参数,开始训练模型。
解决手工录入投入大、效率低、语种多等问题,提升业务效率。 一键式部署,快速输出高精度结构化数据。 工作流流程 在“ModelArts Pro>文字识别套件”控制台选择“通用单模板分类工作流”新建应用,详细操作请见新建应用。您可以创建单模板服务,通过模板训练文字识别模型,实现单模板图像的文字信息结构化提取。 图1
型。 一些常用的指标,如精准率、召回率、F1值等,能帮助您有效的评估,最终获得一个满意的模型。 前提条件 已在自然语言处理套件控制台选择“通用文本分类工作流”新建应用,并训练模型,详情请见训练模型。 整体评估 在“模型评估”页面,您可以针对当前版本的模型进行整体评估。 “整体评估
模型就能识别并提取同格式发票上的关键字段。 前提条件 已授权ModelArts服务和对象存储服务(OBS)。 已在文字识别套件控制台选择“通用单模板工作流”新建应用,详情请见新建应用。 提前准备待识别的图片,图片要求请见图片要求。 图片要求 保证图片质量:不能有损坏的图片;目前支
在使用通用文本分类工作流开发应用时,您需要选择训练数据集,后续训练模型操作是基于您选择的训练数据集。 训练数据集可以选择创建一个新的数据集,也可以选择导入在自然语言处理套件其他应用中已创建的文本数据集。 新建数据集 导入数据集 前提条件 已在自然语言处理套件控制台选择“通用文本分类工作流”新建应用,详情请见新建应用。
识别的图片中都会包含此识别区的字段,且位置固定不变,因此模型可以通过识别区找到需要识别内容的位置。 前提条件 已在文字识别套件控制台选择“通用单模板工作流”新建应用,并框选参照字段,详情请见框选参照字段。 操作步骤 图1 框选识别区 在“应用开发>框选识别区”页面,通过单击左上方操作图标,调整模板图片到合适大小。
准备数据 在使用通用文本分类工作流开发应用之前,您需要提前准备用于模型训练的数据,上传至OBS服务中。 设计分类标签 首先需要确定好文本分类的标签,即希望识别出文本的一种结果。例如分类用户对商品的评论,则可以以“positive”、“neutral”、“negative”等作为用
其他文字混淆时,可以使用自动参照字段来简化模板制作过程,否则建议手动框选,详细步骤请参见操作步骤。 前提条件 已在文字识别套件控制台选择“通用单模板工作流”新建应用,并对上传的模板图片进行预处理,详情请见定义预处理。 操作步骤 图1 框选参照字段 在“应用开发>框选参照字段”页面
Pro>自然语言处理套件”控制台选择“我的工作流>通用实体抽取工作流”新建应用,详细操作请见新建应用。您可以开发实体抽取应用,通过训练实体抽取模型,实现从文本中抽取实体的功能。 图1 通用实体抽取流程 表1 通用实体抽取流程说明 流程 说明 详细指导 准备数据 在使用通用实体抽取工作流开发应用之前,您
Pro>自然语言处理套件”控制台,选择“我的工作流>通用文本分类工作流”新建应用,详细操作请见新建应用。您可以开发文本分类应用,通过训练文本分类预测模型,实现文本分类功能。 图1 文本分类流程 表1 文本分类流程说明 流程 说明 详细指导 准备数据 在使用通用文本分类工作流开发应用之前,您需要提
可选择默认字段类型“数字”。 如果“默认字段类型”不能满足您的业务需求,您可以创建新的字段类型。 前提条件 已在文字识别套件控制台选择“通用单模板工作流”新建应用,详情请见新建应用。 操作步骤 登录“ModelArts Pro>文字识别套件”控制台。 默认进入“应用开发>工作台”页面。
发布数据集 版本发布后,您可以前往版本管理查看详细信息。系统默认将最新的版本作为当前目录。 数据集发布后,相关文件的目录结构说明 由于数据集是基于OBS目录管理的,发布为新版本后,对应的数据集输出位置,也将基于新版本生成目录。 父主题: 通用文本分类工作流
前页”选中该页面所有文本,然后单击左上角“删除”,即可完成当前页所有文本的删除操作。 其中,被选中的文本,其背景将显示为蓝色。 父主题: 通用文本分类工作流
息仍存在于对应的OBS目录下。但是,执行删除操作后,无法在ModelArts Po管理控制台清晰的管理数据集版本,请谨慎操作。 父主题: 通用文本分类工作流
律等行业。 预置工作流 自然语言处理套件当前提供了通用文本分类工作流、多语种文本分类工作流和通用实体抽取工作流,提供高精度文本分类预测模型,适配不同行业场景的业务数据,快速获得定制服务。 通用文本分类工作流 提供文本分类项目的通用工作流,仅适用于中文文本的分类场景,支持单标签分类和多标签分类。
使用单模板工作流开发应用 ModelArts Pro的文字识别套件提供了通用单模板工作流,通过工作流指引可构建文字识别模板,识别单个板式图片中的文字,快速实现文档、票证等场景的文字识别。 本章节提供一个身份证样例,帮助您快速熟悉使用文字识别套件中的通用单模板工作流开发应用的过程。通过上传模板图片、框选
自然语言处理套件提供了预置工作流,覆盖多种场景,支持自主上传训练数据,自主构建和升级高精度识别模型。用户自定义模型精度高,识别速度快。 通用文本分类工作流 多语种文本分类工作流 通用实体抽取工作流 通用文本分类工作流 功能介绍 支持自主上传文本数据,构建高精度文本分类预测模型,适配不同行业场景的业务数据,快速
自然语言处理套件(使用文本分类工作流开发应用) ModelArts Pro的自然语言处理套件提供了通用文本分类工作流和多语种文本分类工作流,通过工作流指引支持自主上传文本数据,构建高精度文本分类预测模型,适配不同行业场景的业务数据,快速获得定制服务。 通用文本分类工作流仅支持中文文本分类,多语种文本分类工作流支持对英