检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
通用单模板工作流 工作流介绍 上传模板图片 定义预处理 框选参照字段 框选识别区 评估应用 部署服务 自定义字段类型 编辑应用 删除应用 父主题: 文字识别套件
通用文本分类工作流 工作流介绍 准备数据 选择数据 标注数据 训练模型 评估模型 部署服务 发布数据集 管理数据集版本 父主题: 自然语言处理套件
通用实体抽取工作流 工作流介绍 准备数据 选择数据 训练模型 评估模型 部署服务 父主题: 自然语言处理套件
您可以通过上传测试图片,在线评估模板的识别情况,保证能正确识别同样模板下其他图片中的识别区文字。 前提条件 已在文字识别套件控制台选择“通用单模板工作流”新建应用,并完成框选识别区步骤,详情请见框选识别区。 进入评估页面 登录“ModelArts Pro>文字识别套件”控制台,
通用图像分类工作流 工作流介绍 新建应用 准备数据 选择数据 训练模型 评估模型 部署服务 父主题: 视觉套件
iLens控制台注册Atlas 500设备,详细注册方式请前往华为云论坛参与讨论。 确认信息后,单击“确定”。 成功新建应用。 父主题: 通用图像分类工作流
文件名规范,不能有中文,不能含有空格、制表符及除中划线下划线外的特殊符号。 保证图片质量:不能有损坏的图片;目前支持的格式包括JPG、JPEG、PNG、BMP。 不要把明显不同的多个任务数据放在同一个数据集内。 为了保证模型的预测准确度,训练样本跟真实使用场景尽量相似。 为保证模型的泛化能力,数据集尽量覆盖可能出现的各种场景。
一些常用的指标,如精准率、召回率等,能帮助您有效的评估,最终获得一个满意的模型。 前提条件 已在“工业智能体控制台>工业AI开发>工业AI开发工作流”选择“通用图像分类工作流”新建应用,并训练模型,详情请见训练模型。 评估模型 在“模型评估”页面,您可以针对当前版本的模型进行模型评估,查看评估参数对比和详细评估,也可以模拟在线测试。
型。 一些常用的指标,如精准率、召回率、F1值等,能帮助您有效的评估,最终获得一个满意的模型。 前提条件 已在自然语言处理套件控制台选择“通用实体抽取工作流”新建应用,并训练模型,详情请见训练模型。 整体评估 在“模型评估”页面,您可以针对当前版本的模型进行整体评估。 “整体评估
型,实现从文本中抽取实体的功能。 图1 通用实体抽取流程 表1 通用实体抽取流程说明 流程 说明 详细指导 准备数据 在使用通用实体抽取工作流开发应用之前,您需要提前准备用于模型训练的数据,上传至OBS中。 准备数据 选择数据 在使用通用实体抽取工作流开发应用时,您需要新建或导入
AI开发工作流”新建应用,详细操作请见新建应用。您可以开发通用图像分类模型,自主上传数据训练模型,实现图像分类功能。 图1 通用图像分类工作流流程 表1 通用图像分类工作流说明 流程 说明 详细指导 准备数据 在使用通用图像分类工作流开发应用之前,您需要提前准备用于模型训练的数据,上传至OBS中。
型。 一些常用的指标,如精准率、召回率、F1值等,能帮助您有效的评估,最终获得一个满意的模型。 前提条件 已在自然语言处理套件控制台选择“通用文本分类工作流”新建应用,并训练模型,详情请见训练模型。 整体评估 在“模型评估”页面,您可以针对当前版本的模型进行整体评估。 “整体评估
针对场景领域提供预训练模型,分类准确率高。 提供完善的文本处理能力,支持多种数据格式内容,适配不同场景的业务数据。 可根据使用过程中的反馈持续优化模型。 工作流流程 在“ModelArts Pro>自然语言处理套件”控制台,选择“我的工作流>通用文本分类工作流”新建应用,详细操作请见新建应用。
解决手工录入投入大、效率低、语种多等问题,提升业务效率。 一键式部署,快速输出高精度结构化数据。 工作流流程 在“ModelArts Pro>文字识别套件”控制台选择“通用单模板分类工作流”新建应用,详细操作请见新建应用。您可以创建单模板服务,通过模板训练文字识别模型,实现单模板图像的文字信息结构化提取。 图1
评估模板应用后,就可以部署模板应用至文字识别开发套件中,开发属于自己的文字识别应用,此应用用于识别自己所上传的模板样式的图片。 前提条件 已在文字识别套件控制台选择“通用单模板工作流”新建应用,并完成评估模板步骤,详情请见评估应用。 操作步骤 在“应用开发>部署”页面完成模板评估后,单击“下一步”,进入“创
准备数据 在使用通用实体抽取工作流开发应用之前,您需要提前准备用于模型训练的数据,上传至OBS服务中。 设计实体标签 首先需要确定好文本实体的标签,即希望抽取出文本的一种结果。例如“时间”、“地点”、“人物”等。 数据集要求 文件格式要求为txt或者csv,且编码格式为“UTF-8”格式,文件大小不能超过8MB。
选择数据 在使用通用图像分类工作流开发应用时,您需要选择训练数据集,后续训练模型操作是基于您选择的训练数据集。 训练数据集可以选择创建一个新的数据集,也可以选择导入基于通用图像分类工作流创建的其他应用中已创建的数据集。 新建训练数据集 导入已有数据集 前提条件 通用图像分类工作流支
支持换行。 基于已设计好的分类标签准备文本数据。每个分类标签需要准备5个及以上数据,为了训练出效果较好的模型,建议每个分类标签准备100个以上的数据。 针对未标注数据,将待标注的内容放在一个文本文件内,通用文本分类工作流仅支持中文文本内容的分类,其他语种的文本分类请使用多语种文本分类工作流。
训练模型 选择训练数据后,基于已标注的训练数据,选择预训练模型、配置参数,用于训练实体抽取模型。 前提条件 已在自然语言处理套件控制台选择“通用实体抽取工作流”新建应用,并选择训练数据集,详情请见选择数据。 训练模型 图1 模型训练 在“模型训练”页面配置训练参数,开始训练模型。
在使用通用实体抽取工作流开发应用时,您需要选择训练数据集,后续训练模型操作是基于您选择的训练数据集。 训练数据集可以选择创建一个新的数据集,也可以选择导入在自然语言处理套件其他应用中已创建的文本数据集。 新建数据集 导入数据集 前提条件 已在自然语言处理套件控制台选择“通用实体抽取工作流”新建应用,详情请见新建应用。