检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
部署服务 模型准备完成后,您可以部署服务,开发属于自己的实体抽取应用,用于从文本中抽取实体,也可直接调用对应的API。 前提条件 已在自然语言处理套件控制台选择“通用实体抽取工作流”新建应用,并评估模型,详情请见评估模型。 由于部署服务涉及ModelArts功能,需消耗资源,要确保账户未欠费。
通用实体抽取工作流 工作流介绍 准备数据 选择数据 训练模型 评估模型 部署服务 父主题: 自然语言处理套件
详细评估 在“模型评估”页面,您可以查看测试集中数据模型预测结果。 “详细评估”左侧选择文本,右侧显示模型预测的实体抽取结果和正确的抽取结果,您可以判断当前模型抽取的实体是否正确。 图2 详细评估 后续操作 针对当前版本的模型,经过“整体评估”和“详细评估”后,如果根据业务需求,模
训练模型 选择训练数据后,基于已标注的训练数据,选择预训练模型、配置参数,用于训练实体抽取模型。 前提条件 已在自然语言处理套件控制台选择“通用实体抽取工作流”新建应用,并选择训练数据集,详情请见选择数据。 训练模型 图1 模型训练 在“模型训练”页面配置训练参数,开始训练模型。
准备数据 在使用通用实体抽取工作流开发应用之前,您需要提前准备用于模型训练的数据,上传至OBS服务中。 设计实体标签 首先需要确定好文本实体的标签,即希望抽取出文本的一种结果。例如“时间”、“地点”、“人物”等。 数据集要求 文件格式要求为txt或者csv,且编码格式为“UTF-8”格式,文件大小不能超过8MB。
在使用通用实体抽取工作流开发应用时,您需要选择训练数据集,后续训练模型操作是基于您选择的训练数据集。 训练数据集可以选择创建一个新的数据集,也可以选择导入在自然语言处理套件其他应用中已创建的文本数据集。 新建数据集 导入数据集 前提条件 已在自然语言处理套件控制台选择“通用实体抽取工作流”新建应用,详情请见新建应用。
Pro>自然语言处理套件”控制台选择“我的工作流>通用实体抽取工作流”新建应用,详细操作请见新建应用。您可以开发实体抽取应用,通过训练实体抽取模型,实现从文本中抽取实体的功能。 图1 通用实体抽取流程 表1 通用实体抽取流程说明 流程 说明 详细指导 准备数据 在使用通用实体抽取工作流开发应用之前,您需要
型精度,实现高精度的文本预测分类。 多语种文本分类工作流 通用实体抽取工作流 根据工作流指引,开发实体抽取服务,通过上传训练数据,训练生成文本实体抽取模型,自主更新和调整模型精度,实现高精度的文本中实体抽取。 通用实体抽取工作流 父主题: 自然语言处理套件
可根据使用过程中的反馈持续优化模型。 通用实体抽取工作流 功能介绍 支持自主上传文本数据,构建高精度实体抽取模型,适配不同行业场景的业务数据,快速获得定制服务。 适用场景 知识图谱、文本理解、智能问答、舆情分析等实体抽取场景。 优势 针对多场景领域提供预训练模型,支持抽取文本中的实体,分类准确率高。 提
设计刹车盘标签 首先需要考虑好刹车盘的标签类型,即希望识别出图片中刹车盘的一种结果。例如可以以“ventilation”(通风)、“physical”(实体)等分别作为刹车盘的类别。 数据集要求 文件名规范,不能有中文,不能有+、空格、制表符。 保证图片质量:不能有损坏的图片;目前支持的格式包括JPG、JPEG、PNG、BMP。
自然语言处理套件 行业套件介绍 新建应用 通用文本分类工作流 多语种文本分类工作流 通用实体抽取工作流 更新应用版本 查看应用详情 监控应用 删除应用
“应用描述”。 工作流配置 选择“所属行业”和“选择工作流”。当前自然语言处理提供“通用文本分类工作流”、“多语种文本分类工作流”、“通用实体抽取工作流”等。 资源配置 分别选择“数据处理资源”和“模型训练资源”,即用于数据处理和模型训练的资源池和资源类型。 资源池可选“公共资源池”和“专属资源池”。
type 形状 标注信息 point 点 点的坐标。 <x>100<x> <y>100<y> line 线 各点坐标。 <x1>100<x1> <y1>100<y1> <x2>200<x2> <y2>200<y2> bndbox 矩形框 左上和右下两个点坐标。 <xmin>100<xmin>
合同录入与审核 自动识别结构化信息与提取签名盖章区域,有助快速审核。 自然语言处理套件 通用文本分类场景。 智能问答 通过中文分词、短文本相似度、命名实体识别等自然语言处理相关技术,计算两个问题对的相似度,可解决问答、对话、语料挖掘、知识库构建等问题。 内容推荐 通过文本分类预测模型,精确匹
资源池。 计算节点规格 如果资源池选择“公共资源池”,支持选择计算规格“CPU:2 核 8 GiB”,适合纯CPU类型的负载运行的模型。 如果资源池选择专属资源池,勾选自己在ModelArts创建的专属资源池。 计算节点个数 设置当前版本模型的实例个数。如果节点个数设置为1,表示
已发布北京四区域 多语种文本分类工作流 OBS 2.0支持通用实体抽取工作流 自然语言处理套件提供实体抽取项目的通用工作流,适用于知识图谱、文本理解、智能问答等大部分实体抽取场景。 已发布北京四区域 通用实体抽取工作流 OBS 2.0支持视觉套件 视觉套件旨在帮助各行业客户快
资源池。 计算节点规格 如果资源池选择“公共资源池”,支持选择计算规格“CPU:2 核 8 GiB”,适合纯CPU类型的负载运行的模型。 如果资源池选择专属资源池,勾选自己在ModelArts创建的专属资源池。 计算节点个数 设置当前版本模型的实例个数。如果节点个数设置为1,表示
自然语言处理套件具体收费项请参见表1,具体计费价格请参见ModelArts价格详情。 表1 自然语言处理计费项说明 计费项 说明 训练文本分类模型、训练实体抽取模型 工作流中训练模型时,会使用到ModelArts计算资源。 部署服务(在线服务) 工作流中部署在线服务时,会使用到计算型实例资源。
自然语言处理套件具体收费项请参见表1,具体计费价格请参见ModelArts价格详情。 表1 自然语言处理计费项说明 计费项 说明 训练文本分类模型、训练实体抽取模型 工作流中训练模型时,会使用到ModelArts计算资源。 部署服务(在线服务) 工作流中部署在线服务时,会使用到计算型实例资源。
效。使用专属资源池需要在ModelArts创建专属资源池。 计算节点规格 请根据界面提示选择需要使用的规格。 计算节点个数 设置当前版本模型的实例个数。如果节点个数设置为1,表示后台的计算模式是单机模式;如果节点个数设置大于1,表示后台的计算模式为分布式的。请根据实际编码情况选择计算模式。