检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
自然语言处理套件 行业套件介绍 新建应用 通用文本分类工作流 多语种文本分类工作流 通用实体抽取工作流 更新应用版本 查看应用详情 监控应用 删除应用
)页面,服务会自动开通。 在子用户已经具备OCR权限,并开通ModelArts Pro后,如果仍然无法调用,请检查子用户是否有“编程访问权限”。 图2 编程访问权限
自然语言处理套件 自然语言处理套件为客户提供自然语言处理的自定制工具,旨在帮助客户高效地构建行业、领域的高精度文本处理模型,可应用于政府、金融、法律等行业。 自然语言处理套件提供了预置工作流,覆盖多种场景,支持自主上传训练数据,自主构建和升级高精度识别模型。用户自定义模型精度高,识别速度快。
建专属资源池。 计算节点规格 如果资源池选择“公共资源池”,支持选择计算规格“CPU:2 核 8 GiB”,适合纯CPU类型的负载运行的模型。 如果资源池选择专属资源池,勾选自己在ModelArts创建的专属资源池。 计算节点个数 设置当前版本模型的实例个数。如果节点个数设置为1
建专属资源池。 计算节点规格 如果资源池选择“公共资源池”,支持选择计算规格“CPU:2 核 8 GiB”,适合纯CPU类型的负载运行的模型。 如果资源池选择专属资源池,勾选自己在ModelArts创建的专属资源池。 计算节点个数 设置当前版本模型的实例个数。如果节点个数设置为1
源池需要在ModelArts创建专属资源池。 计算节点规格 界面上选择计算规格。 服务自动停止 设置服务自动停止的时间,在线服务运行状态在所选的时间点后自动停止,同时在线服务也停止计费。 计算节点个数 设置当前版本模型的实例个数。如果节点个数设置为1,表示后台的计算模式是单机模式
查看历史版本 在“应用监控”页面,您可以查看当前应用所部署的不同版本信息,包括“更新时间”、“更新状态”、“对应应用版本”、“分流(%)”、“计算节点规格”和“计算节点个数”。 图4 历史版本 查看调用指南 在“应用监控”页面,您可以查看调用应用API的信息。如何调用API请参考API参考,错误码请参见错误码。
分别选择“数据处理资源”和“模型训练资源”,即用于数据处理和模型训练的资源池和资源类型。 资源池可选“公共资源池”和“专属资源池”。 “公共资源池”:提供公共的大规模计算集群,资源按作业隔离。您可以按需选择不同的资源类型。 “专属资源池”:提供独享的计算资源,不与其他用户共享,更加高效。使用
专属资源池需要在ModelArts创建专属资源池。 本样例选择“公共资源池”。 计算节点规格 界面上选择计算规格。 - 计算节点个数 设置当前版本模型的实例个数。如果节点个数设置为1,表示后台的计算模式是单机模式;如果节点个数设置大于1,表示后台的计算模式为分布式的。请根据实际编码情况选择计算模式。
“版本名称” 默认按V001、V002递增规则进行命名,您也可以自定义版本名称。版本名称只能包含字母、数字、中划线或下划线。 “版本格式” 仅“表格”类型数据集支持设置版本格式,支持“CSV”和“CarbonData”两种。 说明: 如果导出的CSV文件中存在以“=”“+”“-”和“@”开头
查看应用详情 新建应用后,您可以在ModelArts Pro控制台查看应用详情,包括应用开发的配置信息、应用的历史版本、应用资产、应用监控。 前提条件 已在自然语言处理套件控制台选择“通用文本分类工作流”新建应用,详情请见新建应用。 进入应用详情页 登录ModelArts Pro
通用实体抽取工作流 工作流介绍 准备数据 选择数据 训练模型 评估模型 部署服务 父主题: 自然语言处理套件
更新应用版本 一个模型很难一次性就训练到最佳的效果,可能需要结合模型评估报告和校验结果不断扩充数据和调优。 因此ModelArts Pro提供版本更新的功能,首次版本为v1,然后v2、v3......以此类推。可以通过调整训练数据和算法,多次训练,获得更好的模型效果。 每修改一次
删除应用 如果已创建的应用不再使用,您可以删除应用释放资源。 操作步骤 登录ModelArts Pro管理控制台,单击“自然语言处理”套件卡片的“进入套件”。 进入自然语言处理套件控制台。 在左侧导航栏选择“应用开发>工作台”。 默认进入“我的应用”页签。 在“我的应用”页签下,
训练模型 选择训练数据后,基于已标注的训练数据,选择预训练模型、配置参数,用于训练实体抽取模型。 前提条件 已在自然语言处理套件控制台选择“通用实体抽取工作流”新建应用,并选择训练数据集,详情请见选择数据。 训练模型 图1 模型训练 在“模型训练”页面配置训练参数,开始训练模型。
行业套件介绍 自然语言处理套件为客户提供自然语言处理的自定制工具,旨在帮助客户高效地构建行业、领域的高精度文本处理模型,可应用于政府、金融、法律等行业。 预置工作流 自然语言处理套件当前提供了通用文本分类工作流、多语种文本分类工作流和通用实体抽取工作流,提供高精度文本分类预测模型
选择数据 在使用通用文本分类工作流开发应用时,您需要选择训练数据集,后续训练模型操作是基于您选择的训练数据集。 训练数据集可以选择创建一个新的数据集,也可以选择导入在自然语言处理套件其他应用中已创建的文本数据集。 新建数据集 导入数据集 前提条件 已在自然语言处理套件控制台选择“
标注数据 由于模型训练过程需要大量有标签的数据,如果开发应用时,上传的训练数据集是未标注的,需要对数据集中的数据进行标注。 针对文本分类场景,是对文本的内容按照标签进行分类处理,标签名是由中文、大小写字母、数字、中划线或下划线组成,且不超过32位的字符串。 进入数据标注页面 在“
准备数据 在使用通用文本分类工作流开发应用之前,您需要提前准备用于模型训练的数据,上传至OBS服务中。 设计分类标签 首先需要确定好文本分类的标签,即希望识别出文本的一种结果。例如分类用户对商品的评论,则可以以“positive”、“neutral”、“negative”等作为用
工作流介绍 工作流介绍 功能介绍 支持自主上传文本数据,构建高精度实体抽取模型,适配不同行业场景的业务数据,快速获得定制服务。 适用场景 知识图谱、文本理解、智能问答、舆情分析等实体抽取场景。 优势 针对多场景领域提供预训练模型,支持抽取文本中的实体,分类准确率高。 提供完善的文