检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
通用文本分类工作流 工作流介绍 准备数据 选择数据 标注数据 训练模型 评估模型 部署服务 发布数据集 管理数据集版本 父主题: 自然语言处理套件
评估模型 训练得到模型之后,整个开发过程还不算结束,需要对模型进行评估和考察。一次性很难获得一个满意的模型,需要反复的调整算法、数据,不断评估训练生成的模型。 一些常用的指标,如准确率、召回率等,能帮助您有效的评估,最终获得一个满意的模型。 前提条件 已在视觉套件控制台选择“第二
支持构建文字识别模板,识别单个板式图片中的文字,提供高精度的文字识别模型,保证结构化信息提取精度。 适用场景 用户认证识别 识别证件中关键信息,节省人工录入,提升效率,降低用户实名认证成本,准确快速便捷。 快递单自动填写 识别图片中联系人信息并自动填写快递单,减少人工输入。 合同录入与审核
您选择的训练数据集。 由于模型训练过程需要有标签的数据,如果您上传未标注数据,需要手动标注数据。 选择数据 训练模型 选择训练数据后,无需用户配置任何参数即可开始训练图像分类模型,并查看训练的模型准确率和误差的变化。 训练模型 评估模型 训练得到模型之后,整个开发过程还不算结束,需要对模型进行评估和考察。
训练模型 选择训练数据后,基于已标注的训练数据,选择预训练模型、配置参数,用于训练文本分类模型。 前提条件 已在自然语言处理套件控制台选择“通用文本分类工作流”新建应用,并选择训练数据集,详情请见选择数据。 训练模型 图1 模型训练 在“模型训练”页面,勾选模型训练所使用的“预训
评估模型 训练得到模型之后,整个开发过程还不算结束,需要对模型进行评估和考察。一次性很难获得一个满意的模型,需要反复的调整算法参数、数据,不断评估训练生成的模型。 一些常用的指标,如精准率、召回率、F1值等,能帮助您有效的评估,最终获得一个满意的模型。 前提条件 已在自然语言处理
多语种文本分类工作流 工作流介绍 准备数据 选择数据 训练模型 评估模型 部署服务 父主题: 自然语言处理套件
工作流介绍 工作流介绍 功能介绍 支持自主上传文本数据,构建高精度文本分类预测模型,适配不同行业场景的业务数据,快速获得定制服务。此工作流仅支持对中文进行文本分类,且支持单标签分类和多标签分类。 适用场景 智能问答、舆情分析、内容推荐等场景。 优势 针对场景领域提供预训练模型,分类准确率高。
图解ModelArts Pro
步骤4:定义预处理 步骤5:框选参照字段 步骤6:框选识别区 步骤7:评估模板 步骤8:部署模板 准备工作 注册华为帐号,开通华为云,并完成套件申请、访问授权配置等准备工作,详情请见准备工作。 步骤1:准备数据 在本地准备好两张身份证图片,一张用于制作模板,一张用于评估模板。图片要求如下:
请根据界面提示选择需要使用的规格。 计算节点个数 设置当前版本模型的实例个数。如果节点个数设置为1,表示后台的计算模式是单机模式;如果节点个数设置大于1,表示后台的计算模式为分布式的。请根据实际编码情况选择计算模式。 服务自动停止 设置服务自动停止的时间,在线服务运行状态在所选的时间点后自动停止,同时在线服务也停止计费。
elArts创建的专属资源池。 计算节点个数 设置当前版本模型的实例个数。如果节点个数设置为1,表示后台的计算模式是单机模式;如果节点个数设置大于1,表示后台的计算模式为分布式的。请根据实际编码情况选择计算模式。 服务自动停止 设置服务自动停止的时间,在线服务运行状态在所选的时间点后自动停止,同时在线服务也停止计费。
计算节点规格 界面上选择计算规格。 服务自动停止 设置服务自动停止的时间,在线服务运行状态在所选的时间点后自动停止,同时在线服务也停止计费。 计算节点个数 设置当前版本模型的实例个数。如果节点个数设置为1,表示后台的计算模式是单机模式;如果节点个数设置大于1,表示后台的计算模式为分布式的。请根据实际编码情况选择计算模式。
elArts创建的专属资源池。 计算节点个数 设置当前版本模型的实例个数。如果节点个数设置为1,表示后台的计算模式是单机模式;如果节点个数设置大于1,表示后台的计算模式为分布式的。请根据实际编码情况选择计算模式。 服务自动停止 设置服务自动停止的时间,在线服务运行状态在所选的时间点后自动停止,同时在线服务也停止计费。
算规格。 计算节点个数 设置当前版本模型的实例个数。如果节点个数设置为1,表示后台的计算模式是单机模式;如果节点个数设置大于1,表示后台的计算模式为分布式的。请根据实际编码情况选择计算模式。 服务自动停止 当新建应用时,服务部署方式选择“在线部署”时,设置服务自动停止的时间,在线
elArts创建的专属资源池。 计算节点个数 设置当前版本模型的实例个数。如果节点个数设置为1,表示后台的计算模式是单机模式;如果节点个数设置大于1,表示后台的计算模式为分布式的。请根据实际编码情况选择计算模式。 服务自动停止 设置服务自动停止的时间,在线服务运行状态在所选的时间点后自动停止,同时在线服务也停止计费。
算规格。 计算节点个数 设置当前版本模型的实例个数。如果节点个数设置为1,表示后台的计算模式是单机模式;如果节点个数设置大于1,表示后台的计算模式为分布式的。请根据实际编码情况选择计算模式。 服务自动停止 当新建应用时,服务部署方式选择“在线部署”时,设置服务自动停止的时间,在线
必须执行发布操作后,才能应用于模型开发或训练。 数据集版本,默认按V001、V002递增规则进行命名,您也可以在发布时自定义设置。 您可以将任意一个版本设置为当前目录,即表示数据集列表中进入的数据集详情,为此版本的数据及标注信息。 针对每一个数据集版本,您可以通过“存储路径”参数
请参考示例判断需添加的文件属于哪一种模式。 “文本与标签分隔符”:可设置为“Tab键”、“空格”、“分号”、“逗号”或“其他”。选择“其他”时,可以在右侧文本框中输入对应的分隔符。 “多标签分隔符”:可设置为“Tab键”、“空格”、“分号”、“逗号”或“其他”。选择“其他”时,可以在右侧文本框中输入对应的分隔符。
中,真正实现赋能行业AI 应用开发者,全面提升行业AI 开发效率和落地效果。 图1 功能架构 应用开发 应用开发面向企业和行业用户开放,提供特定行业场景的预置行业工作流,用户基于自身行业、场景的需求,快速自定制需求,根据工作流指引进行应用开发。当前ModelArts Pro开放的预置套件有