检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
自然语言处理套件提供文本分类项目的通用工作流,仅适用于中文文本的分类场景,支持单标签分类和多标签分类。 已发布北京四区域 通用文本分类工作流 OBS 2.0支持多语种文本分类工作流 自然语言处理套件提供多语种文本分类项目的通用工作流,支持包括英语,法语,德语,西班牙语,葡萄牙语,阿拉伯
针对场景领域提供预训练模型,分类准确率高。 提供完善的文本处理能力,支持多种数据格式内容,适配不同场景的业务数据。 可根据使用过程中的反馈持续优化模型。 多语种文本分类工作流 功能介绍 支持自主上传多语种文本数据,构建高精度文本分类预测模型,此工作流支持文本分类的语种包括英语、法语、德
低,会影响模型整体的识别效果。 选择适当的学习率和训练轮次。 通过详细评估中的错误识别示例,有针对性地扩充训练数据。 后续操作 更新版本后,您可以在“应用详情”页的开发版本列表查看当前应用各个版本的“版本名称”、“进展”、“模型精准率”、“模型召回率”、“F1值”、“更新时间”和可执行的“操作”。
Pro的应用场景和用户群体 ModelArts Pro基于华为云的先进算法和快速训练能力,提供预置工作流和模型。用户可以使用ModelArts Pro套件中特定行业场景的预置行业工作流,满足快速定制的需求,快速进行应用开发。 当前ModelArts Pro开放的预置套件有文字识别套件、自然语言处理套件和视觉套件。
在“应用详情”页的“历史版本”页签下,可以查看当前应用各个版本的“版本名称”、“进展”、“模型精准率”、“模型召回率”、“F1值”、“更新时间”和可执行的“操作”。 图3 历史版本 查看应用资产 在“应用详情”页的“应用资产”页签下,可以查看当前应用的资产信息,比如通用文本分类工作流中的资产信息就是训练数据集,您可
图3 零售场景 物流场景 物流场景需要处理各种格式的票据图片,用户可以通过简单的标注生成自己的专属模板,实现关键字段的自动识别和提取。 特点:对各种格式的票据图片,可制作模板实现关键字段的自动识别和提取。 优势:支持不同格式票据图片的自动识别和结构化提取。通过可视化界面操作,轻松指
“公共资源池”:提供公共的大规模计算集群,资源按作业隔离。您可以按需选择不同的资源类型。 “专属资源池”:提供独享的计算资源,不与其他用户共享,更加高效。使用专属资源池需要在ModelArts创建专属资源池。 计算节点规格 请根据界面提示选择需要使用的规格。 计算节点个数 设置当前版本模型的实例个
文本数据至少包含2个及以上的标签。每个分类标签需要准备5个及以上数据,为了训练出效果较好的模型,建议每个分类标签准备100个以上的数据。 多语种文本分类工作流仅支持对单语种的文本分类,当前支持文本分类的语种包括英语、法语、德语、西班牙语、葡萄牙语、阿拉伯语等。暂不支持对同一文本中含多语种的文本进行分类训练。
检查是否存在训练数据过少的情况,建议每个类别的图片量不少于100个,如果低于这个量级建议扩充。 检查不同标签的样本数是否均衡,建议不同标签的样本数量级相同,并尽量接近,如果有的类别数据量很高,有的类别数据量较低,会影响模型整体的识别效果。 选择适当的学习率和训练轮次。 通过详细评估中的错误识别示例,有针对性地扩充训练数据。
检查是否存在训练数据过少的情况,建议每个类别的图片量不少于100个,如果低于这个量级建议扩充。 检查不同标签的样本数是否均衡,建议不同标签的样本数量级相同,并尽量接近,如果有的类别数据量很高,有的类别数据量较低,会影响模型整体的识别效果。 选择适当的学习率和训练轮次。 通过详细评估中的错误识别示例,有针对性地扩充训练数据。
检查是否存在训练数据过少的情况,建议每个类别的图片量不少于100个,如果低于这个量级建议扩充。 检查不同标签的样本数是否均衡,建议不同标签的样本数量级相同,并尽量接近,如果有的类别数据量很高,有的类别数据量较低,会影响模型整体的识别效果。 选择适当的学习率和训练轮次。 通过详细评估中的错误识别示例,有针对性地扩充训练数据。
检查是否存在训练数据过少的情况,建议每个类别的图片量不少于100个,如果低于这个量级建议扩充。 检查不同标签的样本数是否均衡,建议不同标签的样本数量级相同,并尽量接近,如果有的类别数据量很高,有的类别数据量较低,会影响模型整体的识别效果。 选择适当的学习率和训练轮次。 通过详细评估中的错误识别示例,有针对性地扩充训练数据。
检查是否存在训练数据过少的情况,建议每个类别的图片量不少于100个,如果低于这个量级建议扩充。 检查不同标签的样本数是否均衡,建议不同标签的样本数量级相同,并尽量接近,如果有的类别数据量很高,有的类别数据量较低,会影响模型整体的识别效果。 选择适当的学习率和训练轮次。 通过详细评估中的错误识别示例,有针对性地扩充训练数据。
训练得到模型之后,整个开发过程还不算结束,需要对模型进行评估和考察。 一些常用的指标,如精准率、召回率、F1值等,能帮助您有效的评估,最终获得一个满意的模型。 评估模型 部署服务 模型准备完成后,您可以部署服务,用于分类自己所上传的文字内容,也可直接调用对应的API。 部署服务 父主题: 通用实体抽取工作流
充。 检查不同标签的样本数是否均衡,建议不同标签的样本数量级相同,并尽量接近,如果有的类别数据量很高,有的类别数据量较低,会影响模型整体的识别效果。 如果分割效果不好,建议检测图片标注,标注质量的好坏直接影响模型训练图像分割效果的好坏。 根据数据量选择适当的学习率和训练轮次。 通
工作流简介 观察云的外部形状,即云的外形特征、结构特点和云底高度,对预测天气变化有重要的影响。ModelArts Pro提供云状识别工作流,为您提供高精度的云状识别算法,通过云的外部形状预测天气变化。 功能介绍 支持上传多种云状图数据,构建云状的识别模型,用于高精度识别云的外部形状,进而用于气象预测工作。
和识别区、上传训练集,自动训练并生成模板分类器和文字识别模型,并将生成的模型部署为在线服务。部署完成后,用户可通过在线服务自动分类模板并识别模板中的文字。 首先,请仔细阅读准备工作罗列的要求,提前完成准备工作。使用多模板分类工作流开发应用的步骤如下所示: 步骤1:准备数据 步骤2:新建应用
Pro控制台界面,单击“自然语言处理”套件卡片的“进入套件”。 进入自然语言处理套件控制台。 在左侧导航栏选择“应用开发>工作台”。 默认进入“我的应用”页签。 图1 工作台 在“我的应用”页签下,单击“新建应用”。 进入“新建应用”页面。 图2 新建应用 您也可以单击“我的工作流”,切换至“我的工作流”页签,选择工作流并单击卡片中的“新建应用”。
自然语言处理套件 行业套件介绍 新建应用 通用文本分类工作流 多语种文本分类工作流 通用实体抽取工作流 更新应用版本 查看应用详情 监控应用 删除应用
您也可以在“应用开发”页签下,单击左上角版本号右侧的“更新版本”,重新编辑应用开发的配置信息,将更新的应用设置成新的版本。 查看应用历史版本 在“历史版本”页签下,可以查看当前应用各个版本的“版本名称”、“进展”、“模型精准率”、“模型召回率”、“F1值”、“更新时间”和可执行的“操作”。 图1 历史版本