检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
待新建的数据集名称。 描述 数据集简要描述。 数据集输入位置 训练数据存储至OBS的位置。 单击“数据集输入位置”右侧输入框,在弹出的“数据集输入位置”对话框中,选择“OBS桶”和“文件夹”,然后单击“确定”。 数据集输出位置 待新建的数据集存储至OBS的位置。 待新建的数据集有
模型训练完成后,可在“模型训练”页面查看“训练详情”,包括“准确率变化情况”和“误差变化”。 图2 训练详情 模型如何提升效果 检查是否存在训练数据过少的情况,建议每个标签的样本数不少于100个,如果低于这个量级建议扩充。 检查不同标签的样本数是否均衡,建议不同标签的样本数量级相同,并尽量接近,如果有的类别数据
对经过“预处理”的文字进行关键字符提取。 在输入框中填写查找关键字符的正则表达式。 不填写时,默认提取全部字段。 如果需要多个提取规则,单击新增提取规则。提取时按从上到下优先级规则提取,选择第一个非空的提取内容作为提取后的内容。 后处理 根据实际情况,对经过“提取”后的文字进行“后处理”。
对经过“预处理”的文字进行关键字符提取。 在输入框中填写查找关键字符的正则表达式。 不填写时,默认提取全部字段。 如果需要多个提取规则,单击新增提取规则。提取时按从上到下优先级规则提取,选择第一个非空的提取内容作为提取后的内容。 后处理 根据实际情况,对经过“提取”后的文字进行“后处理”。
通用文本分类工作流 工作流介绍 准备数据 选择数据 标注数据 训练模型 评估模型 部署服务 发布数据集 管理数据集版本 父主题: 自然语言处理套件
编辑应用 对于已经创建的模板应用,您可以修改模板的配置信息以匹配业务变化。 前提条件 已存在创建的模板应用。 编辑模板配置信息 登录“ModelArts Pro>文字识别套件”控制台。 默认进入“应用开发>工作台”页面。 在“我的应用”页签下,选择应用并单击“操作”列的“查看”。 进入“应用资产”页面。
编辑应用 对于已经创建的模板应用,您可以修改模板的配置信息以匹配业务变化。 前提条件 已存在创建的模板应用。 编辑模板配置信息 登录“ModelArts Pro>文字识别套件”控制台。 默认进入“应用开发>工作台”页面。 在“我的应用”页签下,选择应用并单击“操作”列的“查看”。 进入“应用资产”页面。
训练得到模型之后,整个开发过程还不算结束,需要对模型进行评估和考察。 一些常用的指标,如精准率、召回率、F1值等,能帮助您有效的评估,最终获得一个满意的模型。 评估模型 部署服务 模型准备完成后,您可以部署服务,用于分类自己所上传的文字内容,也可直接调用对应的API。 部署服务 父主题: 多语种文本分类工作流
数据集输入位置 训练数据存储至OBS的位置。 单击“数据集输入位置”右侧输入框,在弹出的“数据集输入位置”对话框中,选择“OBS桶”和“文件夹”,然后单击“确定”。 数据集输出位置 待新建的数据集存储至OBS的位置。 单击“数据集输出位置”右侧的“修改”,在弹出的“数据集输出位置”对话框中
标注数据 由于模型训练过程需要大量有标签的数据,如果开发应用时,上传的训练数据集是未标注的,需要对数据集中的数据进行标注。 针对文本分类场景,是对文本的内容按照标签进行分类处理,标签名是由中文、大小写字母、数字、中划线或下划线组成,且不超过32位的字符串。 进入数据标注页面 在“数据
Browser+是一个比较常用的图形化工具,支持完善的桶管理和对象管理操作。推荐使用此工具创建桶或上传对象。obsutil是一款用于访问管理OBS的命令行工具,对于熟悉命令行程序的用户,obsutil是执行批量处理、自动化任务较好的选择。 如果您的业务环境需要通过API或SDK执
定义预处理 上传模板图片后,需要对模板图片进行预处理,保留图片的关键内容,去掉冗余部分,保持图片内容清晰可见,保证模型识别的准确性。 定义预处理 框选参照字段 在图片模板中框选参照字段,用于矫正图片的方向,进而在正确的方向上,识别图片中的结构化信息。 框选参照字段 框选识别区 在图片模板中
训练得到模型之后,整个开发过程还不算结束,需要对模型进行评估和考察。 一些常用的指标,如精准率、召回率、F1值等,能帮助您有效的评估,最终获得一个满意的模型。 评估模型 部署服务 模型准备完成后,您可以部署服务,用于分类自己所上传的文字内容,也可直接调用对应的API。 部署服务 父主题: 通用实体抽取工作流
Browser+是一个比较常用的图形化工具,支持完善的桶管理和对象管理操作。推荐使用此工具创建桶或上传对象。obsutil是一款用于访问管理OBS的命令行工具,对于熟悉命令行程序的用户,obsutil是执行批量处理、自动化任务较好的选择。 如果您的业务环境需要通过API或SDK执
GiB”,适合纯CPU类型的负载运行的模型。 如果资源池选择专属资源池,勾选自己在ModelArts创建的专属资源池。 计算节点个数 设置当前版本模型的实例个数。如果节点个数设置为1,表示后台的计算模式是单机模式;如果节点个数设置大于1,表示后台的计算模式为分布式的。请根据实际编码情况选择计算模式。
待新建的数据集名称。 描述 数据集简要描述。 数据集输入位置 训练数据存储至OBS的位置。 单击“数据集输入位置”右侧输入框,在弹出的“数据集输入位置”对话框中,选择“OBS桶”和“文件夹”,然后单击“确定”。 数据集输出位置 待新建的数据集存储至OBS的位置。 待新建的数据集有
SKU名称 输入SKU的名称。 SKU单品图 在本地选择提前准备好的SKU单品图,后续存储至OBS中。 单击“SKU单品图”右侧的“上传图片”,在本地选择图片,可选择多个图片。 说明: 文件放置方式请按照“单品文件夹/单品图”或者“父文件夹/单品文件夹/单品图”的组织方式,选择单品文件夹或者父文件夹,平台将自动生成单品。
并查看训练的模型准确率和误差的变化。 训练模型 评估模型 训练得到模型之后,整个开发过程还不算结束,需要对模型进行评估和考察。 评估结果包括一些常用的指标,如精准率、召回率、F1值等,并且同时启动一个在线测试服务,供您模拟在线测试,帮助您有效评估模型,最终获得一个满意的模型。 评估模型
统自动旋转文字方向不正确的图片,保持图片中的文字方向正确。 单击预处理区域左上方的操作图标,调整模板图片的大小、方向等。 :单击图标重置图片为初始状态,即未进行任何处理的状态。 :单击图标,在“图片裁剪”窗口调整图片裁剪范围,然后单击“裁剪”,调整图片的大小。 :单击图标,在“图
统自动旋转文字方向不正确的图片,保持图片中的文字方向正确。 单击预处理区域左上方的操作图标,调整模板图片的大小、方向等。 :单击图标重置图片为初始状态,即未进行任何处理的状态。 :单击图标,在“图片裁剪”窗口调整图片裁剪范围,然后单击“裁剪”,调整图片的大小。 :单击图标,在“图