检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
文字识别套件使用简介 ModelArts Pro 是为企业级AI应用打造的专业开发套件。基于华为云的先进算法和快速训练能力,提供预置工作流和模型,提升企业AI应用的开发效率,降低开发难度。文字识别套件基于丰富的文字识别算法和行业知识积累,帮助客户快速构建满足不同业务场景需求的文字
参照字段是文字内容、位置固定不变的文本框区域。 建议选取图片中不会重复出现的文字作为参照字段,否则影响模板匹配效果。 参照字段为单行文本框,不可以框选竖版文字或跨行框选。 框选参照字段个数须不少于4个,并尽量分散在图片的四周。 参考字段尽量框选独立文本块,避免框选某一个文本块的一部分,有利于识别精度提升。
编辑应用 对于已经创建的模板应用,您可以修改模板的配置信息以匹配业务变化。 前提条件 已存在创建的模板应用。 编辑模板配置信息 登录“ModelArts Pro>文字识别套件”控制台。 默认进入“应用开发>工作台”页面。 在“我的应用”页签下,选择应用并单击“操作”列的“查看”。
如何上传数据至OBS? 使用ModelArts Pro进行应用开发时,您需要将数据上传至对象存储服务(OBS)桶中。您可以登录OBS管理控制台创建OBS桶,并在您创建的OBS桶中创建文件夹,然后再进行数据的上传,OBS上传数据的详细操作请参见《对象存储服务快速入门》。 您在创建O
工作流介绍 工作流简介 功能介绍 支持用户自定义多个文字识别模板,通过模型训练,自动识别图片所需使用的模板,从而支持从大量不同板式图像中提取结构化信息。 适用场景 用户认证识别 识别证件中关键信息,节省人工录入,提升效率,降低用户实名认证成本,准确快速便捷。 快递单自动填写 识别
多模板分类工作流 工作流介绍 上传模板图片 定义预处理 框选参照字段 框选识别区 训练分类器 评估应用 部署服务 编辑应用 自定义字段类型 删除应用 父主题: 文字识别套件
KU,即商品各类单品的图片,方便后续针对数据集中的数据进行自动标注。 前提条件 新建训练数据需要获取访问OBS权限,在未进行委托授权之前,无法使用此功能。您需要提前获得OBS授权,详情请见配置访问授权。 需要提前准备好SKU数据,即商品各类单品的图片。可存储至本地,也可以提前上传至OBS。
本样例不提供具体的样例数据,仅提供样例数据要求。 本样例使用已标注数据训练模型,数据集要求如下: 文件格式要求为txt或者csv,文件大小不能超过8MB。 以换行符作为分隔符,每行数据代表一个标注对象。 每个分类标签需要准备5个及以上数据,为了训练出效果较好的模型,建议每个分类标签准备100个以上的数据。
文字识别套件 文字识别套件基于丰富的文字识别算法和行业知识积累,帮助客户快速构建满足不同业务场景需求的文字识别服务,实现多种版式图像的文字信息结构化提取。 文字识别套件当前提供了单模板工作流和多模板工作流,自主构建文字识别模板,识别模板图片中的文字,提供高精度的文字识别模型,保证结构化信息提取精度。
自定义字段类型 在应用开发过程中“框选识别区”时会选择“字段类型”,如您框选的文字内容是数字,可选择默认字段类型“数字”。 如果“默认字段类型”不能满足您的业务需求,您可以创建新的字段类型。 前提条件 已在文字识别套件控制台选择“多模板分类工作流”新建应用,详情请见新建应用。 操作步骤
自定义字段类型 在应用开发过程中“框选识别区”时会选择“字段类型”,如您框选的文字内容是数字,可选择默认字段类型“数字”。 如果“默认字段类型”不能满足您的业务需求,您可以创建新的字段类型。 前提条件 已在文字识别套件控制台选择“通用单模板工作流”新建应用,详情请见新建应用。 操作步骤
行业套件介绍 文字识别套件基于丰富的文字识别算法和行业知识积累,帮助客户快速构建满足不同业务场景需求的文字识别服务,实现多种版式图像的文字信息结构化提取。 文字识别套件的介绍请参见产品介绍。 预置工作流 文字识别套件当前提供了单模板工作流和多模板工作流,自主构建文字识别模板,识别
训练模型 选择训练数据后,基于已标注的训练数据,选择预训练模型、配置参数,用于训练文本分类模型。 前提条件 已在自然语言处理套件控制台选择“通用文本分类工作流”新建应用,并选择训练数据集,详情请见选择数据。 训练模型 图1 模型训练 在“模型训练”页面,勾选模型训练所使用的“预训
训练模型 选择训练数据后,基于已标注的训练数据,选择预训练模型、配置参数,用于训练文本分类模型。 前提条件 已在自然语言处理套件控制台选择“多语种文本分类工作流”新建应用,并选择训练数据集,详情请见选择数据。 训练模型 图1 模型训练 在“模型训练”页面,勾选模型训练所使用的“预
行业套件介绍 自然语言处理套件为客户提供自然语言处理的自定制工具,旨在帮助客户高效地构建行业、领域的高精度文本处理模型,可应用于政府、金融、法律等行业。 预置工作流 自然语言处理套件当前提供了通用文本分类工作流、多语种文本分类工作流和通用实体抽取工作流,提供高精度文本分类预测模型
功能总览 功能总览 全部 ModelArts Pro 资源池 工作流 应用管理 文字识别套件 自然语言处理套件 视觉套件 HiLens套件 共享带宽 共享流量包 带宽加油包 VPC对等连接 VPC对等连接 VPC对等连接 VPC对等连接 VPC对等连接 VPC对等连接 VPC对等连接
改”,在弹出的“数据集输出位置”对话框中,选择“OBS桶”和“文件夹”,然后单击“确定”。 说明: “数据集输出位置”不能与“数据集输入位置”为同一路径,且不能是“数据集输入位置”的子目录。“数据集输出位置”建议选择一个空目录。 新建训练数据集后,勾选当前应用开发所需的训练数据集。
改”,在弹出的“数据集输出位置”对话框中,选择“OBS桶”和“文件夹”,然后单击“确定”。 说明: “数据集输出位置”不能与“数据集输入位置”为同一路径,且不能是“数据集输入位置”的子目录。“数据集输出位置”建议选择一个空目录。 新建训练数据集后,勾选当前应用开发所需的训练数据集。
改”,在弹出的“数据集输出位置”对话框中,选择“OBS桶”和“文件夹”,然后单击“确定”。 说明: “数据集输出位置”不能与“数据集输入位置”为同一路径,且不能是“数据集输入位置”的子目录。“数据集输出位置”建议选择一个空目录。 新建训练数据集后,勾选当前应用开发所需的训练数据集。
单击“数据集输出位置”右侧的“修改”,在弹出的“数据集输出位置”对话框中,选择“OBS桶”和“文件夹”,然后单击“确定”。 说明: “数据集输出位置”不能与“数据集输入位置”为同一路径,且不能是“数据集输入位置”的子目录。“数据集输出位置”建议选择一个空目录。 添加标签集 添加标签名称,选择标签颜色。 在文本框