检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
如何访问ModelArts Pro 云服务平台提供了提供了管理控制台的管理方式。 ModelArts Pro提供了简洁易用的管理控制台,包括自然语言处理、视觉AI、文字识别、语音识别等应用开发功能,您可以在管理控制台端到端完成您的AI应用开发。 使用ModelArts Pro管理控制台
训练能力,提供预置工作流和模型,通过工作流指引能够快速开发AI应用,解决具体行业场景问题。 ModelArts Pro应用开发套件包括自然语言处理套件、文字识别套件等,能够快速响应不同行业、不同场景的AI落地需求。 工作流 工作流指在具体行业场景下固定开发流程所构建的开发流水线,
训练分类器的数据集要求将图片放在一个目录里,并压缩成zip文件,文件大小不应大于10M。 自然语言处理套件 自然语言处理套件使用开发应用时,需要上传文本数据用于模型训练。 数据集要求如表2所示。 表2 自然语言处理套件数据集要求 工作流 数据集要求 通用文本分类工作流 文件格式要求为txt或
)页面,服务会自动开通。 在子用户已经具备OCR权限,并开通ModelArts Pro后,如果仍然无法调用,请检查子用户是否有“编程访问权限”。 图2 编程访问权限
OBS 2.0支持自然语言处理套件 自然语言处理套件为客户提供自然语言处理的自定制工具,旨在帮助客户高效地构建行业、领域的高精度文本处理模型,可应用于政府、金融、法律等行业。 已发布北京四区域 自然语言处理套件 OBS 2.0支持通用文本分类工作流 自然语言处理套件提供文本分类项
应用开发套件 文字识别套件 自然语言处理套件 视觉套件 HiLens套件
具体的错误码说明请见表1。 表1 API调用指导 行业套件 调用API方法 错误码 文字识别套件 OCR_API参考 OCR错误码 自然语言处理套件 NLP_API参考 NLP错误码 视觉套件 Image_API参考 Image错误码
申请行业套件的公测权限后,在ModelArts Pro控制台选择行业套件卡片并单击“进入套件”,即可进入行业套件的控制台。 例如单击自然语言处理套件卡片的“进入套件”,即可进入自然语言处理套件的控制台。 图1 进入套件 配置访问权限 在您使用ModelArts Pro过程中,ModelArts Pr
OBS Browser+ 通过OBS Browser+创建桶 obsutil 通过obsutil创建桶 SDK 使用SDK创建桶,具体参考各语言开发指南的创建桶章节 API 通过API创建桶 上传对象 桶创建成功后,您可以通过以下多种方式将文件上传至桶,OBS最终将这些文件以对象的形式存储在桶中。
训练分类器 确定模板图片的参照字段和识别区后,多模板分类工作流在模板数量较多,或版式相似度较高的情况下,建议针对不同的模板上传对应的训练集数据,用于训练模板分类模型,使服务能够精准地分类多个模板图片,然后对多个模板图片进行文字识别和结构化提取。 前提条件 已在文字识别套件控制台选
评估应用 训练模板分类模型后,需要对模板分类器和模板图片进行评估和考察。您可以通过上传测试图片,在线评估模板分类情况和模板的文字识别情况,保证能在多个模板情况下正确分类测试图片的模板,并且能正确识别测试图片中的识别区文字。 前提条件 已在文字识别套件控制台选择“多模板分类工作流”
上传模板图片 在使用多模板分类工作流开发应用之前,必须要明确文字识别的模板类型,明确以哪几种板式图片作为模板训练文字识别模型,基于自己的业务需求制定针对性的文字识别模型。例如上传两种不同格式的发票图片作为模板,训练的文字识别模型就能识别并提取这两种格式发票上的关键字段。 前提条件
使用多模板工作流开发应用 ModelArts Pro的文字识别套件提供了多模板工作流,通过工作流指引支持自定义多个文字识别模板,通过模型训练,自动识别图片所属模板,从而支持从大量不同板式图像中提取结构化信息。 本章节提供一个票证类型的样例,帮助您快速熟悉使用文字识别套件中的多模板
编辑应用 对于已经创建的模板应用,您可以修改模板的配置信息以匹配业务变化。 前提条件 已存在创建的模板应用。 编辑模板配置信息 登录“ModelArts Pro>文字识别套件”控制台。 默认进入“应用开发>工作台”页面。 在“我的应用”页签下,选择应用并单击“操作”列的“查看”。
工作流介绍 工作流简介 功能介绍 支持用户自定义多个文字识别模板,通过模型训练,自动识别图片所需使用的模板,从而支持从大量不同板式图像中提取结构化信息。 适用场景 用户认证识别 识别证件中关键信息,节省人工录入,提升效率,降低用户实名认证成本,准确快速便捷。 快递单自动填写 识别
多模板分类工作流 工作流介绍 上传模板图片 定义预处理 框选参照字段 框选识别区 训练分类器 评估应用 部署服务 编辑应用 自定义字段类型 删除应用 父主题: 文字识别套件
行业套件介绍 文字识别套件基于丰富的文字识别算法和行业知识积累,帮助客户快速构建满足不同业务场景需求的文字识别服务,实现多种版式图像的文字信息结构化提取。 文字识别套件的介绍请参见产品介绍。 预置工作流 文字识别套件当前提供了单模板工作流和多模板工作流,自主构建文字识别模板,识别
HiLens套件(使用HiLens安全帽检测技能开发可训练技能) ModelArts Pro的HiLens套件提供了安全帽检测技能,通过工作流指引支持自主上传数据集,零代码构建安全帽检测技能,并一键下发到端侧设备HiLens Kit;针对难例数据,可快速迭代更新技能,提升精度。
框选识别区 在文字识别过程中,需要确定图片中识别的文字位置,这就需要在图片模板中框选识别区。 识别区指图片中待识别的文字位置。所有需要识别的图片中都会包含此识别区的字段,且位置固定不变,因此模型可以通过识别区找到需要识别内容的位置。 前提条件 已在文字识别套件控制台选择“多模板分