检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
Pro是为企业级AI应用打造的专业开发套件。基于华为云的先进算法和快速训练能力,提供预置工作流和模型,提升企业AI应用的开发效率,降低开发难度。当前ModelArts Pro开放了文字识别套件、自然语言处理套件、视觉套件、HiLens套件,详细介绍请见产品介绍。用户基于自身行业、场景的需求,快速自
在“数据标注”页面,会显示自动标注的进度,如果自动标注完成,标注进度为100%。 图1 自动标注完成。 标注完成后,您可以单击“标注结果确认”中的“前往确认”,进入标注概览页。 在标注概览页单击右上方的“开始标注”,进入手动标注数据页面,针对“已标注”的数据进行核对和检查。针对标注错误的数据修改标注。
训练模型输出的模型存储在指定的OBS中。 部署应用 将存储在OBS中的应用部署上线为在线服务。 视觉套件 视觉套件使用过程中依赖对象存储服务(Object Storage Service,OBS)、ModelArts服务和华为HiLens服务的使用,依赖服务会产生相应的费用。 视觉
训练模型输出的模型存储在指定的OBS中。 部署应用 将存储在OBS中的应用部署上线为在线服务。 视觉套件 视觉套件使用过程中依赖对象存储服务(Object Storage Service,OBS)、ModelArts服务和华为HiLens服务的使用,依赖服务会产生相应的费用。 视觉
检查不同标签的样本数是否均衡,建议不同标签的样本数量级相同,并尽量接近,如果有的类别数据量很高,有的类别数据量较低,会影响模型整体的识别效果。 如果分割效果不好,建议检测图片标注,标注质量的好坏直接影响模型训练图像分割效果的好坏。 根据数据量选择适当的学习率和训练轮次。 通过
如果之前的版本还没开发完,会弹出“开发新版本”提示框,单击“确认”,进入新版本的开发页面。 图1 开发新版本 在新版本的应用开发页面,您可以基于上一版本的工作流配置,更新工作流开发的各个步骤,重新部署服务。 模型如何提升效果 检查是否存在训练数据过少的情况,建议每个标签的样本数不
文字识别套件基于丰富的文字识别算法和行业知识积累,帮助客户快速构建满足不同业务场景需求的文字识别服务,实现多种版式图像的文字信息结构化提取。 文字识别套件的介绍请参见产品介绍。 预置工作流 文字识别套件当前提供了单模板工作流和多模板工作流,自主构建文字识别模板,识别模板图片中的文字,提供高
训练分类器 确定模板图片的参照字段和识别区后,多模板分类工作流在模板数量较多,或版式相似度较高的情况下,建议针对不同的模板上传对应的训练集数据,用于训练模板分类模型,使服务能够精准地分类多个模板图片,然后对多个模板图片进行文字识别和结构化提取。 前提条件 已在文字识别套件控制台选
Pro为企业级AI应用打造的专业开发套件,套件基于华为云的先进算法和快速训练能力,提供预置工作流和模型,通过工作流指引能够快速开发AI应用,解决具体行业场景问题。 ModelArts Pro应用开发套件包括自然语言处理套件、文字识别套件等,能够快速响应不同行业、不同场景的AI落地需求。 工作流
详细指导 选择视觉套件 根据您的实际使用需求选择视觉套件。您也可以通过查看工作流定位所需使用的套件。 在ModelArts Pro控制台界面,单击“视觉套件”卡片的“进入套件”,进入视觉套件控制台。 新建应用 基于预置的工作流新建应用,填写应用基本信息和工作流。 新建应用 开发应用
评估应用 确定模板图片的参照字段和识别区后,需要对模板图片进行评估和考察。您可以通过上传测试图片,在线评估模板的识别情况,保证能正确识别同样模板下其他图片中的识别区文字。 前提条件 已在文字识别套件控制台选择“通用单模板工作流”新建应用,并完成框选识别区步骤,详情请见框选识别区。
部署服务后,调用API失败怎么办? 在ModelArts Pro使用预置工作流部署服务后,可通过调用API和SDK调用已部署的在线服务。如果调用API失败,可根据返回的错误码及错误信息解决问题,具体的错误码说明请见表1。 表1 API调用指导 行业套件 调用API方法 错误码 文字识别套件 OCR_API参考
申请公测操作完成后,单击“前往我的公测”,进入“我的公测”页面。当“审批状态”显示为“审批通过”时,表示您已经获得了该行业套件的公测权限。 申请行业套件的公测权限后,即可进入套件使用相关功能。 进入套件 登录ModelArts Pro控制台,选择行业套件卡片并单击“进入套件”,即可进入行业套件的控制台。
创建名称为“training-data-out”的文件夹用于存放输出的数据集。 创建名称为“sku-data-in”的文件夹用于存放SKU数据集。 创建名称为“sku-data-out”的文件夹用于存放输出的SKU数据集。 创建OBS桶和文件夹的操作指导请参见创建桶和新建文件夹。为保证数据能正常访
训练得到模型之后,整个开发过程还不算结束,需要对模型进行评估和考察。 一些常用的指标,如精准率、召回率、F1值等,能帮助您有效的评估,最终获得一个满意的模型。 评估模型 部署服务 模型准备完成后,您可以部署服务,用于分类自己所上传的文字内容,也可直接调用对应的API。 部署服务 父主题: 多语种文本分类工作流
模型训练的数据,上传至OBS中。 准备数据 选择数据 在使用通用文本分类工作流开发应用时,您需要新建或导入训练数据集,后续训练模型操作是基于您选择的训练数据集。 选择数据 标注数据(可选) 由于模型训练过程需要大量有标签的数据,如果开发应用时,上传的训练数据集是未标注的,需要对数据集中的数据进行标注。
Browser+是一个比较常用的图形化工具,支持完善的桶管理和对象管理操作。推荐使用此工具创建桶或上传对象。obsutil是一款用于访问管理OBS的命令行工具,对于熟悉命令行程序的用户,obsutil是执行批量处理、自动化任务较好的选择。 如果您的业务环境需要通过API或SDK执
在“数据标注”页面,会显示自动标注的进度,如果自动标注完成,标注进度为100%。 图1 自动标注完成。 标注完成后,您可以单击“标注结果确认”中的“前往确认”,进入标注概览页。 在标注概览页单击右上方的“开始标注”,进入手动标注数据页面,针对“已标注”的数据进行核对和检查。针对标注错误的数据修改标注。
训练得到模型之后,整个开发过程还不算结束,需要对模型进行评估和考察。一次性很难获得一个满意的模型,需要反复的调整算法参数、数据,不断评估训练生成的模型。 一些常用的指标,如精准率、召回率、F1值等,能帮助您有效的评估,最终获得一个满意的模型。 前提条件 已在ModelArts Pro控制
Browser+是一个比较常用的图形化工具,支持完善的桶管理和对象管理操作。推荐使用此工具创建桶或上传对象。obsutil是一款用于访问管理OBS的命令行工具,对于熟悉命令行程序的用户,obsutil是执行批量处理、自动化任务较好的选择。 如果您的业务环境需要通过API或SDK执