检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
Pro ModelArts Pro 是为企业级AI应用打造的专业开发套件。基于华为云的先进算法和快速训练能力,提供预置工作流和模型,提升企业AI应用的开发效率,降低开发难度。同时,支持客户自主进行工作流编排,快速实现应用的开发、共享和发布,共建开放生态,实现普惠行业AI落地。 ModelArts
如果之前的版本还没开发完,会弹出“开发新版本”提示框,单击“确认”,进入新版本的开发页面。 图1 开发新版本 在新版本的应用开发页面,您可以基于上一版本的工作流配置,更新工作流开发的各个步骤,重新部署服务。 模型如何提升效果 检查是否存在训练数据过少的情况,建议每个标签的样本数不
检查不同标签的样本数是否均衡,建议不同标签的样本数量级相同,并尽量接近,如果有的类别数据量很高,有的类别数据量较低,会影响模型整体的识别效果。 如果分割效果不好,建议检测图片标注,标注质量的好坏直接影响模型训练图像分割效果的好坏。 根据数据量选择适当的学习率和训练轮次。 通过
训练分类器 确定模板图片的参照字段和识别区后,多模板分类工作流在模板数量较多,或版式相似度较高的情况下,建议针对不同的模板上传对应的训练集数据,用于训练模板分类模型,使服务能够精准地分类多个模板图片,然后对多个模板图片进行文字识别和结构化提取。 前提条件 已在文字识别套件控制台选
文字识别套件基于丰富的文字识别算法和行业知识积累,帮助客户快速构建满足不同业务场景需求的文字识别服务,实现多种版式图像的文字信息结构化提取。 文字识别套件的介绍请参见产品介绍。 预置工作流 文字识别套件当前提供了单模板工作流和多模板工作流,自主构建文字识别模板,识别模板图片中的文字,提供高
创建名称为“training-data-out”的文件夹用于存放输出的数据集。 创建名称为“sku-data-in”的文件夹用于存放SKU数据集。 创建名称为“sku-data-out”的文件夹用于存放输出的SKU数据集。 创建OBS桶和文件夹的操作指导请参见创建桶和新建文件夹。为保证数据能正常访
评估应用 确定模板图片的参照字段和识别区后,需要对模板图片进行评估和考察。您可以通过上传测试图片,在线评估模板的识别情况,保证能正确识别同样模板下其他图片中的识别区文字。 前提条件 已在文字识别套件控制台选择“通用单模板工作流”新建应用,并完成框选识别区步骤,详情请见框选识别区。
部署服务后,调用API失败怎么办? 在ModelArts Pro使用预置工作流部署服务后,可通过调用API和SDK调用已部署的在线服务。如果调用API失败,可根据返回的错误码及错误信息解决问题,具体的错误码说明请见表1。 表1 API调用指导 行业套件 调用API方法 错误码 文字识别套件 OCR_API参考
申请公测操作完成后,单击“前往我的公测”,进入“我的公测”页面。当“审批状态”显示为“审批通过”时,表示您已经获得了该行业套件的公测权限。 申请行业套件的公测权限后,即可进入套件使用相关功能。 进入套件 登录ModelArts Pro控制台,选择行业套件卡片并单击“进入套件”,即可进入行业套件的控制台。
试资源部署”,即用于数据处理、模型训练和在线测试的资源池和资源类型。 资源池可选“公共资源池”和“专属资源池”。 “公共资源池”:提供公共的大规模计算集群,资源按作业隔离。您可以按需选择不同的资源类型。 “专属资源池”:提供独享的计算资源,不与其他用户共享,更加高效。使用专属资源
Browser+是一个比较常用的图形化工具,支持完善的桶管理和对象管理操作。推荐使用此工具创建桶或上传对象。obsutil是一款用于访问管理OBS的命令行工具,对于熟悉命令行程序的用户,obsutil是执行批量处理、自动化任务较好的选择。 如果您的业务环境需要通过API或SDK执
在“数据标注”页面,会显示自动标注的进度,如果自动标注完成,标注进度为100%。 图1 自动标注完成。 标注完成后,您可以单击“标注结果确认”中的“前往确认”,进入标注概览页。 在标注概览页单击右上方的“开始标注”,进入手动标注数据页面,针对“已标注”的数据进行核对和检查。针对标注错误的数据修改标注。
训练得到模型之后,整个开发过程还不算结束,需要对模型进行评估和考察。一次性很难获得一个满意的模型,需要反复的调整算法参数、数据,不断评估训练生成的模型。 一些常用的指标,如精准率、召回率、F1值等,能帮助您有效的评估,最终获得一个满意的模型。 前提条件 已在ModelArts Pro控制
在“服务部署”页面,按表1填写服务的相关参数,然后单击“部署”。 图1 服务部署 表1 服务部署参数说明 参数 说明 服务名称 待部署的服务名称,单击可修改服务默认服务名称。 描述 待部署服务的简要说明。 资源池 用于服务部署的资源池和资源类型,可选“公共资源池”和“专属资源池”。 “公共
创建名称为“mapro-hilens”的OBS桶。 创建名称为“training-data-in”的文件夹用于存放训练数据集。 创建名称为“training-data-out”的文件夹用于存放输出的数据集。 创建OBS桶和文件夹的操作指导请参见创建桶和新建文件夹。为保证数据能正常访问,请务必保证创建的OBS桶与ModelArts
GiB”,适合纯CPU类型的负载运行的模型。 如果资源池选择专属资源池,勾选自己在ModelArts创建的专属资源池。 计算节点个数 设置当前版本模型的实例个数。如果节点个数设置为1,表示后台的计算模式是单机模式;如果节点个数设置大于1,表示后台的计算模式为分布式的。请根据实际编码情况选择计算模式。
在“服务部署”页面,按表1填写服务的相关参数,然后单击“部署”。 图1 服务部署 表1 服务部署参数说明 参数 说明 服务名称 待部署的服务名称,单击可修改服务默认服务名称。 描述 待部署服务的简要说明。 资源池 用于服务部署的资源池和资源类型,可选“公共资源池”和“专属资源池”。 “公共
在“服务部署”页面,按表1填写服务的相关参数,然后单击“部署”。 图1 服务部署 表1 服务部署参数说明 参数 说明 服务名称 待部署的服务名称,单击可修改服务默认服务名称。 描述 待部署服务的简要说明。 资源池 用于服务部署的资源池和资源类型,可选“公共资源池”和“专属资源池”。 “公共
Browser+是一个比较常用的图形化工具,支持完善的桶管理和对象管理操作。推荐使用此工具创建桶或上传对象。obsutil是一款用于访问管理OBS的命令行工具,对于熟悉命令行程序的用户,obsutil是执行批量处理、自动化任务较好的选择。 如果您的业务环境需要通过API或SDK执
训练得到模型之后,整个开发过程还不算结束,需要对模型进行评估和考察。一次性很难获得一个满意的模型,需要反复的调整算法、数据,不断评估训练生成的模型。 一些常用的指标,如精准率、召回率、F1值等,能帮助您有效的评估,最终获得一个满意的模型。 前提条件 已在视觉套件控制台选择“热轧钢板表面