检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
ModelArts与ModelArts Pro的区别 ModelArts是一站式AI开发管理平台,提供领先算法技术,保证AI应用开发的高效和推理结果的准确,同时减少人力投入。ModelArts致力于底层模型专业开发、调参等。 ModelArts Pro根据预置工作流生成指定场景模
评估应用 训练模板分类模型后,需要对模板分类器和模板图片进行评估和考察。您可以通过上传测试图片,在线评估模板分类情况和模板的文字识别情况,保证能在多个模板情况下正确分类测试图片的模板,并且能正确识别测试图片中的识别区文字。 前提条件 已在文字识别套件控制台选择“多模板分类工作流”
文字识别套件 文字识别套件基于丰富的文字识别算法和行业知识积累,帮助客户快速构建满足不同业务场景需求的文字识别服务,实现多种版式图像的文字信息结构化提取。 文字识别套件当前提供了单模板工作流和多模板工作流,自主构建文字识别模板,识别模板图片中的文字,提供高精度的文字识别模型,保证结构化信息提取精度。
即可使用ModelArts Pro各个套件。 由于ModelArts Pro服务依赖OBS服务和ModelArts服务,所以在使用ModelArts Pro过程中,涉及到OBS服务和ModelArts服务功能的使用,依赖服务会产生相应的费用,详情请见计费说明。 注册华为帐号并开通华为云
调用API和SDK 部署服务后,“应用开发>部署”页面下方的调用指南,显示“API调用”和“SDK调用”页签,您可以通过调用API和SDK调用当前模板服务。 SDK调用 API调用 图1 部署服务 调用时,如果出现ModelArts.4204报错,请参见ModelArts.4204服务未开通报错进行处理。
部署服务后,调用API失败怎么办? 在ModelArts Pro使用预置工作流部署服务后,可通过调用API和SDK调用已部署的在线服务。如果调用API失败,可根据返回的错误码及错误信息解决问题,具体的错误码说明请见表1。 表1 API调用指导 行业套件 调用API方法 错误码 文字识别套件
ModelArts Pro 是为企业级AI应用打造的专业开发套件。基于华为云的先进算法和快速训练能力,提供预置工作流和模型,提升企业AI应用的开发效率,降低开发难度。文字识别套件基于丰富的文字识别算法和行业知识积累,帮助客户快速构建满足不同业务场景需求的文字识别服务,实现多种版式图像的文字信息结构化提取。
务名称。 如果在不同版本非首次部署服务,服务名称不支持修改。 描述 待部署服务的简要说明。 资源池 用于部署服务的资源池和资源类型。资源池可选“公共资源池”和“专属资源池”。 “公共资源池”:提供公共的大规模计算集群,资源按作业隔离。您可以按需选择不同的资源类型。 “专属资源池”
参数 说明 服务名称 待部署的服务名称,单击可修改服务默认服务名称。 描述 待部署服务的简要说明。 资源池 用于服务部署的资源池和资源类型,可选“公共资源池”和“专属资源池”。 “公共资源池”:提供公共的大规模计算集群,资源按作业隔离。您可以按需选择不同的资源类型。 “专属资源池”:
支持自主上传文本数据,构建高精度文本分类预测模型,适配不同行业场景的业务数据,快速获得定制服务。此工作流仅支持对中文进行文本分类,且支持单标签分类和多标签分类。 适用场景 智能问答、舆情分析、内容推荐等场景。 优势 针对场景领域提供预训练模型,分类准确率高。 提供完善的文本处理能力,支持
训练分类器 确定模板图片的参照字段和识别区后,多模板分类工作流在模板数量较多,或版式相似度较高的情况下,建议针对不同的模板上传对应的训练集数据,用于训练模板分类模型,使服务能够精准地分类多个模板图片,然后对多个模板图片进行文字识别和结构化提取。 前提条件 已在文字识别套件控制台选
参数 说明 服务名称 待部署的服务名称,单击可修改服务默认服务名称。 描述 待部署服务的简要说明。 资源池 用于服务部署的资源池和资源类型,可选“公共资源池”和“专属资源池”。 “公共资源池”:提供公共的大规模计算集群,资源按作业隔离。您可以按需选择不同的资源类型。 “专属资源池”:
参数 说明 服务名称 待部署的服务名称,单击可修改服务默认服务名称。 描述 待部署服务的简要说明。 资源池 用于服务部署的资源池和资源类型,可选“公共资源池”和“专属资源池”。 “公共资源池”:提供公共的大规模计算集群,资源按作业隔离。您可以按需选择不同的资源类型。 “专属资源池”:
参数 说明 服务名称 待部署的服务名称,单击可修改服务默认服务名称。 描述 待部署服务的简要说明。 资源池 用于服务部署的资源池和资源类型,可选“公共资源池”和“专属资源池”。 “公共资源池”:提供公共的大规模计算集群,资源按作业隔离。您可以按需选择不同的资源类型。 “专属资源池”:
参数 说明 服务名称 待部署的服务名称,单击可修改服务默认服务名称。 描述 待部署服务的简要说明。 资源池 用于服务部署的资源池和资源类型,可选“公共资源池”和“专属资源池”。 “公共资源池”:提供公共的大规模计算集群,资源按作业隔离。您可以按需选择不同的资源类型。 “专属资源池”:
参数 说明 服务名称 待部署的服务名称,单击可修改服务默认服务名称。 描述 待部署服务的简要说明。 资源池 用于服务部署的资源池和资源类型,可选“公共资源池”和“专属资源池”。 “公共资源池”:提供公共的大规模计算集群,资源按作业隔离。您可以按需选择不同的资源类型。 “专属资源池”:
模型训练完成后,可在“应用开发>评估”页面评估分类器和模板,详情请见步骤8:评估模板。 步骤8:评估模板 在“应用开发>评估”页面包含分类器评估和模板评估 ,其中分类器评估用于识别模板类型,模板评估用于识别对应模板中的文字。 分类器评估 默认进入“本地上传”页签,打开“分类模式”和“动态识别”开关。 单击“
多模板分类工作流可以通过追加训练分类器,用于训练模板分类模型,使服务能够精准地分类多个模板图片,然后对多个模板图片进行文字识别和结构化提取。 训练分类器 评估应用 通过上传测试图片,在线评估模板分类情况和模板的文字识别情况,保证能在多个模板情况下正确分类测试图片的模板,并且能正确识别测试图片中的识别区文字。
如上传两种不同格式的发票图片作为模板,训练的文字识别模型就能识别并提取这两种格式发票上的关键字段。 前提条件 已授权ModelArts服务和对象存储服务(OBS)。 已在文字识别套件控制台选择“多模板分类工作流”新建应用,详情请见新建应用。 提前准备模板图片以及训练分类器的数据集,其要求请见数据要求。
根据工作流指引,创建多模板服务,通过多模板训练模板分类器和文字识别模型,实现多模板图像的文字信息结构化提取。 创建多模板 调用API和SDK 部署服务后,支持通过调用API和SDK调用当前模板服务。 调用API和SDK 父主题: 文字识别套件