检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
调用API和SDK 部署服务后,“应用开发>部署”页面下方的调用指南,显示“API调用”和“SDK调用”页签,您可以通过调用API和SDK调用当前模板服务。 SDK调用 API调用 图1 部署服务 调用时,如果出现ModelArts.4204报错,请参见ModelArts.4204服务未开通报错进行处理。
4204服务未开通怎么办? 问题现象 子账号在使用自定义OCR(ModelArts Pro文字识别套件)生成的api时,出现如下报错。表示用户,没有OCR权限或没有开通ModelArts Pro服务。 "ModelArts.4204"、"Request API error. The API xxx
配置访问授权 在您使用ModelArts Pro过程中,ModelArts Pro需要访问ModelArts服务的云资源,如果没有授权,相关功能将不能正常使用。因此,没有进行访问授权的用户在使用ModelArts Pro之前,需要进行访问授权。ModelArts Pro当前仅支持使用委托授权。
评估应用 训练模板分类模型后,需要对模板分类器和模板图片进行评估和考察。您可以通过上传测试图片,在线评估模板分类情况和模板的文字识别情况,保证能在多个模板情况下正确分类测试图片的模板,并且能正确识别测试图片中的识别区文字。 前提条件 已在文字识别套件控制台选择“多模板分类工作流”
即可使用ModelArts Pro各个套件。 由于ModelArts Pro服务依赖OBS服务和ModelArts服务,所以在使用ModelArts Pro过程中,涉及到OBS服务和ModelArts服务功能的使用,依赖服务会产生相应的费用,详情请见计费说明。 注册华为帐号并开通华为云
训练分类器 确定模板图片的参照字段和识别区后,多模板分类工作流在模板数量较多,或版式相似度较高的情况下,建议针对不同的模板上传对应的训练集数据,用于训练模板分类模型,使服务能够精准地分类多个模板图片,然后对多个模板图片进行文字识别和结构化提取。 前提条件 已在文字识别套件控制台选
选择“OBS桶”和“文件夹”,然后单击“确定”。 数据集输出位置 待新建的数据集存储至OBS的位置。 待新建的数据集有一个默认存储位置。如果需要修改数据集存储位置,请单击“数据集输出位置”右侧的“修改”,在弹出的“数据集输出位置”对话框中,选择“OBS桶”和“文件夹”,然后单击“确定”。
话框中,选择“OBS桶”和“文件夹”,然后单击“确定”。 本样例选择在步骤1:上传数据至OBS中创建的OBS桶和文件夹“/mapro-hilens/training-data-in”。 数据集输出位置 待新建的数据集存储至OBS的位置。 待新建的数据集有一个默认存储位置。如果需要
评估应用 确定模板图片的参照字段和识别区后,需要对模板图片进行评估和考察。您可以通过上传测试图片,在线评估模板的识别情况,保证能正确识别同样模板下其他图片中的识别区文字。 前提条件 已在文字识别套件控制台选择“通用单模板工作流”新建应用,并完成框选识别区步骤,详情请见框选识别区。
模型训练完成后,可在“应用开发>评估”页面评估分类器和模板,详情请见步骤8:评估模板。 步骤8:评估模板 在“应用开发>评估”页面包含分类器评估和模板评估 ,其中分类器评估用于识别模板类型,模板评估用于识别对应模板中的文字。 分类器评估 默认进入“本地上传”页签,打开“分类模式”和“动态识别”开关。 单击“
ModelArts Pro 是为企业级AI应用打造的专业开发套件。基于华为云的先进算法和快速训练能力,提供预置工作流和模型,提升企业AI应用的开发效率,降低开发难度。同时,支持客户自主进行工作流编排,快速实现应用的开发、共享和发布,共建开放生态,实现普惠行业AI落地。 ModelArts Pro
选择“OBS桶”和“文件夹”,然后单击“确定”。 数据集输出位置 待新建的数据集存储至OBS的位置。 待新建的数据集有一个默认存储位置。如果需要修改数据集存储位置,请单击“数据集输出位置”右侧的“修改”,在弹出的“数据集输出位置”对话框中,选择“OBS桶”和“文件夹”,然后单击“确定”。
如上传两种不同格式的发票图片作为模板,训练的文字识别模型就能识别并提取这两种格式发票上的关键字段。 前提条件 已授权ModelArts服务和对象存储服务(OBS)。 已在文字识别套件控制台选择“多模板分类工作流”新建应用,详情请见新建应用。 提前准备模板图片以及训练分类器的数据集,其要求请见数据要求。
“字段类型”指待识别文字的内容,您可以在默认字段类型中选择,当前可选择的默认字段类型包括“姓名”、“数字”、“常规”、“电话号码”、“地址”、“金额”、“长数字”、“长字段”,每个识别区可选择多个字段类型。 如果“默认字段类型”不能满足您的业务需求,您可以在字段类型下拉框单击“创建新字段类型”,创建新字段类型。
“字段类型”指待识别文字的内容,您可以在默认字段类型中选择,当前可选择的默认字段类型包括“姓名”、“数字”、“常规”、“电话号码”、“地址”、“金额”、“长数字”、“长字段”,每个识别区可选择多个字段类型。 如果“默认字段类型”不能满足您的业务需求,您可以在字段类型下拉框单击“创建新字段类型”,创建新字段类型。
善的桶管理和对象管理操作。推荐使用此工具创建桶或上传对象。obsutil是一款用于访问管理OBS的命令行工具,对于熟悉命令行程序的用户,obsutil是执行批量处理、自动化任务较好的选择。 如果您的业务环境需要通过API或SDK执行数据上传操作,或者您习惯于使用API和SDK,推
多模板分类工作流可以通过追加训练分类器,用于训练模板分类模型,使服务能够精准地分类多个模板图片,然后对多个模板图片进行文字识别和结构化提取。 训练分类器 评估应用 通过上传测试图片,在线评估模板分类情况和模板的文字识别情况,保证能在多个模板情况下正确分类测试图片的模板,并且能正确识别测试图片中的识别区文字。
签所对应样本的正确标签和预测标签,您可以对比正确标签和预测标签,判断当前模型预测该样本是否预测正确。 例如搜索框内输入标签“1”,下方会显示正确标签为“1”的样本中,预测正确的样本数在验证集中的占比。右侧显示正确标签为“1”的样本信息,包括样本的正确标签和预测标签。 图10 详细评估
”,以及合并标签后新的“标签名”。 图5 合并标签 查看标签解析 新建并选择训练数据集后,针对已标注的数据,您可以在“标签解析”中查看标签样本的统计数据,横轴为“标签”,纵轴为标签对应的有效“样本数”。 图6 标签解析 后续操作 在“数据选择”页面选择训练数据集,并针对未标注的数
勾选当前应用开发所需的训练数据集,可查看标签解析。 导入数据集 在“数据选择”页面,单击“导入数据集”。 弹出“导入数据集”对话框。 “导入数据集”对话框会显示您在自然语言处理套件其他应用中已创建的文本数据集信息,包括“数据集名称”和“标注进度”。 单击数据集左侧的,可查看数据集的“创建时间”和“标签集”。 图4