检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
本章节以Python SDK为例介绍如何进行使用,其他语言SDK使用方法相同。 获取SDK。 在自定义OCR的“部署”页面,选择“SDK调用”获取SDK。 图2 获取SDK 导入SDK至PyCharm(请在PyCharm中提前配置python环境)。 图3 导入SDK 获取AK、SK。 AK/SK(Access
善的桶管理和对象管理操作。推荐使用此工具创建桶或上传对象。obsutil是一款用于访问管理OBS的命令行工具,对于熟悉命令行程序的用户,obsutil是执行批量处理、自动化任务的好的选择。 如果您的业务环境需要通过API或SDK执行数据上传操作,或者您习惯于使用API和SDK,推
确认数据集符合要求后,将数据集上传至OBS桶。 上传数据至OBS 文字识别套件 文字识别套件当前提供了单模板工作流和多模板工作流,开发应用时需要上传模板图片,明确以哪张图片作为模板训练文字识别模型。 上传图片的要求如表1所示。 表1 文字识别套件数据集要求 工作流 数据集要求 单模板工作流 保证图片质量:不能有损
如果未获得ModelArts委托授权和访问密钥(AK/SK)授权,当进入ModelArts Pro控制台的行业套件时,会弹出“访问授权”对话框。 在弹出的“访问授权”对话框填写授权信息,然后单击“同意授权”,完成访问授权的配置。 “用户名”为当前需要授权的用户名,保持默认值。 “委
在“应用监控”页面,您可以查看当前应用所部署的不同版本信息,包括“更新时间”、“更新状态”、“对应应用版本”、“分流(%)”、“计算节点规格”和“计算节点个数”。 图2 历史版本 查看调用指南 在“应用监控”页面,您可以查看调用应用API的信息。如何调用API请参考API参考,错误码请参考错误码。
在“应用监控”页面,您可以查看当前应用所部署的不同版本信息,包括“更新时间”、“更新状态”、“对应应用版本”、“分流(%)”、“计算节点规格”和“计算节点个数”。 图4 历史版本 查看调用指南 在“应用监控”页面,您可以查看调用应用API的信息。如何调用API请参考API参考,错误码请参见错误码。
使用流程 ModelArts Pro是为企业级AI应用打造的专业开发套件。基于华为云的先进算法和快速训练能力,提供预置工作流和模型,提升企业AI应用的开发效率,降低开发难度。当前ModelArts Pro开放了文字识别套件、自然语言处理套件、视觉套件、HiLens套件,详细介绍请
ModelArts Pro如何收费? 目前ModelArts Pro开放了文字识别套件、自然语言处理套件、视觉套件和HiLens套件,其中,文字识别套件、自然语言处理套件和视觉套件已商用,HiLens条件处于公测阶段。各个套件的计费项和计费模式如下: 文字识别套件 自然语言处理套件
待新建的数据集名称。 描述 数据集简要描述。 数据集状态 按上传的数据是否标注分为“已标注数据集”和“未标注数据集”。数据格式请见准备数据。 数据上传方式 训练数据上传的方式,当前仅支持把数据上传至OBS,默认为“选择obs文件”。 数据集输入位置 训练数据存储至OBS的位置。
的“新建应用”。 根据业务需求填写“基本信息”、“工作流配置”和“资源配置”。 图3 新建应用 基本信息 包括“应用名称”(必填项)、“应用负责人”和“应用描述”。 工作流配置 选择“所属行业”和“选择工作流”。当前自然语言处理提供“通用文本分类工作流”、“多语种文本分类工作流”、“通用实体抽取工作流”等。
的“新建应用”。 根据业务需求填写“基本信息”、“工作流配置”和“资源配置”。 基本信息 包括“应用名称”(必填项)、“应用负责人”和“应用描述”。 图3 基本信息 工作流配置 选择“所属行业”和“选择工作流”。当前视觉套件提供“零售商品识别工作流”、“热轧钢板表面缺陷检测工作流
文字识别套件 文字识别套件基于丰富的文字识别算法和行业知识积累,帮助客户快速构建满足不同业务场景需求的文字识别服务,实现多种版式图像的文字信息结构化提取。 文字识别套件当前提供了单模板工作流和多模板工作流,自主构建文字识别模板,识别模板图片中的文字,提供高精度的文字识别模型,保证结构化信息提取精度。
评估应用 训练模板分类模型后,需要对模板分类器和模板图片进行评估和考察。您可以通过上传测试图片,在线评估模板分类情况和模板的文字识别情况,保证能在多个模板情况下正确分类测试图片的模板,并且能正确识别测试图片中的识别区文字。 前提条件 已在文字识别套件控制台选择“多模板分类工作流”
效果。 选择适当的学习率和训练轮次。 通过详细评估中的错误识别示例,有针对性地扩充训练数据。 后续操作 更新版本后,您可以在“应用详情”页的开发版本列表查看当前应用各个版本的“版本名称”、“进展”、“模型精准率”、“模型召回率”、“F1值”、“更新时间”和可执行的“操作”。 图2
评估应用 确定模板图片的参照字段和识别区后,需要对模板图片进行评估和考察。您可以通过上传测试图片,在线评估模板的识别情况,保证能正确识别同样模板下其他图片中的识别区文字。 前提条件 已在文字识别套件控制台选择“通用单模板工作流”新建应用,并完成框选识别区步骤,详情请见框选识别区。
开发环境、丰富的AI技能市场和云上管理平台,帮助用户高效开发多模态AI技能,并将其快速部署到端侧计算设备。 预置可训练模板 HiLens套件提供可训练技能模板开发技能,无需代码,只需自主上传训练数据,快速训练高精度算法模型,并且一键部署至设备。 当前HiLens套件提供HiLen
并配置训练参数,开始训练模型。 预训练模型 当前服务提供预置预训练模型“高精版”、“均衡版”、“基础版”,在“预训练模型”列表中可查看“模型精度”、“推理速度”、“训练速度”和模型“简介”。 参数配置 在“参数配置”填写“学习率”和“训练轮次”。 “学习率”用来控制模型的学习速度,范围为(0
训练参数,开始训练模型。 预训练模型 当前服务提供预置预训练模型“高精版”、“均衡版”、“基础版”,在“预训练模型”列表中可查看“模型精度”、“推理速度”、“训练速度”和模型“简介”。 参数配置 在“参数配置”填写“学习率”、“训练轮次”和“语种”。 “学习率”用来控制模型的学习速度,范围为(0
根据工作流指引,创建多模板服务,通过多模板训练模板分类器和文字识别模型,实现多模板图像的文字信息结构化提取。 创建多模板 调用API和SDK 部署服务后,支持通过调用API和SDK调用当前模板服务。 调用API和SDK 父主题: 文字识别套件
步骤7:评估模型 在“应用开发>模型评估”页面,可以针对当前版本的模型进行模型评估,查看评估参数对比和详细评估。 模型评估 “模型评估”下侧显示当前模型的版本、标签数量、验证集数量。 图6 模型评估 评估参数对比 “评估参数对比”下方显示当前模型的评估参数值,包括“精准率”、“召回率”、“F1值”。您可以单击“添加对比版本”。