在ModelArts Pro控制台界面,单击“自然语言处理”套件卡片的“进入套件”。 进入自然语言处理套件控制台。 在左侧导航栏选择“应用开发>工作台”。 默认进入“我的应用”页签。 在“我的应用”页签下,选择已创建的应用,单击操作列的“查看”。 进入应用详情页,默认进入“应用开发”页签。
取值,作为识别结果。 自定义正则提取 预过滤 对初始的待识别文字进行预处理。 左边输入框填写待识别文字中被替换字符的正则表达式。 右边输入框填写所替换的新字符。 不填写时,默认不做预处理。 如果需要多次预处理,可单击,填写新增的预处理规则。 例如: “字段类型名称”:“出生日期”
数据集输入位置 训练数据存储至OBS的位置。 单击“数据集输入位置”右侧输入框,在弹出的“数据集输入位置”对话框中,选择“OBS桶”和“文件夹”,然后单击“确定”。 数据集输出位置 待新建的数据集存储至OBS的位置。 单击“数据集输出位置”右侧的“修改”,在弹出的“数据集输出位置”对话框中
子账号(IAM用户)需要联系主账户授予使用OCR服务的权限。为IAM用户授权过程请参见为IAM用户分配权限、IAM用户登录并验证权限。 授权时,子账号所在的用户组,需要设置为OCR FullAccess权限。 图1 用户组权限 授权后,子账号登录自定义OCR(ModelArts Pro )页面,服务会自动开通。
登录ModelArts Pro管理控制台,单击“自然语言处理”套件卡片的“进入套件”。 进入自然语言处理套件控制台。 在左侧导航栏选择“应用开发>工作台”。 默认进入“我的应用”页签。 在“我的应用”页签下,选择已创建的应用,单击操作列的“查看”。 进入应用详情页,默认进入“应用开发”页签。
“详细评估”下方显示各个标签下的样品数量比例,单击各标签,右侧可查看该标签识别错误的图片。 图8 详细评估 单击右下角的“下一步”。 进入“应用开发>服务部署”页面。 步骤8:部署服务 在“应用开发>服务部署”页面,按表4填写服务的相关参数,然后单击“部署”。 图9 服务部署 表4 服务部署参数说明 参数
文字识别套件 文字识别套件基于丰富的文字识别算法和行业知识积累,帮助客户快速构建满足不同业务场景需求的文字识别服务,实现多种版式图像的文字信息结构化提取。 文字识别套件当前提供了单模板工作流和多模板工作流,自主构建文字识别模板,识别模板图片中的文字,提供高精度的文字识别模型,保证结构化信息提取精度。
自然语言处理套件 自然语言处理套件为客户提供自然语言处理的自定制工具,旨在帮助客户高效地构建行业、领域的高精度文本处理模型,可应用于政府、金融、法律等行业。 自然语言处理套件提供了预置工作流,覆盖多种场景,支持自主上传训练数据,自主构建和升级高精度识别模型。用户自定义模型精度高,识别速度快。
标签为“1”的样本中,预测正确的样本数在验证集中的占比。右侧显示正确标签为“1”的样本信息,包括样本的正确标签和预测标签。 图10 详细评估 单击右下角的“发布部署”。 进入应用开发的“服务部署”页面。 步骤6:部署服务 在应用开发“服务部署”页面,按表5填写服务的相关参数,然后单击“部署”。
应用开发套件 文字识别套件 自然语言处理套件 视觉套件 HiLens套件
文字识别套件 文字识别套件使用简介 使用单模板工作流开发应用 使用多模板工作流开发应用
图解ModelArts Pro
训练任务性能提升30%。 灵活开放 灵活的部署方式:支持在线部署、边缘部署、Hilens部署等多种部署方式。 自定义工作流编排:结合行业知识,编排AI应用开发流程。 开放的生态:用户间快速共享、交易。 应用场景 特定行业下希望解决特定问题的场景,例如: 政务场景 每日大量的问询需求进入政务系统中,
练集,自动训练并生成模板分类器和文字识别模型,并将生成的模型部署为在线服务。部署完成后,用户可通过在线服务自动分类模板并识别模板中的文字。 首先,请仔细阅读准备工作罗列的要求,提前完成准备工作。使用多模板分类工作流开发应用的步骤如下所示: 步骤1:准备数据 步骤2:新建应用 步骤3:上传多个模板图片
保证图片质量:不能有损坏的图片;目前支持的格式包括JPG、JPEG、PNG、BMP。 为了保证模型的预测准确度,训练样本跟真实使用场景尽量相似。 为保证模型的泛化能力,数据集尽量覆盖所有标签的图片。 基于已设计好的商品标签准备图片数据。每个商品标签需要准备20个数据以上,为了训练出效果较好的模型,
相是指成分和组织均匀统一的物质部分,金属材料中,一般除了基体相外,还会存在许多的第二相。而第二相对整个金属材料的影响也是巨大的。在钢铁或其下游企业,常需要对钢铁显微成像的金相图片第二相面积含量进行测定。ModelArts Pro提供第二相面积含量测定工作流,能快速准确的返回第二相面积含量测定结果。
理OBS的命令行工具,对于熟悉命令行程序的用户,obsutil是执行批量处理、自动化任务的好的选择。 如果您的业务环境需要通过API或SDK执行数据上传操作,或者您习惯于使用API和SDK,推荐选择OBS的API或SDK方法创建桶和上传对象。 上述说明仅罗列OBS常用的使用方式和
照字段和识别区,自动训练并生成文字识别模型,并将生成的模型部署为在线服务。部署完成后,用户可通过在线服务识别身份证模板中的文字。 首先,请仔细阅读准备工作罗列的要求,提前完成准备工作。使用通用单模板工作流开发应用的步骤如下所示: 步骤1:准备数据 步骤2:新建应用 步骤3:上传模板图片
您即将访问非华为云网站,请注意账号财产安全