检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
自然语言处理套件 自然语言处理套件为客户提供自然语言处理的自定制工具,旨在帮助客户高效地构建行业、领域的高精度文本处理模型,可应用于政府、金融、法律等行业。 自然语言处理套件提供了预置工作流,覆盖多种场景,支持自主上传训练数据,自主构建和升级高精度识别模型。用户自定义模型精度高,识别速度快。
训练分类器 确定模板图片的参照字段和识别区后,多模板分类工作流在模板数量较多,或版式相似度较高的情况下,建议针对不同的模板上传对应的训练集数据,用于训练模板分类模型,使服务能够精准地分类多个模板图片,然后对多个模板图片进行文字识别和结构化提取。 前提条件 已在文字识别套件控制台选
行业套件介绍 自然语言处理套件为客户提供自然语言处理的自定制工具,旨在帮助客户高效地构建行业、领域的高精度文本处理模型,可应用于政府、金融、法律等行业。 预置工作流 自然语言处理套件当前提供了通用文本分类工作流、多语种文本分类工作流和通用实体抽取工作流,提供高精度文本分类预测模型
据。控制台上传无需工具下载或多余配置,在少量数据上传时,更加便捷高效。 如果您的数据量较大或数据文件较多,建议选择OBS Browser+或obsutil工具上传。OBS Browser+是一个比较常用的图形化工具,支持完善的桶管理和对象管理操作。推荐使用此工具创建桶或上传对象。
框选并核对完所有识别区后,单击“下一步”。 进入“应用开发>评估”页面。 图12 评估页面 步骤7:评估模板 在“应用开发>评估”页面,默认进入“本地上传”页签。 单击“上传图片”,上传在本地提前准备好的用于评估模型的身份证图片。 图片上传成功后,右侧会显示识别结果。 图13 评估 步骤8:部署模板 如果评估
为。 进入华为云官网,参考帐号注册指导及界面提示信息,完成帐号注册。 注册成功后即可自动登录华为云,您需要完成“实名认证”才可以正常使用服务。具体认证方式请参考帐号实名认证。 申请套件 登录ModelArts Pro控制台,选择行业套件卡片并单击“申请公测”,在申请公测页面根据界面提示填写所需信息。
Pro的操作指引请见表1。 图1 使用ModelArts Pro 表1 首次使用ModelArts Pro操作指引 序号 操作 指引 1 注册华为帐号并开通华为云,登录ModelArts Pro 注册华为帐号并开通华为云 2 申请套件公测权限,进入套件 申请行业套件 3 使用委托授权,配置访问权限 配置访问授权
工作流介绍 工作流简介 功能介绍 支持用户自定义多个文字识别模板,通过模型训练,自动识别图片所需使用的模板,从而支持从大量不同板式图像中提取结构化信息。 适用场景 用户认证识别 识别证件中关键信息,节省人工录入,提升效率,降低用户实名认证成本,准确快速便捷。 快递单自动填写 识别
工作流会用测试数据评估模型,在“应用开发>评估模型”页面,查看评估结果。 模型评估 图1 模型评估 训练模型的版本、标签数量、测试集数量。单击“下载评估结果”,可保存评估结果至本地。 评估参数对比 图2 评估参数对比 左侧是各个标签数据的精确率、召回率、F1值。勾选标签,右侧会显示对应标签数据经过预置模型和增量模型评估后的参数对比柱状图。
多模板分类工作流 工作流介绍 上传模板图片 定义预处理 框选参照字段 框选识别区 训练分类器 评估应用 部署服务 编辑应用 自定义字段类型 删除应用 父主题: 文字识别套件
的格式包括JPG、JPEG、PNG、BMP。 图片最大边不大于4096px,最小边不小于100px,且大小不超过4M。 进入应用开发页面 登录“ModelArts Pro>文字识别套件”控制台。 默认进入“应用开发>工作台”页面。 在“我的应用”页签下,选择应用并单击“操作”列的“查看”。
模拟在线测试 在“模型评估”页面,您可以在线测试当前模型,即通过上传测试图片,查看当前模型的预测结果。 待服务构建完成,单击“上传图片”,上传本地一张测试图片,即可查看当前模型版本的预测结果。 图3 模拟在线测试 后续操作 针对当前版本的模型,经过模型评估后,如果根据业务需求,模型还
的结构化信息识别。 已发布北京四区域 多模板分类工作流 OBS 2.0支持自然语言处理套件 自然语言处理套件为客户提供自然语言处理的自定制工具,旨在帮助客户高效地构建行业、领域的高精度文本处理模型,可应用于政府、金融、法律等行业。 已发布北京四区域 自然语言处理套件 OBS 2.0支持通用文本分类工作流
能快速进行对比,获得对比结果。 前提条件 已在自然语言处理套件控制台选择“通用文本分类工作流”新建应用,详情请见新建应用。 更新应用版本 登录ModelArts Pro管理控制台,单击“自然语言处理”套件卡片的“进入套件”。 进入自然语言处理套件控制台。 在左侧导航栏选择“应用开发>工作台”。
每修改一次,更新成一个版本,不同的作业版本之间,能快速进行对比,获得对比结果。 前提条件 已在视觉套件控制台选择预置工作流新建应用,详情请见新建应用。 更新应用版本 登录ModelArts Pro管理控制台,单击“视觉套件”卡片的“进入套件”。 进入视觉套件控制台。 在左侧导航栏选择“应用开发>工作台”。 默认进入“我的应用”页签。
行业套件介绍 文字识别套件基于丰富的文字识别算法和行业知识积累,帮助客户快速构建满足不同业务场景需求的文字识别服务,实现多种版式图像的文字信息结构化提取。 文字识别套件的介绍请参见产品介绍。 预置工作流 文字识别套件当前提供了单模板工作流和多模板工作流,自主构建文字识别模板,识别
jpg 按照上述要求准备训练数据集和SKU数据集,文件夹分别命名为“Training-Dataset”和“SKU-Dataset”,并保存至本地。 登录OBS服务,创建桶和文件夹,用于存放数据集。 创建名称为“mapro-vison”的OBS桶。 创建名称为“training-data-in”的文件夹用于存放训练数据集。
已准备数据并上传至OBS,详情请见准备数据。 进入应用开发页面 方式一:首次进入 基于可训练技能模板新建可训练技能后,直接进入“应用开发”页面。 方式二:新建技能后进入 登录Huawei HiLens控制台,在左侧导航栏选择“技能开发>技能管理”页面。 单击“可训练技能”,切换至“可训练技能”页签。 选择已新建
访问密钥(SK)两部分,华为云通过AK识别用户的身份,通过SK对请求数据进行签名验证,用于确保请求的机密性、完整性和请求者身份的正确性。 登录访问密钥页面,依据界面操作指引,获取AK、SK。下载得到的访问密钥为credentials.csv文件,文件中的B列和C列分别是AK、SK信息。
24小时就到货了耳机更赞有些低音炮的感觉入耳很紧不会掉棒棒哒 positive 按上文要求准备训练数据集,并保存至本地,训练数据命名为“test.txt”。 登录OBS服务,创建桶和文件夹,用于存放数据集。 创建名称为“mapro-nlp”的OBS桶。 创建名称为“data-in”的文件夹用于存放训练数据集。