检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
BMP。 图片最大边不大于4096px,最小边不小于100px,且大小不超过4M。 训练分类器的数据集要求将图片放在一个目录里,并压缩成zip文件,文件大小不应大于10M。 进入应用开发页面 登录“ModelArts Pro>文字识别套件”控制台。 默认进入“应用开发>工作台”页面。
上传数据至OBS 使用ModelArts Pro进行应用开发时,您需要将数据上传至OBS桶中。 首先需要获取访问OBS权限,在未进行委托授权之前,无法使用此功能。您需要提前获得OBS授权,详情请见配置访问权限。 已创建用于存储数据的OBS桶及文件夹,且数据存储的OBS桶与ModelArts Pr
如何使用ModelArts Pro 使用流程 注册华为帐号并开通华为云 申请行业套件 配置访问授权
使用预置工作流开发应用流程 视觉套件提供了预置工作流,您可以通过预置的工作流,自主上传训练数据,构建和升级高精度识别模型。 图1 使用预置工作流开发应用 表1 使用预置工作流开发应用流程 流程 说明 详细指导 选择视觉套件 根据您的实际使用需求选择视觉套件。您也可以通过查看工作流定位所需使用的套件。 在ModelArts
通用文本分类工作流 根据工作流指引,开发文本分类服务,通过上传训练数据,训练生成文本预测分类模型,自主更新和调整模型精度,实现高精度的文本预测分类。 通用文本分类工作流 多语种文本分类工作流 根据工作流指引,开发非中文语种的文本分类服务,通过上传训练数据,训练生成文本预测分类模型,自主更
及持续迭代。 选择预置工作流 单模板工作流 通过工作流指引构建文字识别模板,识别单个板式图片中的文字,快速实现文档、票证等场景的文字识别。详情请见使用单模板工作流开发应用。 多模板工作流 通过工作流指引支持自定义多个文字识别模板,通过模型训练,自动识别图片所属模板,从而支持从大量
管理数据集版本 数据标注完成后,您可以发布成多个版本对数据集进行管理。针对已发布生产的数据集版本,您可以通过查看数据集演进过程、设置当前版本、删除版本等操作,对数据集进行管理。数据集版本的相关说明,请参见关于数据集版本。 发布为新版本的说明,请参见发布数据集。 进入数据集版本管理页面
定义预处理 使用通用单模板工作流上传模板图片后,需要对模板图片进行预处理,通过旋转、裁剪、降噪等操作。图片预处理的目的是保留图片的关键内容,去掉冗余部分,保持图片内容清晰可见,保证模型识别的准确性。 前提条件 已在文字识别套件控制台选择“通用单模板工作流”新建应用,并上传模板图片,详情请见上传模板图片。
定义预处理 使用多模板分类工作流上传模板图片后,需要对模板图片进行预处理,通过旋转、裁剪、降噪等操作。图片预处理的目的是保留图片的关键内容,去掉冗余部分,保持图片内容清晰可见,保证模型识别的准确性。 前提条件 已在文字识别套件控制台选择“多模板分类工作流”新建应用,并上传模板图片,详情请见上传模板图片。
odelArts Pro支持通过开发新版本、对比不同版本的效果等功能对不同的应用版本进行管理。 已发布北京四区域 自然语言处理套件-更新应用版本 视觉套件-更新应用版本 HiLens套件-更新应用版本 OBS 2.0支持应用监控 针对已创建的应用,通过查看应用的基本信息、在线测试
工作流流程 在“ModelArts Pro>文字识别套件”控制台选择“通用单模板分类工作流”新建应用,详细操作请见新建应用。您可以创建单模板服务,通过模板训练文字识别模型,实现单模板图像的文字信息结构化提取。 图1 创建单模板流程 表1 创建单模板流程说明 流程 说明 详细指导 上传模板图片
Kit注册到Huawei HiLens平台,连接端侧与云侧。 注册HiLens Kit 选择HiLens套件 根据您的实际使用需求选择HiLens套件。您也可以通过查看工作流定位所需使用的套件。 在ModelArts Pro控制台界面,单击“HiLens套件”卡片的“进入套件”,进入HiLens套件控制台。
“详细评估”左侧显示标注标签,右侧显示第二相交并比指标较低的图片。 图2 详细评估 模拟在线测试 在“模型评估”页面,您可以在线测试当前模型,即通过上传测试图片,查看当前模型的预测结果。 待服务构建完成,单击“上传图片”,上传本地一张测试图片,即可查看当前模型版本的预测结果。 图3 模拟在线测试
在“ModelArts Pro>自然语言处理套件”控制台选择“我的工作流>通用实体抽取工作流”新建应用,详细操作请见新建应用。您可以开发实体抽取应用,通过训练实体抽取模型,实现从文本中抽取实体的功能。 图1 通用实体抽取流程 表1 通用实体抽取流程说明 流程 说明 详细指导 准备数据 在使用
检查不同标签的样本数是否均衡,建议不同标签的样本数量级相同,并尽量接近,如果有的类别数据量很高,有的类别数据量较低,会影响模型整体的识别效果。 选择适当的学习率和训练轮次。 通过详细评估中的错误识别示例,有针对性地扩充训练数据。 后续操作 模型训练完成后,单击“下一步”,进入应用开发的“模型评估”步骤,详细操作指引请参见评估模型。
Pro>自然语言处理套件”控制台,选择“我的工作流>多语种文本分类工作流”新建应用,详细操作请见新建应用。您可以开发多语种的文本分类应用,通过训练其他语种的文本分类预测模型,实现文本分类功能。 图1 多语种文本分类流程 表1 文本分类流程说明 流程 说明 详细指导 准备数据 在使
在“ModelArts Pro>自然语言处理套件”控制台,选择“我的工作流>通用文本分类工作流”新建应用,详细操作请见新建应用。您可以开发文本分类应用,通过训练文本分类预测模型,实现文本分类功能。 图1 文本分类流程 表1 文本分类流程说明 流程 说明 详细指导 准备数据 在使用通用文本分类工
检查不同标签的样本数是否均衡,建议不同标签的样本数量级相同,并尽量接近,如果有的类别数据量很高,有的类别数据量较低,会影响模型整体的识别效果。 选择适当的学习率和训练轮次。 通过详细评估中的错误识别示例,有针对性地扩充训练数据。 后续操作 模型训练完成后,单击“下一步”,进入应用开发的“模型评估”步骤,详细操作指引请参见评估模型。
物流场景需要处理各种格式的票据图片,用户可以通过简单的标注生成自己的专属模板,实现关键字段的自动识别和提取。 特点:对各种格式的票据图片,可制作模板实现关键字段的自动识别和提取。 优势:支持不同格式票据图片的自动识别和结构化提取。通过可视化界面操作,轻松指定识别区域,完成模板设计并调用服务接口。