检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
弹出“创建字段类型”对话框。 填写字段类型信息。 图3 创建字段类型 “字段类型名称”:填写待创建的字段类型名称,如识别身份证照片,可新增字段类型“出生日期”。 “字段属性”:选择字段属性,可选择“自定义正则提取”和“自定义字典”,然后按表1填写相关信息。 表1 字段属性参数说明 字段属性
表1 新建训练数据集参数说明 参数 说明 数据集名称 待新建的数据集名称。 描述 数据集简要描述。 数据集输入位置 训练数据存储至OBS的位置。 单击“数据集输入位置”右侧输入框,在弹出的“数据集输入位置”对话框中,选择“OBS桶”和“文件夹”,然后单击“确定”。 数据集输出位置 待新建的数据集存储至OBS的位置。
弹出“创建字段类型”对话框。 填写字段类型信息。 图3 创建字段类型 “字段类型名称”:填写待创建的字段类型名称,如识别身份证照片,可新增字段类型“出生日期”。 “字段属性”:选择字段属性,可选择“自定义正则提取”和“自定义字典”,然后按表1填写相关信息。 表1 字段属性参数说明 字段属性
单击卡片中的“新建应用”。 根据业务需求填写“基本信息”、“工作流配置”和“资源配置”。 图3 新建应用 基本信息 包括“应用名称”(必填项)、“应用负责人”和“应用描述”。 工作流配置 选择“所属行业”和“选择工作流”。当前自然语言处理提供“通用文本分类工作流”、“多语种文本分类工作流”、“通用实体抽取工作流”等。
单击卡片中的“新建应用”。 根据业务需求填写“基本信息”、“工作流配置”和“资源配置”。 基本信息 包括“应用名称”(必填项)、“应用负责人”和“应用描述”。 图3 基本信息 工作流配置 选择“所属行业”和“选择工作流”。当前视觉套件提供“零售商品识别工作流”、“热轧钢板表面缺陷
表1 发布数据集的参数说明 参数 描述 “版本名称” 默认按V001、V002递增规则进行命名,您也可以自定义版本名称。版本名称只能包含字母、数字、中划线或下划线。 “版本格式” 仅“表格”类型数据集支持设置版本格式,支持“CSV”和“CarbonData”两种。 说明: 如果导
弹出“导入数据集”对话框。 “导入数据集”对话框会显示您在自然语言处理套件其他应用中已创建的文本数据集信息,包括“数据集名称”和“标注进度”。 单击数据集左侧的,可查看数据集的“创建时间”和“标签集”。 图2 导入数据集 勾选数据集,然后单击“确定”。 数据集导入后,“数据选择”页面右上角会显示“导入成功”。
部署服务后,调用API失败怎么办? 在ModelArts Pro使用预置工作流部署服务后,可通过调用API和SDK调用已部署的在线服务。如果调用API失败,可根据返回的错误码及错误信息解决问题,具体的错误码说明请见表1。 表1 API调用指导 行业套件 调用API方法 错误码 文字识别套件
效果。 选择适当的学习率和训练轮次。 通过详细评估中的错误识别示例,有针对性地扩充训练数据。 后续操作 更新版本后,您可以在“应用详情”页的开发版本列表查看当前应用各个版本的“版本名称”、“进展”、“模型精准率”、“模型召回率”、“F1值”、“更新时间”和可执行的“操作”。 图2
看当前应用的资产信息,比如零售商品识别工作流中的资产信息就是训练数据集,您可以查看“数据集名称”、“描述”、“数据量”、“标注进度”、“创建时间”和“操作”,其中“操作”列可执行“管理”和“删除”操作。 图4 应用资产 “管理”:进入数据集管理页面,单击“开始标注”,可手动标注数据。
文字识别套件 文字识别套件基于丰富的文字识别算法和行业知识积累,帮助客户快速构建满足不同业务场景需求的文字识别服务,实现多种版式图像的文字信息结构化提取。 文字识别套件当前提供了单模板工作流和多模板工作流,自主构建文字识别模板,识别模板图片中的文字,提供高精度的文字识别模型,保证结构化信息提取精度。
根据数据量选择适当的学习率和训练轮次。 通过详细评估中的错误识别示例,有针对性地扩充训练数据。 后续操作 更新版本后,您可以在“应用详情”页的开发版本列表查看当前应用各个版本的“版本名称”、“进展”、“模型精准率”、“模型召回率”、“F1值”、“更新时间”和可执行的“操作”。 图2
ModelArts Pro 是为企业级AI应用打造的专业开发套件。基于华为云的先进算法和快速训练能力,提供预置工作流和模型,提升企业AI应用的开发效率,降低开发难度。文字识别套件基于丰富的文字识别算法和行业知识积累,帮助客户快速构建满足不同业务场景需求的文字识别服务,实现多种版式图像的文字信息结构化提取。
支持自主上传文本数据,构建高精度文本分类预测模型,适配不同行业场景的业务数据,快速获得定制服务。此工作流仅支持对中文进行文本分类,且支持单标签分类和多标签分类。 适用场景 智能问答、舆情分析、内容推荐等场景。 优势 针对场景领域提供预训练模型,分类准确率高。 提供完善的文本处理能力,支持
在“未标注”页签添加:单击页面中标签集右侧的加号,然后在弹出的“新增标签”页中,添加标签名称,选择标签颜色,单击“确定”完成标签的新增。 图3 添加标签(1) 在“已标注”页签添加:在右侧单击页面中全部标签加号,然后在弹出的“新增标签”页中,添加标签名称,选择标签颜色,单击“确定”完成标签的新增。 图4 添加标签(2)
页签。 图1 进入套件 在“我的应用”页签下,单击“新建应用”。 进入“新建应用”页面。 图2 新建应用 根据业务需求填写“应用名称”、“应用负责人”和“应用描述”,仅支持英文、中文、数字、下划线、中划线。选择“所属行业”及工作流。 本样例“工作流”选择“通用单模板工作流”。 图3
训练分类器 确定模板图片的参照字段和识别区后,多模板分类工作流在模板数量较多,或版式相似度较高的情况下,建议针对不同的模板上传对应的训练集数据,用于训练模板分类模型,使服务能够精准地分类多个模板图片,然后对多个模板图片进行文字识别和结构化提取。 前提条件 已在文字识别套件控制台选
根据工作流指引,创建多模板服务,通过多模板训练模板分类器和文字识别模型,实现多模板图像的文字信息结构化提取。 创建多模板 调用API和SDK 部署服务后,支持通过调用API和SDK调用当前模板服务。 调用API和SDK 父主题: 文字识别套件
多模板分类工作流可以通过追加训练分类器,用于训练模板分类模型,使服务能够精准地分类多个模板图片,然后对多个模板图片进行文字识别和结构化提取。 训练分类器 评估应用 通过上传测试图片,在线评估模板分类情况和模板的文字识别情况,保证能在多个模板情况下正确分类测试图片的模板,并且能正确识别测试图片中的识别区文字。
善的桶管理和对象管理操作。推荐使用此工具创建桶或上传对象。obsutil是一款用于访问管理OBS的命令行工具,对于熟悉命令行程序的用户,obsutil是执行批量处理、自动化任务较好的选择。 如果您的业务环境需要通过API或SDK执行数据上传操作,或者您习惯于使用API和SDK,推