检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
上传数据集失败如何处理? 问题原因 上传数据集失败,一般是因为数据集格式不对导致的。不同行业套件的工作流,对数据集要求也不同。 首先请检查数据集是否符合要求,各个套件的数据集要求如下: 文字识别套件 自然语言处理套件 视觉套件 HiLens套件 确认数据集符合要求后,将数据集上传至OBS桶。
多模板分类工作流 工作流介绍 上传模板图片 定义预处理 框选参照字段 框选识别区 训练分类器 评估应用 部署服务 编辑应用 自定义字段类型 删除应用 父主题: 文字识别套件
进入“应用开发>定义预处理”页面。 步骤4:定义预处理 在“应用开发>定义预处理”页面,单击“选择预处理逻辑”的自动旋转,快速处理当前模板的方向。 也可以按左上角操作指标手动调整图片。详情请见定义预处理。 图8 定义预处理 在页面上方通过调整成第二个模板,对第二个模板进行预处理。 图9 定义预处理
型和文字识别模型,实现多模板图像的文字信息结构化提取。 图1 创建多模板流程 表1 创建多模板流程说明 流程 说明 详细指导 上传模板图片 在使用多模板工作流开发应用之前,需要上传模板图片,明确以哪些图片作为模板训练文字识别模型。 上传模板图片 定义预处理 上传模板图片后,需要对
据,快速获得定制服务。此工作流仅支持对中文进行文本分类,且支持单标签分类和多标签分类。 适用场景 智能问答、舆情分析、内容推荐等场景。 优势 针对场景领域提供预训练模型,分类准确率高。 提供完善的文本处理能力,支持多种数据格式内容,适配不同场景的业务数据。 可根据使用过程中的反馈持续优化模型。
的语种包括英语、法语、德语、西班牙语、葡萄牙语、阿拉伯语,支持单标签分类和多标签分类。 适用场景 智能问答、舆情分析、内容推荐等场景。 优势 针对场景领域提供预训练模型,分类准确率高。 提供完善的文本处理能力,支持多种数据格式内容,适配不同场景的业务数据。 可根据使用过程中的反馈持续优化模型。
别结果。 自定义正则提取 预过滤 对初始的待识别文字进行预处理。 左边输入框填写待识别文字中被替换字符的正则表达式。 右边输入框填写所替换的新字符。 不填写时,默认不做预处理。 如果需要多次预处理,可单击,填写新增的预处理规则。 例如: “字段类型名称”:“出生日期” “字段属性”:“自定义正则提取”
定义预处理 在“应用开发>定义预处理”页面上方或者“选择模板”下拉框中选择模板,对每个模板图片进行预处理。 图1 多模板定义预处理 在右侧“选择预处理逻辑”区域勾选对应操作,当前仅支持“自动旋转”操作,系统自动旋转文字方向不正确的图片,保持图片中的文字方向正确。 单击预处理区域左
体抽取场景。 优势 针对多场景领域提供预训练模型,支持抽取文本中的实体,分类准确率高。 提供完善的文本处理能力,支持多种数据格式内容,适配不同场景的业务数据。 可根据使用过程中的反馈持续优化模型。 工作流流程 在“ModelArts Pro>自然语言处理套件”控制台选择“我的工作
别结果。 自定义正则提取 预过滤 对初始的待识别文字进行预处理。 左边输入框填写待识别文字中被替换字符的正则表达式。 右边输入框填写所替换的新字符。 不填写时,默认不做预处理。 如果需要多次预处理,可单击,填写新增的预处理规则。 例如: “字段类型名称”:“出生日期” “字段属性”:“自定义正则提取”
“删除模板”:单击图片右侧“删除”,在弹出的确认删除对话框中单击“确认”。 确认信息后,单击“下一步”,进入定义预处理步骤,对上传的模板图片进行自动旋转、去印章等预处理。 添加已有模板 单击“添加已有模板”,进入“添加已有模板”页签。 单击“添加已有模板”,弹出“添加已有模板”对话框。
文字识别情况,保证能在多个模板情况下正确分类测试图片的模板,并且能正确识别测试图片中的识别区文字。 前提条件 已在文字识别套件控制台选择“多模板分类工作流”新建应用,并已训练,详情请见训练分类器。 进入评估应用页面 登录“ModelArts Pro>文字识别套件”控制台,默认进入
少人工输入。 合同录入与审核 自动识别结构化信息与提取签名盖章区域,有助快速审核。 自然语言处理套件 通用文本分类场景。 智能问答 通过中文分词、短文本相似度、命名实体识别等自然语言处理相关技术,计算两个问题对的相似度,可解决问答、对话、语料挖掘、知识库构建等问题。 内容推荐 通
自然语言处理套件 自然语言处理套件为客户提供自然语言处理的自定制工具,旨在帮助客户高效地构建行业、领域的高精度文本处理模型,可应用于政府、金融、法律等行业。 自然语言处理套件提供了预置工作流,覆盖多种场景,支持自主上传训练数据,自主构建和升级高精度识别模型。用户自定义模型精度高,识别速度快。
进入“应用开发”页面,您可以依次修改“上传模板图片”、“定义预处理”、“框选参照字段”、“框选识别区”、“训练分类器”、“评估”步骤的信息,重新部署模板。操作指引如下: 上传模板图片 定义预处理 框选参照字段 框选识别区 训练分类器 评估应用 部署服务 父主题: 多模板分类工作流
前提条件 已在文字识别套件控制台选择“多模板分类工作流”新建应用,并对上传的模板图片进行预处理,详情请见定义预处理。 操作步骤 图1 多模板框选参照字段 在“应用开发>框选参照字段”页面上方或者“选择模板”下拉框中选择模板,对每个模板图片进行预处理。 单击左上方操作图标,调整当前模板图片到合适大小和位置。
如何访问ModelArts Pro 云服务平台提供了提供了管理控制台的管理方式。 ModelArts Pro提供了简洁易用的管理控制台,包括自然语言处理、视觉AI、文字识别、语音识别等应用开发功能,您可以在管理控制台端到端完成您的AI应用开发。 使用ModelArts Pro管理
行业套件介绍 自然语言处理套件为客户提供自然语言处理的自定制工具,旨在帮助客户高效地构建行业、领域的高精度文本处理模型,可应用于政府、金融、法律等行业。 预置工作流 自然语言处理套件当前提供了通用文本分类工作流、多语种文本分类工作流和通用实体抽取工作流,提供高精度文本分类预测模型
ModelArts Pro如何收费? 目前ModelArts Pro开放了文字识别套件、自然语言处理套件、视觉套件和HiLens套件,其中,文字识别套件、自然语言处理套件和视觉套件已商用,HiLens条件处于公测阶段。各个套件的计费项和计费模式如下: 文字识别套件 自然语言处理套件 视觉套件
Pro控制台,选择行业套件卡片并单击“进入套件”,即可进入行业套件的控制台。 例如单击自然语言处理套件卡片的“进入套件”,即可进入自然语言处理套件的控制台。 图1 进入套件 父主题: 如何使用ModelArts Pro