检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
数据量较低,会影响模型整体的识别效果。 选择适当的学习率和训练轮次。 通过详细评估中的错误识别示例,有针对性地扩充训练数据。 后续操作 模型训练完成后,单击“下一步”,进入应用开发的“模型评估”步骤,详细操作指引请参见评估模型。 父主题: 通用文本分类工作流
数据量较低,会影响模型整体的识别效果。 选择适当的学习率和训练轮次。 通过详细评估中的错误识别示例,有针对性地扩充训练数据。 后续操作 模型训练完成后,单击“下一步”,进入应用开发的“模型评估”步骤,详细操作指引请参见评估模型。 父主题: 多语种文本分类工作流
数据量较低,会影响模型整体的识别效果。 选择适当的学习率和训练轮次。 通过详细评估中的错误识别示例,有针对性地扩充训练数据。 后续操作 模型训练完成后,单击“下一步”,进入应用开发的“模型评估”步骤,详细操作指引请参见评估模型。 父主题: 通用实体抽取工作流
识别区指图片中待识别的文字位置。所有需要识别的图片中都会包含此识别区的字段,且位置固定不变,因此模型可以通过识别区找到需要识别内容的位置。 前提条件 已在文字识别套件控制台选择“多模板分类工作流”新建应用,并框选参照字段,详情请见框选参照字段。 操作步骤 图1 多模板框选识别区 在“应用开发>框选参照字段”页面上方或
“详细评估”下方显示各个标签下的样品数量比例,单击各标签,右侧可查看该标签识别错误的图片。 后续操作 针对当前版本的模型,经过模型评估后,如果根据业务需求,模型还需继续优化,请单击“上一步”,回到“模型训练”步骤,详细操作指导请见训练模型。 如果模型已达到业务需求,请单击“发布部署”,进入“服务部署”步骤,详情请见部署服务。
模拟在线测试 在“模型评估”页面,您可以在线测试当前模型,即通过上传测试图片,查看当前模型的预测结果。 待服务构建完成,单击“上传图片”,上传本地一张测试图片,即可查看当前模型版本的预测结果。 图3 模拟在线测试 后续操作 针对当前版本的模型,经过模型评估后,如果根据业务需求,模型
在“ModelArts Pro>自然语言处理套件”控制台,选择“我的工作流>多语种文本分类工作流”新建应用,详细操作请见新建应用。您可以开发多语种的文本分类应用,通过训练其他语种的文本分类预测模型,实现文本分类功能。 图1 多语种文本分类流程 表1 文本分类流程说明 流程 说明 详细指导
工作流流程 在“ModelArts Pro>自然语言处理套件”控制台,选择“我的工作流>通用文本分类工作流”新建应用,详细操作请见新建应用。您可以开发文本分类应用,通过训练文本分类预测模型,实现文本分类功能。 图1 文本分类流程 表1 文本分类流程说明 流程 说明 详细指导 准备数据
在添加文件对话框中,单击“上传文件”,完成添加文件的操作。您添加的文件内容将自动呈现在“未标注”或“已标注”的文本列表中。 删除文件 通过数据删除操作,可将需要丢弃的文件数据快速删除。 在“未标注”页面中,单击选中需要删除的文本对象,然后单击左上角“删除”,即可完成文本的删除操作。 在“已标注”页面中,选
用户使用ModelArts Pro开发应用的流程如图1所示,首次使用ModelArts Pro的操作指引请见表1。 图1 使用ModelArts Pro 表1 首次使用ModelArts Pro操作指引 序号 操作 指引 1 注册华为帐号并开通华为云,登录ModelArts Pro 注册华为帐号并开通华为云
必须执行发布操作后,才能应用于模型开发或训练。 数据集版本,默认按V001、V002递增规则进行命名,您也可以在发布时自定义设置。 您可以将任意一个版本设置为当前目录,即表示数据集列表中进入的数据集详情,为此版本的数据及标注信息。 针对每一个数据集版本,您可以通过“存储路径”参
一键式部署,快速输出高精度结构化数据。 工作流流程 在“ModelArts Pro>文字识别套件”控制台选择“通用单模板分类工作流”新建应用,详细操作请见新建应用。您可以创建单模板服务,通过模板训练文字识别模型,实现单模板图像的文字信息结构化提取。 图1 创建单模板流程 表1 创建单模板流程说明 流程 说明
模板,详情请见评估应用。 删除模板 如果已创建的模板应用不再使用,您可以删除模板释放资源。 在“应用开发>训练分类器”页面,选择模板,单击操作列的“删除”,弹出“确认删除”对话框,单击“确认”,删除模板。 父主题: 多模板分类工作流
自动识别结构化信息与提取签名盖章区域,有助快速审核。 自然语言处理套件 通用文本分类场景。 智能问答 通过中文分词、短文本相似度、命名实体识别等自然语言处理相关技术,计算两个问题对的相似度,可解决问答、对话、语料挖掘、知识库构建等问题。 内容推荐 通过文本分类预测模型,精确匹配出语义相似的内容,快速构建内容推荐场景。
细步骤请参见操作步骤。 前提条件 已在文字识别套件控制台选择“通用单模板工作流”新建应用,并对上传的模板图片进行预处理,详情请见定义预处理。 操作步骤 图1 框选参照字段 在“应用开发>框选参照字段”页面,通过单击左上方操作图标,调整模板图片到合适大小。 单击框选操作图标,单击参
后再提取结构化信息,支持图片平移、旋转与拉伸变换。 为了检查并校正待识别的图片,这就需要在模板图片中指定参照字段。通过参照字段的文字内容来判断是否属于同一种模板,通过参照字段的位置来校正待识别图片。 基本概念 参照字段为模板图片和待识别图片中的公共文字部分,所有需要识别的图片中都要包含参照字段,且位置必须固定。
模型可以通过识别区找到需要识别内容的位置。 前提条件 已在文字识别套件控制台选择“通用单模板工作流”新建应用,并框选参照字段,详情请见框选参照字段。 操作步骤 图1 框选识别区 在“应用开发>框选识别区”页面,通过单击左上方操作图标,调整模板图片到合适大小。 单击框选操作图标,单
物流场景需要处理各种格式的票据图片,用户可以通过简单的标注生成自己的专属模板,实现关键字段的自动识别和提取。 特点:对各种格式的票据图片,可制作模板实现关键字段的自动识别和提取。 优势:支持不同格式票据图片的自动识别和结构化提取。通过可视化界面操作,轻松指定识别区域,完成模板设计并调用服务接口。
进入应用开发页面 登录“ModelArts Pro>文字识别套件”控制台。 默认进入“应用开发>工作台”页面。 在“我的应用”页签下,选择应用并单击“操作”列的“查看”。 进入“应用资产”页面。 图1 进入应用资产 单击“创建分类器”。 进入“应用开发”页面,开始开发应用。 图2 创建分类器
择预处理逻辑”快速处理图片,也可以按左上角操作指标调整图片。 图1 定义预处理 右侧“选择预处理逻辑”区域勾选对应操作,当前仅支持“自动旋转”操作,系统自动旋转文字方向不正确的图片,保持图片中的文字方向正确。 单击预处理区域左上方的操作图标,调整模板图片的大小、方向等。 :单击图