检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
评估应用 确定模板图片的参照字段和识别区后,需要对模板图片进行评估和考察。您可以通过上传测试图片,在线评估模板的识别情况,保证能正确识别同样模板下其他图片中的识别区文字。 前提条件 已在文字识别套件控制台选择“通用单模板工作流”新建应用,并完成框选识别区步骤,详情请见框选识别区。
取值,作为识别结果。 自定义正则提取 预过滤 对初始的待识别文字进行预处理。 左边输入框填写待识别文字中被替换字符的正则表达式。 右边输入框填写所替换的新字符。 不填写时,默认不做预处理。 如果需要多次预处理,可单击,填写新增的预处理规则。 例如: “字段类型名称”:“出生日期”
在左侧导航栏选择“应用开发>工作台”。 默认进入“我的应用”页签。 在“我的应用”页签下,选择已创建的应用,单击操作列的“查看”。 进入应用详情页,默认进入“应用资产”页面,查看应用资产。 您也可以单击“应用开发”,切换至“应用开发”页面,查看应用开发配置。 图1 进入应用详情 查看应用资产
参照字段是文字内容、位置固定不变的文本框区域。 参照字段为单行文本框,不可以框选竖版文字或跨行框选。 框选参照字段个数须建议大于4个,越多越好,并尽量分散在图片的四周。 参考字段尽量沿着文字边缘框选,精确框住对应文本行为佳。 核对右侧“框选参照字段”中的参照字段是否与框选的参照字段一致。 框选
部署服务 评估模板应用后,就可以部署模板应用至文字识别开发套件中,开发属于自己的文字识别应用,此应用用于识别自己所上传的模板样式的图片。 前提条件 已在文字识别套件控制台选择“通用单模板工作流”新建应用,并完成评估模板步骤,详情请见评估应用。 操作步骤 在“应用开发>部署”页面完
取值,作为识别结果。 自定义正则提取 预过滤 对初始的待识别文字进行预处理。 左边输入框填写待识别文字中被替换字符的正则表达式。 右边输入框填写所替换的新字符。 不填写时,默认不做预处理。 如果需要多次预处理,可单击,填写新增的预处理规则。 例如: “字段类型名称”:“出生日期”
部署服务 评估模板应用后,就可以部署多模板应用至文字识别开发套件中,开发属于自己的文字识别应用,此应用用于识别自己所上传的图片属于哪种模板以及识别图片中的文字。 前提条件 已在文字识别套件控制台选择“多模板分类工作流”新建应用,并完成评估模板步骤,详情请见评估应用。 操作步骤 在
并查看训练的模型准确率和误差的变化。 训练模型 评估模型 训练得到模型之后,整个开发过程还不算结束,需要对模型进行评估和考察。 评估结果包括一些常用的指标,如精准率、召回率、F1值等,并且同时启动一个在线测试服务,供您模拟在线测试,帮助您有效评估模型,最终获得一个满意的模型。 评估模型
设置当前版本模型的实例个数。如果节点个数设置为1,表示后台的计算模式是单机模式;如果节点个数设置大于1,表示后台的计算模式为分布式的。请根据实际编码情况选择计算模式。 服务自动停止 当新建应用时,服务部署方式选择“在线部署”时,设置服务自动停止的时间,在线服务运行状态在所选的时间点后自动停止,同时在线服务也停止计费。
换。 为了检查并校正待识别的图片,这就需要在模板图片中指定参照字段。通过参照字段的文字内容来判断是否属于同一种模板,通过参照字段的位置来校正待识别图片。 基本概念 参照字段为模板图片和待识别图片中的公共文字部分,所有需要识别的图片中都要包含参照字段,且位置必须固定。 套件提供了自
删除技能 如果已创建的应用不再使用,您可以删除应用释放资源。 操作步骤 登录华为HiLens管理控制台,在左侧导航栏选择“技能开发>技能管理”。 默认进入“基础技能”页签。 单击“可训练技能”,切换至“可训练技能”页签。 选择技能单击操作列的“删除”,确认信息后单击“确定”,删除技能。
在商品识别场景下,如果上传的数据包含未标注数据,您需要创建SKU,即商品各类单品的图片,方便后续针对数据集中的数据进行自动标注。 如果数据集是已标注数据,您可以选择不创建SKU,直接执行下一步。 创建SKU 标注数据 针对已经选择的数据和SKU,在应用开发的“数据标注”页面,ModelArts
检查是否存在训练数据过少的情况,建议每个类别的图片量不少于100个,如果低于这个量级建议扩充。 检查不同标签的样本数是否均衡,建议不同标签的样本数量级相同,并尽量接近,如果有的类别数据量很高,有的类别数据量较低,会影响模型整体的识别效果。 选择适当的学习率和训练轮次。 通过详细评估中的错误识别示例,有针对性地扩充训练数据。
检查是否存在训练数据过少的情况,建议每个类别的图片量不少于100个,如果低于这个量级建议扩充。 检查不同标签的样本数是否均衡,建议不同标签的样本数量级相同,并尽量接近,如果有的类别数据量很高,有的类别数据量较低,会影响模型整体的识别效果。 选择适当的学习率和训练轮次。 通过详细评估中的错误识别示例,有针对性地扩充训练数据。
检查是否存在训练数据过少的情况,建议每个类别的图片量不少于100个,如果低于这个量级建议扩充。 检查不同标签的样本数是否均衡,建议不同标签的样本数量级相同,并尽量接近,如果有的类别数据量很高,有的类别数据量较低,会影响模型整体的识别效果。 选择适当的学习率和训练轮次。 通过详细评估中的错误识别示例,有针对性地扩充训练数据。
检查是否存在训练数据过少的情况,建议每个类别的图片量不少于100个,如果低于这个量级建议扩充。 检查不同标签的样本数是否均衡,建议不同标签的样本数量级相同,并尽量接近,如果有的类别数据量很高,有的类别数据量较低,会影响模型整体的识别效果。 选择适当的学习率和训练轮次。 通过详细评估中的错误识别示例,有针对性地扩充训练数据。
相是指成分和组织均匀统一的物质部分,金属材料中,一般除了基体相外,还会存在许多的第二相。而第二相对整个金属材料的影响也是巨大的。在钢铁或其下游企业,常需要对钢铁显微成像的金相图片第二相面积含量进行测定。ModelArts Pro提供第二相面积含量测定工作流,能快速准确的返回第二相面积含量测定结果。
检查是否存在训练数据过少的情况,建议每个类别的图片量不少于100个,如果低于这个量级建议扩充。 检查不同标签的样本数是否均衡,建议不同标签的样本数量级相同,并尽量接近,如果有的类别数据量很高,有的类别数据量较低,会影响模型整体的识别效果。 选择适当的学习率和训练轮次。 通过详细评估中的错误识别示例,有针对性地扩充训练数据。
检查是否存在训练数据过少的情况,建议每个类别的图片量不少于100个,如果低于这个量级建议扩充。 检查不同标签的样本数是否均衡,建议不同标签的样本数量级相同,并尽量接近,如果有的类别数据量很高,有的类别数据量较低,会影响模型整体的识别效果。 选择适当的学习率和训练轮次。 通过详细评估中的错误识别示例,有针对性地扩充训练数据。
统自动旋转文字方向不正确的图片,保持图片中的文字方向正确。 单击预处理区域左上方的操作图标,调整模板图片的大小、方向等。 :单击图标重置图片为初始状态,即未进行任何处理的状态。 :单击图标,在“图片裁剪”窗口调整图片裁剪范围,然后单击“裁剪”,调整图片的大小。 :单击图标,在“图