检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
与ModelArts的关系 ModelArts Pro底层依托一站式AI 开发管理平台ModelArts 提供的领先算法技术,保证AI 应用开发的高效和推理结果的准确,同时减少人力投入。ModelArts的更多信息请参见AI开发平台Modelarts。 与华为HiLens的关系 ModelArts
ModelArts与ModelArts Pro的区别 ModelArts是一站式AI开发管理平台,提供领先算法技术,保证AI应用开发的高效和推理结果的准确,同时减少人力投入。ModelArts致力于底层模型专业开发、调参等。 ModelArts Pro根据预置工作流生成指定场景模
ModelArts Pro的应用场景和用户群体 ModelArts Pro基于华为云的先进算法和快速训练能力,提供预置工作流和模型。用户可以使用ModelArts Pro套件中特定行业场景的预置行业工作流,满足快速定制的需求,快速进行应用开发。 当前ModelArts Pro开放的预置套件有文
、PNG、BMP。 不要把明显不同的多个任务数据放在同一个数据集内。 为了保证模型的预测准确度,训练样本跟真实使用场景尽量相似。 为保证模型的泛化能力,数据集尽量覆盖可能出现的各种场景。 数据集样本数应大于100,用于测试的已标注数据应不少于20张,样本数达1万张以上性能更优。
待新建的数据集存储至OBS的位置。 单击“数据集输出位置”右侧的“修改”,在弹出的“数据集输出位置”对话框中,选择“OBS桶”和“文件夹”,然后单击“确定”。 选择步骤1:准备数据中提前创建好的输出数据集的OBS路径“mapro-nlp/data-out”。 勾选已上传的数据集。
更新应用版本 在模型构建过程中,您可能需要根据训练结果,不停的调整数据、训练参数或模型,以获得一个满意的模型。 因此您可以修改模型的配置信息以匹配业务变化。每修改一次,更新成一个版本,不同的作业版本之间,能快速进行对比,获得对比结果。 前提条件 已在HiLens套件控制台选择“H
文字识别套件 文字识别套件基于丰富的文字识别算法和行业知识积累,帮助客户快速构建满足不同业务场景需求的文字识别服务,实现多种版式图像的文字信息结构化提取。 文字识别套件当前提供了单模板工作流和多模板工作流,自主构建文字识别模板,识别模板图片中的文字,提供高精度的文字识别模型,保证结构化信息提取精度。
是为企业级AI应用打造的专业开发套件。基于华为云的先进算法和快速训练能力,提供预置工作流和模型,提升企业AI应用的开发效率,降低开发难度。文字识别套件基于丰富的文字识别算法和行业知识积累,帮助客户快速构建满足不同业务场景需求的文字识别服务,实现多种版式图像的文字信息结构化提取。
支持图像任意角度的水平旋转。 目前不支持复杂背景(如户外自然场景、防伪水印等)和文字扭曲图像的文字识别。 用于训练多模板分类器的训练集,需要把各个模板的训练图片打包成一个文件夹并压缩成“zip”包,“zip”包文件大小不超过10M。 例如训练“保险单”模板的训练集,需要把同模板的保险单图
训练分类器 确定模板图片的参照字段和识别区后,多模板分类工作流在模板数量较多,或版式相似度较高的情况下,建议针对不同的模板上传对应的训练集数据,用于训练模板分类模型,使服务能够精准地分类多个模板图片,然后对多个模板图片进行文字识别和结构化提取。 前提条件 已在文字识别套件控制台选
文字识别套件基于丰富的文字识别算法和行业知识积累,帮助客户快速构建满足不同业务场景需求的文字识别服务,实现多种版式图像的文字信息结构化提取。 文字识别套件的介绍请参见产品介绍。 预置工作流 文字识别套件当前提供了单模板工作流和多模板工作流,自主构建文字识别模板,识别模板图片中的文字,提供高
确文字识别的模板类型,明确以哪几种板式图片作为模板训练文字识别模型,基于自己的业务需求制定针对性的文字识别模型。例如上传两种不同格式的发票图片作为模板,训练的文字识别模型就能识别并提取这两种格式发票上的关键字段。 前提条件 已授权ModelArts服务和对象存储服务(OBS)。
Pro在数据集管理过程中,针对同一个数据源,对不同时间标注后的数据,按版本进行区分,方便后续模型构建和开发过程中,选择对应的数据集版本进行使用。数据标注完成后,您可以将数据集当前状态进行发布,生成一个新的数据集版本。 关于数据集版本 针对刚创建的数据集(未发布前),无数据集版本信息,必
自然语言处理套件提供了通用文本分类工作流,您可以通过预置的工作流,自主上传训练数据,训练高精度的文本预测分类模型,适配不同行业场景的业务数据,快速获得定制服务。 图1 使用预置工作流开发应用 表1 使用预置工作流开发应用流程 流程 说明 详细指导 选择自然语言处理套件 根据您的实际使用需求选择自然语言处理套
符。 保证图片质量:不能有损坏的图片;目前支持的格式包括JPG、JPEG、PNG、BMP。 不要把明显不同的多个任务数据放在同一个数据集内。 为了保证模型的预测准确度,训练样本跟真实使用场景尽量相似。 为保证模型的泛化能力,数据集尽量覆盖可能出现的各种场景。 每一类数据尽量多,尽
符。 保证图片质量,不能有损坏的图片。目前支持的格式包括JPG、JPEG、PNG、BMP。 不要把明显不同的多个任务数据放在同一个数据集内。 为了保证模型的预测准确度,训练样本跟真实使用场景尽量相似。 为保证模型的泛化能力,数据集尽量覆盖可能出现的各种场景。 每一类数据尽量多,尽
划线下划线外的特殊符号。 保证图片质量:不能有损坏的图片;目前支持的格式包括JPG、JPEG、PNG、BMP。 不要把明显不同的多个任务数据放在同一个数据集内。 为了保证模型的预测准确度,训练样本跟真实使用场景尽量相似。 为保证模型的泛化能力,数据集尽量覆盖可能出现的各种场景。
HiLens套件 HiLens为端云协同AI应用开发平台,提供简单易用的开发框架、开箱即用的开发环境、丰富的AI技能市场和云上管理平台,帮助用户高效开发多模态AI技能,并将其快速部署到端侧计算设备。 HiLens套件提供可训练技能模板开发技能,无需代码,只需自主上传训练数据,快速
针对场景领域提供预训练模型,分类准确率高。 提供完善的文本处理能力,支持多种数据格式内容,适配不同场景的业务数据。 可根据使用过程中的反馈持续优化模型。 通用实体抽取工作流 功能介绍 支持自主上传文本数据,构建高精度实体抽取模型,适配不同行业场景的业务数据,快速获得定制服务。 适用场景 知
Pro包括自然语言处理套件、文字识别套件、视觉套件等,能够快速响应不同行业、不同场景的AI落地需求。 功能架构 ModelArts Pro定位为企业AI 生产力工具,提供了一种全新的行业AI 落地方式,将算法专家的积累和行业专家的知识沉淀在相应的套件和行业工作流(Workflow) 中,真正实现赋能行业AI