华为云用户手册

  • 前提条件 使用 ModelArts Pro 服务请根据如何使用ModelArts Pro罗列的要求,提前完成准备工作。 保证华为云帐号不欠费。在ModelArts Pro控制台开发应用时,会占用OBS资源,需要收取一定费用,收费规则请参见 对象存储服务 OBS。 如果您的帐号是 IAM 帐号,在新建应用前,请先使用管理员帐号为IAM用户授予 文字识别 服务(Optical Character Recognition,简称OCR)操作权限权,详细操作请见给IAM用户授权。
  • 前提条件 使用ModelArts Pro服务请根据如何使用ModelArts Pro罗列的要求,提前完成准备工作。 保证华为云帐号不欠费。在ModelArts Pro控制台开发应用时,会占用OBS资源,需要收取一定费用,收费规则请参见对象存储服务OBS。 如果您的帐号是IAM帐号,在新建应用前,请先使用管理员帐号为IAM用户授予文字识别服务(Optical Character Recognition,简称OCR)操作权限权,详细操作请见给IAM用户授权。
  • 步骤1:准备数据 在本地准备好用于制作模板的图片、用于训练多模板分类器的训练集、用于评估模板的图片,图片要求如下: 只支持PNG、JPG、JPEG、BMP、TIFF格式的图片。 图像各边的像素大小在100px到4096px之间。 图像中识别区域有效占比超过80%,保证所有文字及其边缘包含在图像内。 支持图像任意角度的水平旋转。 目前不支持复杂背景(如户外自然场景、防伪水印等)和文字扭曲图像的文字识别。 用于训练多模板分类器的训练集,需要把各个模板的训练图片打包成一个文件夹并压缩成“zip”包,“zip”包文件大小不超过10M。 例如训练“保险单”模板的训练集,需要把同模板的保险单图片打包成一个文件夹并压缩成“zip”包。
  • 步骤1:准备数据 在开发应用之前,您需要设计好商品标签,并自行准备数据集并上传至OBS桶及文件夹中。 由于数据安全原因,本样例不提供具体的样例数据,仅提供适用本次样例的数据要求。本次样例需要准备两份数据,一份训练数据集用于训练模型,一份SKU数据用于创建SKU,即商品各类单品的图片,方便后续针对训练数据集中的数据进行自动标注。 商品标签 本次样例以蛋糕商品为例,设计“cream_cake”、“fruit_cake”、“cheese_cake”这三类标签。 数据格式 保证图片质量:不能有损坏的图片。 目前支持的格式包括JPG、JPEG、PNG、BMP。 训练数据集 本样例训练数据集使用未标注数据。 为了保证模型的预测准确度,训练样本跟真实使用场景尽量相似。 为保证模型的泛化能力,数据集尽量覆盖所有商品分类的图片,即覆盖所有标签的图片。 每个分类标签需要准备20个数据以上,为了训练出效果较好的模型,建议每个分类标签准备200个以上的数据。 所有图片放在一个文件目录下,示例如下所示。 ├─Training-Dataset │ IMG_20180919_114732.jpg │ IMG_20180919_114745.jpg │ IMG_20180919_114945.jpg 如果训练数据集使用已标注数据,数据要求请见数据集要求。
  • 步骤6:部署服务 “服务部署”页面,工作流会根据训练的模型自动创建技能,并显示如下默认参数。 技能名称:工作流自动创建技能后,生成默认技能名称。 设备类别:当前仅支持将技能安装至HiLens Kit设备上,安装技能之前,请在同一帐号同一区域的华为HiLens控制台注册HiLens Kit设备,详细操作指导请见注册HiLens Kit。 设备名称:显示同一帐号同一区域下注册在华为HiLens控制台的设备列表。 在“服务部署”页面,勾选待安装技能的设备。 勾选设备需处于“在线”状态。 图9 服务部署 单击技能名称右侧的“开始安装”,就开始安装技能。 设备列表的进度列会显示安装技能的进度,安装完成后,会显示“已安装”。
  • 步骤2:新建可训练技能 登录ModelArts Pro控制台,单击“HiLens套件”卡片的“进入套件”。 进入HiLens管理控制台,默认进入“全部模板”页面。 单击“可训练模板(Beta)”,切换至“可训练模板”页签。 选择技能,单击技能模板卡片的“新建技能”。 图1 新建技能 在“新建技能”对话框,根据业务需求填写“技能名称”、“技能负责人”和“技能描述”,选择“所属行业”,认真阅读并勾选“同意《公测使用服务协议》”。 确认信息后,单击“确定”。 跳至“应用开发”页面,开始开发技能。
  • 准备工作 注册华为帐号,开通华为云,并完成套件申请、访问授权配置等准备工作,详情请见准备工作。 保证华为云帐号不欠费。在ModelArts Pro控制台开发应用时,会占用对象存储服务OBS资源,需要收取一定费用,收费规则请参见OBS价格详情。 基于可训练技能模板新建技能,训练模型和部署技能会占用ModelArts训练资源,需要收取一定费用,收费规格请参见ModelArts价格详情。 在使用安全帽检测技能模板开发技能之前,您需要提前准备用于模型训练的数据,数据要求请见准备数据。
  • 步骤3:选择数据 在“数据选择”页面,单击“新建训练数据集”,右侧弹出“新建数据集”页面。 根据数据存储位置和数据标注情况,按表1填写数据集基本信息,然后单击“确定”。 图2 新建数据集 表1 新建训练数据集参数说明 参数 说明 数据集名称 待新建的数据集名称。 描述 数据集简要描述。 数据集状态 按上传的数据是否标注分为“已标注数据集”和“未标注数据集”。数据格式请见准备数据。 数据上传方式 训练数据上传的方式,当前仅支持把数据上传至OBS,默认为“选择obs文件”。 数据集输入位置 训练数据存储至OBS的位置。 单击“数据集输入位置”右侧输入框,在弹出的“数据集输入位置”对话框中,选择“OBS桶”和“文件夹”,然后单击“确定”。 本样例选择在步骤1:上传数据至OBS中创建的OBS桶和文件夹“/mapro-hilens/training-data-in”。 数据集输出位置 待新建的数据集存储至OBS的位置。 待新建的数据集有一个默认存储位置。如果需要修改数据集存储位置,请单击“数据集输出位置”右侧的“修改”,在弹出的“数据集输出位置”对话框中,选择“OBS桶”和“文件夹”,然后单击“确定”。 本样例选择在步骤1:上传数据至OBS中创建的OBS桶和文件夹“/mapro-hilens/training-data-out”。 勾选当前应用开发所需的训练数据集。 下方可查看标签解析。 图3 选择数据集 单击右下角的“下一步”。 进入“模型训练”步骤。
  • 步骤1:上传数据至OBS 按准备数据准备训练数据集,文件夹命名为“Training-Dataset”,并保存至本地。 登录OBS服务,创建桶和文件夹,用于存放数据集。 创建名称为“mapro-hilens”的OBS桶。 创建名称为“training-data-in”的文件夹用于存放训练数据集。 创建名称为“training-data-out”的文件夹用于存放输出的数据集。 创建OBS桶和文件夹的操作指导请参见创建桶和新建文件夹。为保证数据能正常访问,请务必保证创建的OBS桶与ModelArts Pro服务在同一区域。 参考上传文件,使用单个文件上传方式将本地准备的训练数据集“Training-Dataset”文件上传至OBS路径“mapro-hilens/training-data-in”
  • 步骤3:选择数据 在应用开发的“数据选择”页面,单击“新建数据集”。 右侧弹出“新建数据集”页面。 按表4填写数据集基本信息,然后单击“确定”。 图6 新建数据集 表4 新建数据集参数说明 参数 说明 推荐填写 数据集名称 待新建的数据集名称。支持输入中英文、数字、下划线及中划线。 本样例填写“test”。 描述 数据集简要描述。 - 数据集状态 上传的训练数据可以是已标注的数据,也可以是未标注的数据。 您可以根据自身业务选择“数据集状态”是“已标注数据集”还是“未标注数据集”。 数据集模板可在选择“数据集状态”后,单击下方的“文本分类已标注数据模板”或“文本分类未标注数据模板”,下载数据集模板至本地查看。 本样例使用已标注的数据集,所以选择“已标注数据集”。 如果您想手动修改标签,可单击数据集操作列的“标注”,进入数据集概览页单击右上角的“开始标注”,在“数据标注”页面手动标注数据,详细的操作指导请参考标注数据。 数据集输入位置 训练数据存储至OBS的位置。 单击“数据集输入位置”右侧输入框,在弹出的“数据集输入位置”对话框中,选择“OBS桶”和“文件夹”,然后单击“确定”。 选择步骤1:准备数据中提前上传数据集的OBS路径“mapro-nlp/data-in”。 数据集输出位置 待新建的数据集存储至OBS的位置。 单击“数据集输出位置”右侧的“修改”,在弹出的“数据集输出位置”对话框中,选择“OBS桶”和“文件夹”,然后单击“确定”。 选择步骤1:准备数据中提前创建好的输出数据集的OBS路径“mapro-nlp/data-out”。 勾选已上传的数据集。 服务进行标签解析,统计训练数据集中各个标签的样本数。 您可以选择打开“合并标签”开关,将样本数量较少的标签在模型训练中进行合并,以达到更优训练效果。 图7 数据选择 单击右下角“下一步”。 进入应用开发的“模型训练”页面。
  • 步骤4:训练模型 在应用开发的“模型训练”页面,勾选模型训练所使用的“预训练模型”。 当前服务提供预置预训练模型“BERT”、“TinyBERT”、“FastText”。本样例使用“FastText”模型。 在参数配置,填写“学习率”和“训练轮次”。 本样例使用“学习率”为“0.00001”,“训练轮次”为“3”。 单击右下角的“开始训练”,开始训练模型。 模型训练一般需要运行一段时间,等模型训练完成后,可查看“训练详情”、“准确率变化情况”和“误差变化”。 图8 训练详情 模型训练完成后,单击右下角的“下一步”。 进入应用开发的“模型评估”页面。
  • 步骤6:部署服务 在应用开发“服务部署”页面,按表5填写服务的相关参数,然后单击“部署”。 图11 服务部署 表5 服务部署参数说明 参数 说明 推荐填写 服务名称 待部署的服务名称,首次部署服务请单击可修改默认服务名称。 如果在不同版本非首次部署服务,服务名称不支持修改。 本样例使用默认服务名称。 描述 待部署服务的简要说明。 - 资源池 用于部署服务的资源池和资源类型。资源池可选“公共资源池”和“专属资源池”。 “公共资源池”:提供公共的大规模计算集群,资源按作业隔离。您可以按需选择不同的资源类型。 “专属资源池”:提供独享的计算资源,不与其他用户共享,更加高效。使用专属资源池需要在ModelArts创建专属资源池。 本样例选择“公共资源池”。 计算节点规格 界面上选择计算规格。 - 计算节点个数 设置当前版本模型的实例个数。如果节点个数设置为1,表示后台的计算模式是单机模式;如果节点个数设置大于1,表示后台的计算模式为分布式的。请根据实际编码情况选择计算模式。 本样例选择1个计算节点。 服务自动停止 设置服务自动停止的时间,在线服务运行状态在所选的时间点后自动停止,同时在线服务也停止计费。 本样例选择“1小时后”。 部署成功后,页面显示“服务部署成功”。您可以单击“查看应用监控”,进入应用监控页面查看监控信息,详情请见监控应用。
  • 步骤5:评估模型 在应用开发的“模型评估”页面,您可以针对当前版本的模型进行整体评估和详细评估。 “整体评估”左侧显示当前模型的“版本”、“标签数量”、“验证集数量”。 “整体评估”右侧显示当前模型的评估参数值,包括“精准率”、“召回率”、“F1值”。 图9 整体评估 在应用开发的“模型评估”页面,您可以搜索查看测试集中数据模型预测结果。 “详细评估”左侧在搜索框中搜索标签,右侧显示正确标签所对应样本的正确标签和预测标签,您可以对比正确标签和预测标签,判断当前模型预测该样本是否预测正确。 例如搜索框内输入标签“1”,下方会显示正确标签为“1”的样本中,预测正确的样本数在验证集中的占比。右侧显示正确标签为“1”的样本信息,包括样本的正确标签和预测标签。 图10 详细评估 单击右下角的“发布部署”。 进入应用开发的“服务部署”页面。
  • 步骤1:准备数据 在开发应用之前,您需要自行准备训练数据集并上传至OBS桶及文件夹中。由于数据安全原因,本样例不提供具体的样例数据,仅提供样例数据要求。 本样例使用已标注数据训练模型,数据集要求如下: 文件格式要求为txt或者csv,文件大小不能超过8MB。 以换行符作为分隔符,每行数据代表一个标注对象。 每个分类标签需要准备5个及以上数据,为了训练出效果较好的模型,建议每个分类标签准备100个以上的数据。 文本分类的标注对象和标注内容在一个文本文件内,标注对象与标注内容之间,多个标注内容之间可分别指定分隔符。 例如,文本文件的内容如下所示。标注对象与标注内容之间采用Tab键分隔。 手感很好,反应速度很快,不知道以后怎样 positive三个月前买了一个用的非常好果断把旧手机替换下来尤其在待机方面秒杀 positive没充一会电源怎么也会发热呢音量健不好用回弹不好 negative算是给自己的父亲节礼物吧物流很快下单不到24小时就到货了耳机更赞有些低音炮的感觉入耳很紧不会掉棒棒哒 positive 按上文要求准备训练数据集,并保存至本地,训练数据命名为“test.txt”。 登录OBS服务,创建桶和文件夹,用于存放数据集。 创建名称为“mapro-nlp”的OBS桶。 创建名称为“data-in”的文件夹用于存放训练数据集。 创建名称为“data-out”的文件夹用于存放输出的数据集。 创建OBS桶和文件夹的操作指导请参见创建桶和新建文件夹。为保证数据能正常访问,请务必确保创建的OBS桶与ModelArts Pro服务在同一区域。 参考上传文件,使用单个文件上传方式将本地准备的训练数据“test.txt”文件上传至OBS路径“mapro-nlp/data-in”下。
  • 上传对象 桶创建成功后,您可以通过以下多种方式将文件上传至桶,OBS最终将这些文件以对象的形式存储在桶中。 表2 不同访问方式上传对象的方法 访问方式 上传对象方法 控制台 通过控制台上传对象 OBS Browser+ 通过OBS Browser+上传对象 obsutil 通过obsutil上传对象 SDK 使用SDK上传对象,具体参考各语言开发指南的上传对象章节 API PUT上传、POST上传
  • 创建桶 桶是OBS中存储对象的容器,在上传对象前需要先创建桶。OBS提供多种使用方式,您可以根据使用习惯、业务场景选择不同的工具来创建桶。 表1 不同访问方式创建桶的方法 访问方式 创建桶方法 控制台 通过控制台创建桶 OBS Browser+ 通过OBS Browser+创建桶 obsutil 通过obsutil创建桶 SDK 使用SDK创建桶,具体参考各语言开发指南的创建桶章节 API 通过API创建桶
  • 如何提升模型训练效果? 在模型构建过程中,您可能需要根据训练结果,不停的调整数据、训练参数或模型,以获得一个满意的模型。 更新模型时,可以通过如下几方面提升模型训练效果: 检查是否存在训练数据过少的情况,建议每个标签的样本数不少于100个,如果低于这个量级建议扩充。 检查不同标签的样本数是否均衡,建议不同标签的样本数量级相同,并尽量接近,如果有的类别数据量很高,有的类别数据量较低,会影响模型整体的识别效果。 选择适当的学习率和训练轮次。 通过详细评估中的错误识别示例,有针对性地扩充训练数据。
  • 上传数据至OBS 使用ModelArts Pro进行应用开发时,您需要将数据上传至OBS桶中。 首先需要获取访问OBS权限,在未进行委托授权之前,无法使用此功能。您需要提前获得OBS授权,详情请见配置访问权限。 已创建用于存储数据的OBS桶及文件夹,且数据存储的OBS桶与ModelArts Pro在同一区域(目前仅支持华为-北京四),详情请见创建OBS桶。 上传数据至OBS,OBS上传数据的详细操作请参见《对象存储服务快速入门》。 您在创建OBS桶时,需保证您的OBS桶与ModelArts Pro在同一个区域。 建议根据业务情况及使用习惯,选择OBS使用方法。 如果您的数据量较小(小于100MB)或数据文件较少(少于100个),建议您使用控制台上传数据。控制台上传无需工具下载或多余配置,在少量数据上传时,更加便捷高效。 如果您的数据量较大或数据文件较多,建议选择OBS Browser+或obsutil工具上传。OBS Browser+是一个比较常用的图形化工具,支持完善的桶管理和对象管理操作。推荐使用此工具创建桶或上传对象。obsutil是一款用于访问管理OBS的命令行工具,对于熟悉命令行程序的用户,obsutil是执行批量处理、自动化任务较好的选择。 如果您的业务环境需要通过API或SDK执行数据上传操作,或者您习惯于使用API和SDK,推荐选择OBS的API或SDK方法创建桶和上传对象。 上述说明仅罗列OBS常用的使用方式和工具,更多OBS工具说明,请参见《OBS工具指南》。
  • 视觉套件 使用视觉套件开发应用时,需要上传图片数据训练模型。 上传的数据集要求如表3所示。 表3 视觉套件数据集要求 工作流 数据集要求 零售商品识别工作流 文件名规范,不能有中文,不能有+、空格、制表符。 保证图片质量:不能有损坏的图片;目前支持的格式包括JPG、JPEG、PNG、BMP。 为了保证模型的预测准确度,训练样本跟真实使用场景尽量相似。 为保证模型的泛化能力,数据集尽量覆盖所有标签的图片。 基于已设计好的商品标签准备图片数据。每个商品标签需要准备20个数据以上,为了训练出效果较好的模型,建议每个商品标签准备200个以上的数据。 针对未标注数据,要求将图片放在一个目录里,示例如下所示。 ├─dataset-import-example │ IMG_20180919_114732.jpg │ IMG_20180919_114745.jpg │ IMG_20180919_114945.jpg 如果导入位置为OBS,用户需具备此OBS路径的读取权限。 只支持JPG、JPEG、PNG、BMP格式的图片。 针对已标注数据,要求用户将标注对象和标注文件存储在同一目录,并且一一对应,如标注对象文件名为“IMG_20180919_114745.jpg”,那么标注文件的文件名应为“IMG_20180919_114745.xml”。 物体检测的标注文件需要满足PASCAL VOC格式。 零售商品工作流标注时需要勾勒出商品形状,必须使用多边形标注框。如果标注框坐标超过图片,将无法识别该图片为已标注图片。 更多详情请见准备数据。 热轧钢板表面缺陷检测工作流 文件名规范,不能有中文,不能有+、空格、制表符。 保证图片质量:不能有损坏的图片;目前支持的格式包括JPG、JPEG、PNG、BMP,且单张图片大小不能超过5MB,且单次上传的图片总大小不能超过8MB。 为了保证模型的预测准确度,训练样本跟真实使用场景尽量相似。 为保证模型的泛化能力,数据集尽量覆盖所有标签的图片。 基于已设计好的热轧钢板表面缺陷标签准备图片数据。每个分类标签需要准备20个数据以上,为了训练出效果较好的模型,建议每个分类标签准备200个以上的数据。 针对未标注数据,要求将图片放在一个目录里,示例如下所示。 ├─dataset-import-example │ IMG_20180919_114732.jpg │ IMG_20180919_114745.jpg │ IMG_20180919_114945.jpg 如果导入位置为OBS,用户需具备此OBS路径的读取权限。 只支持JPG、JPEG、PNG、BMP格式的图片。 针对已标注数据,要求用户将标注对象和标注文件存储在同一目录,并且一一对应,如标注对象文件名为“IMG_20180919_114745.jpg”,那么标注文件的文件名应为“IMG_20180919_114745.xml”。 热轧钢板表面缺陷检测工作流标注时标注框包含缺陷即可,因此建议使用矩形标注框标注图片。如果标注框坐标超过图片,将无法识别该图片为已标注图片。 物体检测的标注文件需要满足PASCAL VOC格式。 更多详情请见准备数据。 云状识别工作流 文件名规范,不能有中文,不能有+、空格、制表符。 保证图片质量,不能有损坏的图片。目前支持的格式包括JPG、JPEG、PNG、BMP。 不要把明显不同的多个任务数据放在同一个数据集内。 为了保证模型的预测准确度,训练样本跟真实使用场景尽量相似。 为保证模型的泛化能力,数据集尽量覆盖可能出现的各种场景。 每一类数据尽量多,尽量均衡。每个分类标签需要准备20个数据以上,为了训练出效果较好的模型,建议每个分类标签准备200个以上的数据。 针对未标注数据,要求将图片放在一个目录里,示例如下所示。 ├─dataset-import-example │ IMG_20180919_114732.jpg │ IMG_20180919_114745.jpg │ IMG_20180919_114945.jpg 如果导入位置为OBS,用户需具备此OBS路径的读取权限。 只支持JPG、JPEG、PNG、BMP格式的图片。 针对已标注数据,云状识别工作流仅支持一张图片识别单个标签,支持如下两种数据格式。 相同标签的图片放在一个目录里,并且目录名字即为标签名。当存在多层目录时,则以最后一层目录为标签名。 示例如下所示,其中“cumulus”和“stratus”分别为标签名。 dataset-import-example ├─cumulus │ 10.jpg │ 11.jpg │ 12.jpg │ └─stratus 1.jpg 2.jpg 3.jpg 当目录下存在对应的txt文件时,以txt文件内容作为图像的标签,优先级高于第一种格式。 示例如下所示,“import-dir-1”和“imort-dir-2”为导入子目录。 dataset-import-example ├─import-dir-1│ 10.jpg│ 10.txt │ 11.jpg │ 11.txt│ 12.jpg │ 12.txt└─import-dir-2 1.jpg 1.txt 2.jpg 2.txt 单标签的标签文件示例,如1.txt文件内容如下所示: stratus 只支持JPG、JPEG、PNG、BMP格式的图片。单张图片大小不能超过5MB,且单次上传的图片总大小不能超过8MB。 刹车盘识别工作流 文件名规范,不能有中文,不能有+、空格、制表符。 保证图片质量:不能有损坏的图片;目前支持的格式包括JPG、JPEG、PNG、BMP。 不要把明显不同的多个任务数据放在同一个数据集内。 为了保证模型的预测准确度,训练样本跟真实使用场景尽量相似。 为保证模型的泛化能力,数据集尽量覆盖可能出现的各种场景。 每一类数据尽量多,尽量均衡。每个分类标签需要准备20个数据以上,为了训练出效果较好的模型,建议每个分类标签准备200个以上的数据。 针对未标注数据,要求将图片放在一个目录里,示例如下所示。 ├─dataset-import-example │ IMG_20180919_114732.jpg │ IMG_20180919_114745.jpg │ IMG_20180919_114945.jpg 如果导入位置为OBS,用户需具备此OBS路径的读取权限。 只支持JPG、JPEG、PNG、BMP格式的图片。 针对已标注数据,刹车盘识别工作流仅支持一张图片识别单个标签,支持如下两种数据格式。 相同标签的图片放在一个目录里,并且目录名字即为标签名。当存在多层目录时,则以最后一层目录为标签名。 示例如下所示,其中“ventilation”和“physical”分别为标签名。 dataset-import-example ├─ventilation │ 10.jpg │ 11.jpg │ 12.jpg │ └─physical 1.jpg 2.jpg 3.jpg 当目录下存在对应的txt文件时,以txt文件内容作为图像的标签,优先级高于第一种格式。 示例如下所示,“import-dir-1”和“imort-dir-2”为导入子目录。 dataset-import-example ├─import-dir-1│ 10.jpg│ 10.txt │ 11.jpg │ 11.txt│ 12.jpg │ 12.txt└─import-dir-2 1.jpg 1.txt 2.jpg 2.txt 单标签的标签文件示例,如1.txt文件内容如下所示: ventilation 只支持JPG、JPEG、PNG、BMP格式的图片。单张图片大小不能超过5MB,且单次上传的图片总大小不能超过8MB。 无监督车牌检测工作流 文件名规范,不能有中文,不能有+、空格、制表符。 保证图片质量:不能有损坏的图片;目前支持的格式包括JPG、JPEG、PNG、BMP,单张图片大小不能超过5MB,且单次上传的图片总大小不能超过8MB。 不要把明显不同的多个任务数据放在同一个数据集内。 为了保证模型的预测准确度,训练样本跟真实使用场景尽量相似。 为保证模型的泛化能力,数据集尽量覆盖可能出现的各种场景。 数据集样本数应大于100,用于测试的已标注数据应不少于20张,样本数达1万张以上性能更优。 为了准确率,建议数据集中标注数据占总数据量的10%,用于测试模型,其余90%无需标注。 针对未标注数据,要求将图片放在一个目录里,示例如下所示。 ├─dataset-import-example │ IMG_20180919_114732.jpg │ IMG_20180919_114745.jpg │ IMG_20180919_114945.jpg 如果导入位置为OBS,用户需具备此OBS路径的读取权限。 针对已标注数据,要求用户将标注对象和标注文件存储在同一目录,并且一一对应,如标注对象文件名为“IMG_20180919_114745.jpg”,那么标注文件的文件名应为“IMG_20180919_114745.xml”。 物体检测的标注文件需要满足PASCAL VOC格式。无监督车牌检测工作流标注时标注框需要包含车牌,必须使用矩形标注框。如果标注框坐标超过图片,将无法识别该图片为已标注图片。 更多详情请见准备数据。
  • 自然语言处理 套件 自然语言处理套件使用开发应用时,需要上传文本数据用于模型训练。 数据集要求如表2所示。 表2 自然语言处理套件数据集要求 工作流 数据集要求 通用文本分类工作流 文件格式要求为txt或者csv,且编码格式为“UTF-8”格式,文件大小不能超过8MB。 以换行符作为分隔符,每行数据代表一个样本数据,单个样本不能有分行显示,不支持换行。 基于已设计好的分类标签准备文本数据。每个分类标签需要准备5个及以上数据,为了训练出效果较好的模型,建议每个分类标签准备100个以上的数据。 针对未标注数据,将待标注的内容放在一个文本文件内,通用文本分类工作流仅支持中文文本内容的分类。 针对已标注数据,文本分类的标注对象和标签在一个文本文件内,标注对象与标签之间,采用Tab键分隔,多个标签之间采用英文逗号分隔。 例如,文本文件的内容如下所示。标注对象与标注内容之间采用Tab键分隔。 华为通过不断的技术创新,来应对来自全球政治环境的挑战 科技,政治最近科技创业公司纷纷上市科创板 科技,经济 多语种文本分类工作流 文件格式要求为txt或者csv,且编码格式为“UTF-8”格式,文件大小不能超过8MB。 以换行符作为分隔符,每行数据代表一个样本数据,单个样本不能有分行显示,不支持换行。 文本数据至少包含2个及以上的标签。每个分类标签需要准备5个及以上数据,为了训练出效果较好的模型,建议每个分类标签准备100个以上的数据。 多语种文本分类工作流仅支持对单语种的文本分类,当前支持文本分类的语种包括英语、法语、德语、西班牙语、葡萄牙语、阿拉伯语等。暂不支持对同一文本中含多语种的文本进行分类训练。 针对未标注数据,将待标注的内容放在一个文本文件内。 针对已标注数据,文本分类的标注对象和标签在一个文本文件内,标注对象与标签之间,采用Tab键分隔,多个标签之间采用英文逗号分隔。 例如,文本文件的内容如下所示。标注对象与标注内容之间采用Tab键分隔。 It feels very good, and the reaction speed is very fast. positiveI bought one three months ago and used it very well and decisively replaced the old phone. positiveHow can the power become hot even if the battery is not charged for a while? negativeThe headphones are great. Some subwoofers feel very tight in the ears and won’t fall off. positive 通用实体抽取工作流 文件格式要求为txt或者csv,且编码格式为“UTF-8”格式,文件大小不能超过8MB。 以换行符作为分隔符,每行数据代表一个样本数据,单个样本不能有分行显示,不支持换行。 基于已设计好的实体标签准备文本数据。每个实体标签需要准备20个及以上数据,为了训练出效果较好的模型,建议每个实体标签准备100个以上的数据。 本工作流只支持上传未标注数据,将待标注的内容放在一个文本文件内。 txt文件编码保存为“UTF-8”格式: 打开txt文件。 单击左上角的“文件”,选择“另存为”。 “编码”选择“UTF-8”格式。 csv文件编码保存为“UTF-8”格式: 右键单击csv文件,“打开方式”选择“记事本”。 单击左上角的“文件”,选择“另存为”。 “编码”选择“UTF-8”格式。
  • 文字识别套件 文字识别套件当前提供了单模板工作流和多模板工作流,开发应用时需要上传模板图片,明确以哪张图片作为模板训练文字识别模型。 上传图片的要求如表1所示。 表1 文字识别套件数据集要求 工作流 数据集要求 单模板工作流 保证图片质量:不能有损坏的图片;目前支持的格式包括JPG、JPEG、PNG、BMP。 图片最大边不大于4096px,最小边不小于100px,且大小不超过4M。 多模板工作流 保证图片质量:不能有损坏的图片;目前支持的格式包括JPG、JPEG、PNG、BMP。 图片最大边不大于4096px,最小边不小于100px,且大小不超过4M。 训练分类器的数据集要求将图片放在一个目录里,并压缩成zip文件,文件大小不应大于10M。
  • 处理步骤 子账号(IAM用户)需要联系主账户授予使用OCR服务的权限。为IAM用户授权过程请参见为IAM用户分配权限、IAM用户登录并验证权限。 授权时,子账号所在的用户组,需要设置为OCR FullAccess权限。 图1 用户组权限 授权后,子账号登录自定义OCR(ModelArts Pro )页面,服务会自动开通。 在子用户已经具备OCR权限,并开通ModelArts Pro后,如果仍然无法调用,请检查子用户是否有“编程访问权限”。 图2 编程访问权限
  • 配置访问权限 在您使用ModelArts Pro过程中,ModelArts Pro需要访问ModelArts服务的云资源,如果没有授权,相关功能将不能正常使用。因此,在使用ModelArts Pro之前,需要进行访问授权。ModelArts Pro当前仅支持使用委托授权。 如果已获得ModelArts委托授权,则可以直接进入ModelArts Pro控制台使用行业套件,无需再次配置访问权限。 如果未获得ModelArts委托授权和访问密钥(AK/SK)授权,当进入ModelArts Pro控制台的行业套件时,会弹出“访问授权”对话框。 在弹出的“访问授权”对话框填写授权信息,然后单击“同意授权”,完成访问授权的配置。 “用户名”为当前需要授权的用户名,保持默认值。 “委托”选择“modelarts_agency”。 勾选“我已经详细阅读并同意《ModelArts服务声明》”。 图2 访问授权 如果未获得ModelArts委托授权,但是已获得访问密钥(AK/SK)授权,当进入ModelArts Pro控制台的行业套件时,在弹出的“访问授权”对话框中会提示删除密钥授权。 单击“访问授权”对话框上方的“删除”,删除旧的授权。 删除成功后,对话框中就没有删除密钥授权的提示了。 在“访问授权”对话框填写授权信息,然后单击“同意授权”,完成访问授权的配置。 “用户名”为当前需要授权的用户名,保持默认值。 “委托”选择“modelarts_agency”。 勾选“我已经详细阅读并同意《ModelArts服务声明》”。
  • 申请套件 登录ModelArts Pro控制台,选择行业套件卡片并单击“申请公测”,在申请公测页面根据界面提示填写所需信息。 申请公测操作完成后,单击“前往我的公测”,进入“我的公测”页面。当“审批状态”显示为“审批通过”时,表示您已经获得了该行业套件的公测权限。 申请行业套件的公测权限后,在ModelArts Pro控制台选择行业套件卡片并单击“进入套件”,即可进入行业套件的控制台。 例如单击自然语言处理套件卡片的“进入套件”,即可进入自然语言处理套件的控制台。 图1 进入套件
  • 部署服务后,调用API失败怎么办? 在ModelArts Pro使用预置工作流部署服务后,可通过调用API和SDK调用已部署的在线服务。如果调用API失败,可根据返回的错误码及错误信息解决问题,具体的错误码说明请见表1。 表1 API调用指导 行业套件 调用API方法 错误码 文字识别套件 OCR_API参考 OCR错误码 自然语言处理套件 NLP_API参考 NLP错误码 视觉套件 Image_API参考 Image错误码
  • 应用场景 特定行业下希望解决特定问题的场景。 文字识别套件 用户认证识别 识别证件中关键信息,节省人工录入,提升效率,降低用户实名认证成本,准确快速便捷。 快递单自动填写 识别图片中联系人信息并自动填写快递单,减少人工输入。 合同录入与审核 自动识别结构化信息与提取签名盖章区域,有助快速审核。 自然语言处理套件 通用文本分类场景。 智能问答 通过中文分词、短文本相似度、命名实体识别等自然语言处理相关技术,计算两个问题对的相似度,可解决问答、对话、语料挖掘、知识库构建等问题。 内容推荐 通过文本分类预测模型,精确匹配出语义相似的内容,快速构建内容推荐场景。 视觉套件 商品识别 无人超市构建商品视觉自动识别模型,无需扫码,AI自主结账。 气象智能预测 基于视频和图片数据,AI识别天气现象等气象要素,实现自动化智能预测场景。 HiLens套件 智慧园区 园区场景下,实现车牌识别、安全帽检测等功能。 智慧家庭 家庭检测、家居智能化场景下,实现手势识别、哭声检测等功能。 智慧商超 商店和超市场景下,实现VIP识别、客流量统计等功能。
  • ModelArts与ModelArts Pro的区别 ModelArts是一站式AI开发管理平台,提供领先算法技术,保证AI应用开发的高效和推理结果的准确,同时减少人力投入。ModelArts致力于底层模型专业开发、调参等。 ModelArts Pro根据预置工作流生成指定场景模型,无需深究底层模型开发细节。ModelArts Pro致力于解决通用API局限性、AI算法开发门槛高等难题,提供行业AI定制化开发套件,沉淀行业知识,让开发者聚焦自身业务,底层依托ModelArts平台。 图1 功能架构
  • HiLens套件 HiLens套件当前处于公测阶段,可免费试用。但是由于使用过程中依赖对象存储服务(Object Storage Service,OBS)、ModelArts服务和华为HiLens服务的使用,依赖服务会产生相应的费用。 HiLens套件安全帽检测技能工作流中训练安全帽检测模型,会使用到ModelArts的计算资源,价格详情请见ModelArts价格详情。 HiLens套件涉及OBS收费的功能如表5所示,价格详情请见OBS价格详情。 HiLens套件部署技能至边缘设备,并在华为HiLens平台上进行模型管理和技能管理,华为HiLens服务价格详情请见计费说明。 表5 HiLens套件涉及OBS收费功能 功能 与OBS关系 上传训练数据集 ModelArts Pro上传的训练数据集存储在OBS中。 管理数据集 数据集存储在OBS中。 数据集的标注信息存储在OBS中。 支持从OBS中导入数据。 训练模型 训练模型使用的数据集存储在OBS中。 训练模型的运行脚本存储在OBS中。 训练模型输出的模型存储在指定的OBS中。
  • 文字识别套件 计费项 按API调用次数按需计费。 只有调用成功才会计算调用次数,其中2xx状态码表示调用成功。 计费模式 按需计费 指按照自定义模板文字识别API调用次数、阶梯价格计费,按月累计,一个自然月后次数清零重新累计。具体计费价格请参见文字识别价格详情,类型选择“ 自定义模板OCR ”。 套餐包 用户可以购买套餐包,扣费时,优先在套餐包内进行抵扣。超出套餐包额度,转回按需计费方式。具体计费价格请参见文字识别价格详情,类型选择“自定义模板OCR”。
  • 自然语言处理套件 计费项 自然语言处理套件具体收费项请参见表1,具体计费价格请参见ModelArts价格详情。 表1 自然语言处理计费项说明 计费项 说明 训练文本分类模型、训练实体抽取模型 工作流中训练模型时,会使用到ModelArts计算资源。 部署服务(在线服务) 工作流中部署在线服务时,会使用到计算型实例资源。 计费模式 按需购买。购买方式比较灵活,可以即开即停。 依赖服务计费 由于使用自然语言处理套件的过程中依赖对象存储服务(Object Storage Service,OBS)的使用,OBS服务会产生相应的费用。 自然语言处理套件涉及OBS收费的功能如表2所示,价格详情请见OBS价格详情。 表2 自然语言处理套件涉及OBS收费功能 功能 与OBS关系 上传训练数据集 ModelArts Pro上传的训练数据集存储在OBS中。 标注数据 ModelArts Pro标注的数据存储在OBS中。 管理数据集 数据集存储在OBS中。 数据集的标注信息存储在OBS中。 支持从OBS中导入数据。 训练模型 训练模型使用的数据集存储在OBS中。 训练模型的运行脚本存储在OBS中。 训练模型输出的模型存储在指定的OBS中。 部署应用 将存储在OBS中的应用部署上线为在线服务。
共99354条