AI开发平台MODELARTS-华为云

AI开发平台MODELARTS-算链编排界面说明:算子连线

算子连线算子之间的连线具有两种意义，分为控制流和数据流。控制流表示连线两端算子具有控制关系，即算子运行顺序。数据流表示连线两端算子之间具有数据交换关系（简称数据关系），具有数据关系的两个算子，源算子的某个输出为目标算子的某个输入。 MLS中未刻意区分这两种关系，一般而言，存在数据交换的算子同时具有控制关系和数据关系，而不存在数据交换的算子之间则仅具有控制关系。表5 算子连线说明流状态状态说明限制说明数据流-单个输入输出源算子具有单输出，目标算子具有单输入如果源算子输出数据的类型和目标算子输入数据的类型不一致，则连线失败。数据流-多个输入输出源算子或目标算子具有多个输出或输入会出现输入输出选择框，如果选择的源算子输出数据的类型和目标算子输入数据的类型不一致，则连线失败。控制流源算子和目标算子均无输出或输入无。

AI开发平台MODELARTS

AI开发平台MODELARTS-算链编排界面说明:算子菜单

算子菜单鼠标右键单击算子节点出现算子菜单，包含编辑、删除、高亮显示、设置参数、编辑代码、运行至此算子、运行当前算子、展示运行结果功能，如图3所示。算子菜单说明如表4所示。图3 算子菜单表4 算子菜单说明菜单名称操作说明编辑可对选中算子进行剪切、复制操作；选择粘贴，对之前复制的算子进行粘贴操作。删除对选中算子进行删除操作。高亮显示选择分支亮显，对选中算子所在算链分支高亮。选择上行亮显，对选中算子前（包含该算子）的分支高亮。选择下行亮显，对选中算子后（包含该算子）的分支高亮。选择取消高亮，使其恢复正常状态。设置参数单击“设置参数”，算链界面右侧滑出参数编辑框。修改参数后，单击“确定”，保存参数设置；单击“取消”则不保存。编辑代码单击“编辑代码”，算链界面右侧滑出编辑代码框，如图4所示。上方为自定义编辑算子框，可编辑代码；单击“执行代码”，结果将展现在代码执行结果框；单击“保存”，则将修改后的代码保存并退出边界代码界面；单击“取消”，则不保存且退出；右上角为控制选择项，选中“代码”即展示代码；选中“结果”即显示结果；单击“全屏”，编辑界面将铺满算链编辑界面；单击“退出全屏”则取消全屏。运行至此算子算链运行至该算子。运行当前算子算链运行当前选中算子。展示运行结果展示当前选中算子的运行结果，如果该算子为未运行状态，则运行至当前算子后，展示结果。图4 编辑算子代码

AI开发平台MODELARTS

AI开发平台MODELARTS-算链编排界面说明:界面菜单

界面菜单在算链编辑区右键界面空白处，出现界面菜单，包含添加评论、全选、编辑、撤销、恢复、取消高亮功能。图2 界面菜单表2 界面菜单说明操作名称功能说明添加评论同导航栏添加评论功能。全选选中界面上所有算子和评论。使用键盘全选键Ctrl+A也可实现该功能。编辑选中算子或评论，可进行剪切、复制操作；选择粘贴，对之前剪切、复制的算子或评论进行粘贴操作。撤消同导航栏撤消功能。恢复同导航栏恢复功能。取消亮显消除界面上所有高亮的算子和评论。

AI开发平台MODELARTS

AI开发平台MODELARTS-算链编排界面说明:Kernel切换及状态

Kernel切换及状态在Jupyter体系结构中，Kernel是由服务器启动的独立进程，不同的Kernel具有不同的编程语言和环境，用户可通过kernel运行代码。目前，MLS的一个Editor对应一个Kernel，Editor中的所有算子会在此Kernel中运行。 Kernel切换及状态同算链编排界面导航栏kernel切换及状态。支持的Kernel 目前MLS仅支持PySpark-2.4.5。

AI开发平台MODELARTS

AI开发平台MODELARTS-算链编排界面说明:导航按钮

导航按钮算链编排界面导航栏提供丰富的界面操作，包括运行、保存、清除、撤销、恢复等功能。图1 算链编排界面导航栏表1 导航栏功能说明图标操作名称功能说明运行算链运行界面上的算链。保存算链保存算链。清除算链一键清除画布所有算子及连线。撤销撤销上一步的操作。键盘撤销操作也可实现该功能。恢复恢复撤销的操作。剪切选中界面上的算子，单击剪切图标即删除该算子。可以使用键盘Shift选中多个算子，同时剪切。剪切后可粘贴算子。复制选中界面上的算子，单击复制图标或键盘复制操作Ctrl+C，即复制该算子。可同时复制多个算子。粘贴单击粘贴图标或键盘粘贴操作Ctrl+V，即可将复制算子粘贴在画布中。添加评论选中界面上的算子，单击添加评论，可以在画布空白处为该算子添加标注或注释。可以同时选中多个算子添加评论。删除选中界面上的算子，删除该算子。可删除多个算子。水平排列将画布中的算链进行水平方向的重排列。垂直排列将画布中的算链进行垂直方向的重排列。转换至Notebook 将画布中的所有算链按照顺序转化为一个ipynb后缀格式的Notebook文件。转换至Python 将画布中的所有算链按照顺序转化为一个py后缀格式的Python脚本。算链发布将算链一键发布至ModelArst Workflow。Workflow是邀测功能暂未上线。放大将画布放大。缩小将画布缩小。自适应屏幕将画布重定位到画布中间。 kernel切换单击右上角kernel信息框，如，可切换kernel。 kernel状态表示kernel处于空闲状态，表示kernel处于运行状态。

AI开发平台MODELARTS

AI开发平台MODELARTS-使用MLS预置算链进行机器学习建模:Step1 运行预置算链

Step1 运行预置算链单击资产浏览图标，选择“算链”，单击展开，找到预置算链“销售销量训练”，如图1所示。图1 预置算链双击打开销售销量训练，并选择Kernel PySpark-2.4.5。保存模型节点将训练完成的模型保存到本地默认位置，用于进行销售销量预测。您也可以右键该节点选择“参数设置”，如图2所示。在页面右侧自行设置模型路径，指定存储位置，如图3所示为默认存储路径“./output_model/sales_model”。图2 右键设置参数图3 设置保存模型参数单击导航栏运行算链，如图4所示。运行过程需要几分钟，请耐心等待。当所有节点都变为绿色，表示算链运行成功，如图5所示。图4 单击运行图5 训练算链运行成功当算链运行完毕后，选中任意节点，右键选择“展示运行结果”，查看该节点的运行结果，如图6所示。如果无运行结果，如图7所示；如果有运行结果，如图8所示，例如模型应用节点和回归评估节点。图6 右键选择展示运行结果图7 无运行结果图8 有运行结果

AI开发平台MODELARTS

AI开发平台MODELARTS-孤立森林[PySpark版]:样例

样例数据样本为信用卡欺诈检测数据，包含Time，V1，V2，V3，V4，V5，V6，V7，V8，V9，V10，V11，V12，V13，V14，V15，V16，V17，V18，V19，V20，V21，V22，V23，V24，V25，V26，V27，V28，Amount等特征。图1 数据样本配置流程下图上边部分运行孤立森林算子，得到异常检测结果和孤立森林模型，下边部分加载保存的模型和新的数据进行预测。图2 配置流程参数设置图3 参数设置界面查看结果

AI开发平台MODELARTS 数据分析

AI开发平台MODELARTS-孤立森林[PySpark版]:参数说明

参数说明参数是否必选参数说明默认值 b_use_default_encoder 是是否对数据中的类别型特征列进行编码处理。 True input_features_str 否选择特征列，逗号分隔。无 num_trees 是孤立森林中树的个数。 100 bootstrap 是采样数据构建孤立树时是否为有放回采样。 False max_samples 是训练单棵孤立树的最大样本个数，该值小于1.0时该值乘以总样本数取整得到单棵孤立树的训练样本数，大于1.0时取整得到单棵数的训练样本数。 256.0 max_features 是参与训练的特征数，小于等于1.0时特征为该值乘以总特征个数。 1.0 feature_vector_col 是 input_features_str中的特征列处理为向量列后的列名。 "assembled_features" prediction_col 是预测结果列名。 "prediction" score_col 是异常分数列，该列数值为孤立森林算法中每个样本的分数值，值越大异常可能越大。 "outlier_score" contamination 是异常值比例，取值0到1浮点数，score_col列中数值大于contamination * 100%分位数值的样本视为异常值，如果为0.0则prediction_col列输出均为0.0非异常。 0.0 contamination_error 是计算分位数时允许的误差，如果为0.0则实际计算时为contamination * 0.01。 0.0 seed 是随机种子。 0

AI开发平台MODELARTS 数据分析

AI开发平台MODELARTS-从0到1利用ML Studio进行机器学习建模:Step3 使用ML Studio预测

Step3 使用ML Studio预测新建一个预测算链。拖拽读取模型算子至画布，设置“input_model_path”，为预测算链中保存模型路径，例如“./output/SalesForecast”。拉取读取数据算子，设置“input_file_path”，为测试数据的文件路径，如“/home/ma-user/work/.ml-workspace/built-in-workflow/sales_forecast/sales_predict.csv”。拉取模型应用算子，分别连接读取模型算子和读取数据算子，端口选择分别如图15和如图16所示。图15 从读取模型算子连接模型应用算子图16 从读取数据算子连接模型应用算子最终预测算链如图17所示。单击运行，得到并查看预测运行结果。图17 运行预测算链

AI开发平台MODELARTS ML Studio快速入门

AI开发平台MODELARTS-从0到1利用ML Studio进行机器学习建模:Step2 使用ML Studio建模

Step2 使用ML Studio建模从左侧资产浏览界面拖拽预置算子或自定义算子至右侧算链编辑界面，如图2所示，则创建算子成功。图2 拖拽创建节点在画布中，鼠标移至算子节点，从右侧输出端口，如图3所示，拖动连线至下一个算子节点，鼠标尽量放置至如图4 连线结束位置所示红框位置。图3 从输出端口移动至下一节点图4 连线结束位置进行算子连线。算子之间具有数据的流入流出关系，如果源算子与目标算子的输出输入端口数量都为1，则直接连线，如图4所示。鼠标右键单击读取数据算子，选择“设置参数”，如图5所示在右侧滑出的参数设置窗口填写输入路径，例如“/home/ma-user/work/.ml-workspace/built-in-workflow/sales_forecast/sales_train.csv”，表示读取文件为该路径下的“sales_train.csv”。图5 读取数据参数设置如果源算子和目标算子其中一个及以上具有多个输出输入端口，连线时需选择输入输出端口，如图6所示。数据集分割算子连线随机森林回归算子，数据集分割算子具有输出端口datafram_1和dataframe_2，单击下拉框选择dataframe1为输出端口，随机森林回归算子只有输入端口dataframe，该步操作将数据dataframe1传入随机森林回归算子作为训练数据。图6 数据集分割连线随机森林回归右键单击随机森林回归算子，选择“设置参数”，在滑出的参数设置窗口填写标签列为“revenue”，如图7所示。图7 随机森立回归参数设置如图8所示，随机森林回归连线模型应用，随机森林回归算子输出pipeline_model传入模型应用算子, 作为模型应用算子的输入模型。图8 随机森林回归连线模型应用模型应用算子的dataframe由数据集分割算子的dataframe_2输入，如图9所示。图9 数据集分割连线模型应用添加回归评估算子作为评估算子，将其与模型应用连线，右键选择设置参数，填写标签列为“revenue”，如图10所示。图10 回归评估参数设置最后添加保存模型算子，将其与随机森林回归算子连线，右键该算子选择参数设置，如图11所示。填写模型保存路径（文件夹级）"./output/SalesForecast"，表示输出模型保存到根目录下output/SalesForecast文件下。图11 保存模型参数设置算链创建完成，单击运行，耐心等待几分钟，运行成功，如图12所示。图12 算链运行成功如果运行失败，双击失败算子或者右键该算子选择编辑代码，如图13所示。在编辑算子代码界面可修改代码进行调试，如图14所示。图13 右键选择编辑代码图14 编辑代码

AI开发平台MODELARTS ML Studio快速入门

AI开发平台MODELARTS-算链编排操作:建立算子节点关联（连线）

建立算子节点关联（连线）鼠标移至算子节点，从右侧输出端口，如图4所示，拖动连线至下一个算子节点，鼠标尽量放置至如图5红框位置，如果不在此区域，将会导致算子连线失败。图4 从输出端口移动至下一节点图5 连线结束位置如果源算子与目标算子之间存在输入输出关系，分为两种情况，如表1介绍。表1 输入输出关系输入输出说明操作源算子单输出，目标算子单输入如果输出数据类型和输入类型一致，则连接成功；否则连接失败，如图5所示。源算子和目标算子中有一个及以上具有多输入输出关系弹出输入输出选择框，选择输入输出端口，单击OK，如果输出数据类型和输入类型一致，则连接成功；否则连接失败。图6 算子连线失败

AI开发平台MODELARTS 算链操作

AI开发平台MODELARTS-算链编排操作:算链转换

算链转换转换成Notebook 算链界面所有算子按照DAG顺序转换为一个Notebook文件并打开。单击导航栏转化为Notebook按钮，选择另存为路径，默认路径为当前MLS Editor所在路径，如图9所示。单击保存后，自动打开转换后的Notebook文件，如图10所示。图9 选择Notebook文件保存路径图10 自动打开Notebook文件转换成python 算链界面所有算子按照顺序转换为一个python脚本并打开。操作过程同转换为Notebook。

AI开发平台MODELARTS 算链操作

AI开发平台MODELARTS-算链编排操作:编辑算链中算子

编辑算链中算子算子代码修改双击界面中的算子节点或在算子节点上右键选择“编辑代码”功能，即可在算链编排界面右侧滑出算子编辑器进行算子代码编辑。图7 算子编辑器算子代码调试算子代码进行编辑后，单击下方“执行代码”，即可调试该算子，算子结果展示在“代码执行结果”界面。算子代码保存单击下方“保存并关闭”，保存算子代码并关闭算子编辑器；单击取消则不保存并关闭算子编辑器。算子编辑控制算子编辑控制具有是否选择展示代码、是否选择展示结果、是否全屏。选择展示代码、展示结果、非全屏，如图7所示。选择展示代码、展示结果、全屏，如图8所示，单击“退出全屏”按钮则恢复。图8 展示代码、结果、全屏

AI开发平台MODELARTS 算链操作

AI开发平台MODELARTS-资源池驱动升级:场景介绍

场景介绍当专属资源池中的节点含有GPU/Ascend资源时，用户基于自己的业务，可能会有自定义GPU/Ascend驱动的需求，ModelArts面向此类客户提供了自助升级专属资源池GPU/Ascend驱动的能力。驱动升级有两种升级方式：安全升级、强制升级。安全升级：不影响正在运行的业务，开始升级后会先将节点进行隔离（不能再下发新的作业），待节点上的存量作业运行完成后再进行升级，因需要等待作业完成，故升级周期可能比较长。强制升级：忽略资源池中正在运行的作业，直接进行驱动升级，可能会导致运行中作业失败，需谨慎选择。

AI开发平台MODELARTS 弹性集群

AI开发平台MODELARTS-使用Grafana配置Dashboards，查看指标数据:创建Dashboards查看指标

创建Dashboards查看指标打开“DashBoards”，单击“New”，选择“New Dashboards”。在New Dashboards界面，单击“Add a new panel”。在New dashboard /Edit Panel界面，填写如下参数。 Data source：已配置Grafana数据源； Metric：指标名称，可参考表1、表2、表3获取想要查询的指标； Labels：填写过滤该指标的标签，请参考表4。图10 创建Dashboards查看指标

AI开发平台MODELARTS 使用Grafana查看AOM中的监控指标

云服务器内容精选

AI开发平台MODELARTS

7*24

备案

专业服务

退订

建议反馈

售前咨询热线