检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
择摄像机。 在首页导航栏,进入“模型训练”页面(选择摄像机型号后,模型训练自动解锁),单击“华为训练云服务”进入ModelArts模型训练平台。如果开发者有自己训练好的模型, 不需要进入该步骤。 其中, ModelArts是面向开发者的一站式AI开发平台,属于华为云解决方案,需要按照华为云市场要求进行注册与使用。
模型验证 模型验证界面已经预置了模型验证服务,本次不使用,仅供参考。下面会提供端到端的操作流程,帮助用户快速熟悉模型验证界面操作。 单击菜单栏中的“模型验证”,进入模型验证界面。 可以看到预置的模型验证任务“hardisk-detect”。 单击“创建”,弹出如图1所示的对话框。
方式搜索日志。 :将当前训练工程加入训练。 :返回到当前训练工程所在的“模型训练”页面。 训练任务:查看训练任务的运行状态。可以查看训练任务的运行日志以及训练报告,删除训练任务。也可以在任务执行过程中单击暂停训练任务。 3 代码目录:包含日志文件夹、模型文件存放文件夹、调试文件、requirements
模型训练必备要素包括训练代码、训练框架、训练数据。 训练代码包含训练作业的启动文件或启动命令、训练依赖包等内容。 当使用预置框架创建训练作业时,训练代码的开发规范可以参考开发用于预置框架训练的代码。 当使用自定义镜像创建训练作业时,训练代码的开发规范可以参考开发用于自定义镜像训练的代码。
编辑训练代码(WebIDE) 支持使用WebIDE开发环境编辑代码。 可选择下述一种方式,进入WebIDE开发环境编辑代码: 在“模型训练”菜单页面,“开发环境”为WebIDE环境的情况下,单击模型训练工程所在行的。 在“模型训练”菜单页面,单击模型训练工程所在行,进入详情界面。
创建模型训练工程 创建工程 编辑训练代码(简易编辑器) 编辑训练代码(WebIDE) 模型训练 MindSpore样例 父主题: 模型训练
模型训练 导入SDK 选择数据 特征画像 模型选择 训练模型 测试模型 开发推理 归档模型 父主题: KPI异常检测学件服务
什么是模型训练服务 模型训练服务为开发者提供电信领域一站式模型开发服务,涵盖数据预处理、特征提取、模型训练、模型验证、推理执行和重训练全流程。服务提供开发环境和模拟验证环境及ICT网络领域AI资产,包括项目模板、算法、特征分析及处理SDK,帮助开发者提速AI应用开发,保障模型应用效果。
模型训练新建模型训练工程的时候,选择通用算法有什么作用? 通用算法目前包括:分类算法、拟合算法、聚类算法、其他类型。用户选择不同的通用算法类型,并勾选“创建入门模型训练代码”,便可以自动生成对应类型的代码模版。 父主题: 模型训练
HardDisk-Detect_Train_Good.csv:无故障硬盘训练数据 HardDisk-Detect_Train_Fail.csv:故障硬盘训练数据 HardDisk-Detect_Test_Good.csv:无故障硬盘测试数据 HardDisk-Detect_Test_Fail.csv:故障硬盘测试数据
外安装软件包。 具体案例参考使用预置镜像制作自定义镜像用于训练模型。 场景二:已有本地镜像满足代码依赖的要求,但是不满足ModelArts训练平台约束,需要适配。 具体案例参考已有镜像迁移至ModelArts用于训练模型。 场景三: 当前无可使用的镜像,需要从0制作镜像(既需要安
操作流程 模型训练服务操作流程如操作流程图所示。 图1 操作流程图 父主题: 使用模型训练服务快速训练算法模型
训练模型时引用依赖包,如何创建训练作业? ModelArts支持训练模型过程中安装第三方依赖包。在训练代码目录下放置“pip-requirements.txt”文件后,在训练启动文件被执行前系统会执行如下命令,以安装用户指定的Python Packages。 pip install
Standard模型训练 使用ModelArts Standard自定义算法实现手写数字识别 基于ModelArts Standard运行GPU训练作业
任务名称:特征工程服务任务名称。示例:Train_Fail。 数据集:从下拉框中选择预置数据集“HardDisk-Detect(HardDisk)”。 数据实例:从下拉框中选择故障硬盘训练数据集“HardDisk-Detect_Train_Fail”。 目标数据集:从下拉框中选择预置
查看训练作业详情 登录ModelArts管理控制台。 在左侧导航栏中,选择“模型训练 > 训练作业”,进入“训练作业”列表。 在作业列表,单击“导出”,可以将训练作业根据时间周期导出Excel表到本地。最多只支持导出前200行数据。 在“训练作业”列表中,单击作业名称,进入训练作业详情页。
当您使用自定义脚本创建算法的时候,如果您的模型引用了其他依赖,您需要在“算法管理 > 创建算法”的“代码目录”下放置相应的文件或安装包。 安装python依赖包请参考模型中引用依赖包时,如何创建训练作业? 安装C++的依赖库请参考如何安装C++的依赖库? 在预训练模型中加载参数请参考如何在训练中加载部分训练好的参数?
预训练 前提条件 已上传训练代码、训练权重文件和数据集到SFS Turbo中,具体参考代码上传至OBS和使用Notebook将OBS数据导入SFS Turbo。 Step1 在Notebook中修改训练超参配置 以llama2-13b预训练为例,执行脚本0_pl_pretrain_13b
训练作业创建失败报错: 准备阶段超时。可能原因是跨区域算法同步或者创建共享存储超时 训练作业已排队,正在等待资源分配 训练作业排队失败 训练作业开始运行 训练作业运行成功 训练作业运行失败 训练作业被抢占 系统检测到您的作业疑似卡死,请及时前往作业详情界面查看并处理 训练作业已重启