检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
原因分析 CPU软锁 在解压大量文件可能会出现此情况并造成节点重启。可以适当在解压大量文件时,加入sleep。比如每解压1w个文件,就停止1s。 存储限制 根据规格情况合理使用数据盘,数据盘大小请参考训练环境中不同规格资源大小。 CPU过载 减少线程数。
得到OBS下数据集结构,此处以llama2-13B为例(权重文件可能变化,以下仅为举例): obs://<bucket_name>/model/llama-2-13b-hf/ ├── config.json ├── generation_config.json ├── gitattributes.txt
得到OBS下数据集结构,此处以llama2-13B为例(权重文件可能变化,以下仅为举例): obs://<bucket_name>/model/llama-2-13b-chat-hf/ ├── config.json ├── generation_config.json ├── gitattributes.txt
管理 登录凭证 集群登录方式,可以设置密码登录,也可以设置密钥对登录。 密码登录:默认用户名为root,用户自己设置密码。 密钥对(KeyPair)登录:可以选择已有的密钥对,或者单击右侧的“创建密钥对”,先去创建一个密钥对。 购买时长 - 选择购买时长。
相对或绝对路径,此配置文件为训练最优配置参数。
Step1 检查环境 SSH登录机器后,检查NPU设备检查。运行如下命令,返回NPU设备信息。
Notebook中读取OBS数据方式请参见如何在ModelArts的Notebook中上传下载OBS文件?。 父主题: Standard Notebook
创建导入任务 支持从OBS中导入新的数据,导入方式包括目录导入和Manifest文件导入。 dataset.import_data(path=None, anntation_config=None, **kwargs) 不同类型的数据集支持的导入方式如表1所示。
声音分类项目的工作流,将依次运行如下节点: 数据标注:对您的数据进行标注情况确认。 数据集版本发布:将已完成确认的数据进行版本发布。 数据校验:对您的数据集的数据进行校验,是否存在数据异常。 声音分类:将发布好的数据集版本进行训练,生成对应的模型。
物体检测项目的工作流,将依次运行如下节点: 数据标注:对您的数据进行标注情况确认。 数据集版本发布:将已完成标注的数据进行版本发布。 数据校验:对您的数据集的数据进行校验,是否存在数据异常。 物体检测:将发布好的数据集版本进行训练,生成对应的模型。
文本分类项目的工作流,将依次运行如下节点: 数据标注:对您的数据进行标注情况确认。 数据集版本发布:将已完成确认的数据进行版本发布。 数据校验:对您的数据集的数据进行校验,是否存在数据异常。 文本分类:将发布好的数据集版本进行训练,生成对应的模型。
图像分类项目的工作流,将依次运行如下节点: 数据标注:对您的数据标注情况进行确认。 数据集版本发布:将已完成标注的数据进行版本发布。 数据校验:对您的数据集的数据进行校验,是否存在数据异常。 图像分类:将发布好的数据集版本进行训练,生成对应的模型。
预测分析项目的工作流,将依次运行如下节点: 数据集版本发布:将已完成确认的数据进行版本发布。 数据校验:对您的数据集的数据进行校验,是否存在数据异常。 预测分析:将发布好的数据集版本进行训练,生成对应的模型。 模型注册:将训练后的结果注册到模型管理中。
生成一定数量的正态分布的数据。
“数据处理”是指从大量的、杂乱无章的、难以理解的数据中抽取或者生成对某些特定的人们来说是有价值、有意义的数据。“数据处理”又分为“数据校验”、“数据清洗”、“数据选择”和“数据增强”四类。 “数据校验”表示对数据集进行校验,保证数据合法。
评测静态性能脚本 ├── benchmark_serving.py # 评测动态性能脚本 ├── benchmark_utils.py # 抽离的工具集 ├── generate_datasets.py # 生成自定义数据集的脚本
图4 查看卡信息 查看卡间通信配置文件,执行以下命令。 cat /user/config/jobstart_hccl.json 多卡训练时,需要依赖“rank_table_file”做卡间通信的配置文件,该文件自动生成,pod启动之后文件地址。
处理方法 请您在启动文件中减少无用日志输出。 父主题: 硬盘限制故障
表2 任务类型支持的AI Gallery工具链服务 任务类型 微调大师 在线推理服务 AI应用 文本问答/文本生成 支持 支持 支持 其他类型 支持 支持 不支持 编辑完成后,单击“确认”保存修改。 管理模型文件 预览文件 在模型详情页,选择“模型文件”页签。
在标签框中输入相应的标签后,单击“新增标签”,新生成的标签会展示在标签行的下方,您可以同时增加多个标签。标签增加完成后,单击“确定”,标签即可生成。 图3 新增标签 生成了标签的Workflow,支持在搜索框中按照标签筛选对应的Workflow。 父主题: 管理Workflow