搜索_华为云

断点续训练 - AI开发平台ModelArts

ckpoint接续训练。当需要从训练中断的位置接续训练，只需要加载checkpoint，并用checkpoint信息初始化训练状态即可。用户需要在代码里加上reload ckpt的代码，使能读取前一次训练保存的预训练模型。原有训练参数配置表1断点续训练中新加MODEL_PAT

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > Baichuan2-13B模型基于DevServer适配PyTorch NPU训练指导（6.3.904） > 预训练
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

Alpaca_data_gpt4_zh.jsonl #微调训练原始数据文件上传代码到工作环境使用root用户以SSH的方式登录DevServer。将AscendSpeed代码包AscendCloud-3rdLLM-xxx-xxx.zip上传到${

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > GLM3-6B模型基于DevServer适配PyTorch NPU训练指导（6.3.904） > 准备工作
从云服务订阅AI应用（即将下线） - AI开发平台ModelArts

设置环境变量，注入环境变量到容器实例。为确保您的数据安全，在环境变量中，请勿输入敏感信息，如明文密码。默认设置外部接口协议为https，用户可以通过修改“MODELARTS_SSL_ENABLED”环境变量设置接口协议为http。 MODELARTS_SSL_ENABLED =

帮助中心 > AI开发平台ModelArts > 推理部署（历史文档待下线） > 管理AI应用 > 订阅模型
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

train-00000-of-00001-a09b74b3ef9c3b56.parquet #原始数据文件上传代码到工作环境使用root用户以SSH的方式登录DevServer。将AscendSpeed代码包AscendCloud-3rdLLM-xxx.zip上传到${wor

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > LLama2系列模型基于DevServer适配PyTorch NPU训练指导（6.3.904） > 准备工作
断点续训练 - AI开发平台ModelArts

ckpoint接续训练。当需要从训练中断的位置接续训练，只需要加载checkpoint，并用checkpoint信息初始化训练状态即可。用户需要在代码里加上reload ckpt的代码，用于读取前一次训练保存的预训练模型。断点续训练操作过程 Llama2-70B的断点续训脚本llama2

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > LLama2系列模型基于DevServer适配PyTorch NPU训练指导（6.3.904） > 预训练
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

alpaca_gpt4_data.json #微调训练原始数据文件上传代码到工作环境使用root用户以SSH的方式登录DevServer。将AscendSpeed代码包AscendCloud-3rdLLM-xxx-xxx.zip上传到${

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > Qwen系列模型基于DevServer适配PyTorch NPU训练指导（6.3.904） > 准备工作
运行训练代码，出现dead kernel，并导致实例崩溃 - AI开发平台ModelArts

kernel，并导致实例崩溃在Notebook实例中运行训练代码，如果数据量太大或者训练层数太多，亦或者其他原因，导致出现“内存不够”问题，最终导致该容器实例崩溃。出现此问题后，系统将自动重启Notebook，来修复实例崩溃的问题。此时只是解决了崩溃问题，如果重新运行训练代码仍将

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > 代码运行常见错误
运行训练代码，出现dead kernel，并导致实例崩溃 - AI开发平台ModelArts

kernel，并导致实例崩溃在Notebook实例中运行训练代码，如果数据量太大或者训练层数太多，亦或者其他原因，导致出现“内存不够”问题，最终导致该容器实例崩溃。出现此问题后，系统将自动重启Notebook，来修复实例崩溃的问题。此时只是解决了崩溃问题，如果重新运行训练代码仍将

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 代码运行故障
在AI Gallery订阅的数据集可以在SDK中使用吗？ - AI开发平台ModelArts

Gallery数据集下载至OBS。详细指导请参见下载数据集。数据集可以直接下载至OBS，也可以下载至ModelArts数据集中，不管任何方式，其最终的存储路径均为OBS目录。下载至OBS时，在下载任务完成后，数据将存储在下载时设置的OBS目录中。请注意下载任务中设置的区域，后续使用S

帮助中心 > AI开发平台ModelArts > 常见问题 > AI Gallery
迁移评估 - AI开发平台ModelArts
迁移评估 - AI开发平台ModelArts

迁移评估推理迁移包括模型迁移、业务迁移、精度性能调优等环节，是否能满足最终的迁移效果需要进行系统的评估。如果您仅需要了解迁移过程，可以先按照本文档的指导进行操作并熟悉迁移流程。如果您有实际的项目需要迁移，建议填写附录中的推理业务迁移评估表，并将该调研表提供给华为云技术支持人员进行迁移评估，以确保迁移项目能顺利实施。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
在ModelArts中如何查看OBS目录下的所有文件？ - AI开发平台ModelArts

file.list_directory('obs://bucket_name', recursive=True) 如果文件较多，请您耐心等待，最终文件路径信息会在提示信息之后显示。父主题：一般性问题

 帮助中心 > AI开发平台ModelArts > 常见问题 > 一般性问题
自动学习的每个项目对数据有哪些要求？ - AI开发平台ModelArts

如果某一列的取值只有一种，会被视为无效列。请确保标签列的取值至少有两个且无数据缺失。标签列指的是在训练任务中被指定为训练目标的列，即最终通过该数据集训练得到模型时的输出（预测项）。除标签列外数据集中至少还应包含两个有效特征列（列的取值至少有两个且数据缺失比例低于10%）。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard自动学习 > 准备数据
创建预测分析自动学习项目时，对训练数据有什么要求？ - AI开发平台ModelArts

如果某一列的取值只有一种，会被视为无效列。请确保标签列的取值至少有两个且无数据缺失。标签列指的是在训练任务中被指定为训练目标的列，即最终通过该数据集训练得到模型时的输出（预测项）。除标签列外数据集中至少还应包含两个有效特征列（列的取值至少有两个且数据缺失比例低于10%）。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard自动学习 > 准备数据
创建数据集 - AI开发平台ModelArts

dataset_type=None, data_sources=None, work_path=None, **kwargs) 根据数据类型创建数据集，用户可以在相同的数据集上创建不同类型的标注任务，如在图像数据集上创建图像分类、物体检测等标注任务。 create_dataset(session

帮助中心 > AI开发平台ModelArts > SDK参考 > 数据管理 > 数据集管理
TensorFlow - AI开发平台ModelArts
TensorFlow - AI开发平台ModelArts

TfServingBaseService class MnistService(TfServingBaseService): # 预处理中处理用户HTTPS接口输入匹配模型输入 # 对应上述训练部分的模型输入为{"images":<array>} def _preprocess(self

帮助中心 > AI开发平台ModelArts > 推理部署（历史文档待下线） > 推理规范说明 > 自定义脚本代码示例
pipeline代码适配 - AI开发平台ModelArts

模型初始化使用MindSpore Lite进行推理时一般需要先设置目标设备的上下文信息，然后构建推理模型，获取输入数据，模型预测并得到最终的结果。一个基础的推理框架写法如下所示： # base_mslite_demo.py import mindspore_lite as mslite

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导 > 应用迁移

总条数： 1736

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

断点续训练 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

从云服务订阅AI应用（即将下线） - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

断点续训练 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

运行训练代码，出现dead kernel，并导致实例崩溃 - AI开发平台ModelArts

运行训练代码，出现dead kernel，并导致实例崩溃 - AI开发平台ModelArts

在AI Gallery订阅的数据集可以在SDK中使用吗？ - AI开发平台ModelArts

迁移评估 - AI开发平台ModelArts

在ModelArts中如何查看OBS目录下的所有文件？ - AI开发平台ModelArts

自动学习的每个项目对数据有哪些要求？ - AI开发平台ModelArts

创建预测分析自动学习项目时，对训练数据有什么要求？ - AI开发平台ModelArts

创建数据集 - AI开发平台ModelArts

TensorFlow - AI开发平台ModelArts

pipeline代码适配 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线