搜索_华为云

扩缩容Lite Cluster资源池 - AI开发平台ModelArts

elet通过Container Runtime Interface (CRI) 与容器引擎交互，以管理镜像和容器。其中Containerd调用链更短，组件更少，更稳定，占用节点资源更少，Containerd和Docker差异对比请见容器引擎。如果CCE集群版本低于1.23，仅支

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理
部署预测分析服务 - AI开发平台ModelArts

结果”区域输出测试结果。如模型准确率不满足预期，可在“数据标注”页签，重新进行模型训练及模型部署。如果您对模型预测结果满意，可根据界面提示调用接口访问在线服务。输入代码：其中预测分析要求数据集中数据的预测列名称为class，否则会导致预测失败。 { "data": {

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用自动学习实现预测分析
批量删除标签 - AI开发平台ModelArts

参数是否必选参数类型描述 default_value 否 String 标签属性默认值。 id 否 String 标签属性ID。可通过调用标签列表查询。 name 否 String 标签属性名称。不能超过64个字符，不能包含字符!<>=&"'。 type 否 String 标签属性类型。可选值如下：

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
查询API和APP - AI开发平台ModelArts

请求参数表3 请求Header参数参数是否必选参数类型描述 X-Auth-Token 是 String 用户Token。通过调用IAM服务获取用户Token接口获取（响应消息头中X-Subject-Token的值）。响应参数状态码：200 表4 响应Body参数

 帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理
查看Standard专属资源池详情 - AI开发平台ModelArts

会将此变化信息记录到事件中。图1 查看资源池事件查看资源池节点在资源池详情页，切换到“节点”页签。您可以查看资源池中所有的节点，并且能查看每个节点资源占用的情况。当把鼠标放在节点名称上方时，会显示节点名称和资源ID，资源ID可用于查询账单或者在费用中心查询包周期资源的计费信息。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理 > 管理Standard专属资源池
查询Notebook支持的可切换规格列表 - AI开发平台ModelArts

oks/{id}/flavors 表1 路径参数参数是否必选参数类型描述 id 是 String Notebook实例ID，可通过调用查询Notebook实例列表接口获取。 project_id 是 String 用户项目ID，获取方法请参见获取项目ID和名称。表2 Query参数

 帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
CogVideoX1.5 5b模型基于Lite Server适配PyTorch NPU全量训练指导（6.3.912） - AI开发平台ModelArts

档。确保容器可以访问公网。步骤一：准备环境请参考Lite Server资源开通，购买Server资源，并确保机器已开通，密码已获取，能通过SSH登录，不同机器之间网络互通。当容器需要提供服务给多个用户，或者多个用户共享使用该容器时，应限制容器访问Openstack的管理地址（169

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生视频模型训练推理
执行训练任务 - AI开发平台ModelArts

export PYTORCH_NPU_ALLOC_CONF = expandable_segments:False 否，demo.sh添加变量，开启虚拟显存。 export PYTORCH_NPU_ALLOC_CONF=expandable_segments:True 修改yaml文件路径：修改demo

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.911）
查看训练作业监控指标 - AI开发平台ModelArts

查看训练作业监控指标场景介绍在训练作业运行过程中，如果用户能在模型训练出问题（例如loss值异常）的情况下能收到告警并及时处理，可以节省大量时间和资源，避免无效运行作业导致的浪费。同时通过指标监控可以实时掌握训练作业的进度，了解模型在不同阶段的训练状态。当前ModelArts

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
创建API - AI开发平台ModelArts
创建API - AI开发平台ModelArts

请求参数表2 请求Header参数参数是否必选参数类型描述 X-Auth-Token 是 String 用户Token。通过调用IAM服务获取用户Token接口获取（响应消息头中X-Subject-Token的值）。表3 请求Body参数参数是否必选参数类型

 帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理
demo.sh方式启动（历史版本） - AI开发平台ModelArts

export PYTORCH_NPU_ALLOC_CONF = expandable_segments:False 否，demo.sh添加变量，开启虚拟显存； export PYTORCH_NPU_ALLOC_CONF=expandable_segments:True ②修改路径：修改demo

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.5.901） > 执行训练任务
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

907版本新增如下内容：文档和代码中新增对mistral和mixtral模型的适配，并添加训练推荐配置。文档准备镜像步骤中，仅提供：直接使用基础镜像方案、ECS中构建新镜像方案，删除使用Notebook创建镜像方案。文档中新增对 llama3 支持长序列文本（sequence_length >

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.908）
在Lite Cluster资源池上使用ranktable路由规划完成Pytorch NPU分布式训练 - AI开发平台ModelArts

env: - name: OPEN_SCRIPT_ADDRESS # 开放脚本地址，其中region-id根据实际region修改，例如cn-southwest-2 value: "

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源使用
执行训练任务（推荐） - AI开发平台ModelArts

非必填。表示训练step迭代次数，有默认值 seed 1234 随机种子数。每次数据采样时，保持一致。 save-interval 1000 用于模型中间版本地保存。当参数值>=TRAIN_ITERS时，生成模型仅保存经过TRAIN_ITERS次训练后的最后一个版本。当参数值<TRAIN_IT

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.5.901） > 执行训练任务
创建工作空间 - AI开发平台ModelArts

请求参数表2 请求Header参数参数是否必选参数类型描述 X-Auth-Token 是 String 用户Token。通过调用IAM服务获取用户Token接口获取（响应消息头中X-Subject-Token的值）。表3 请求Body参数参数是否必选参数类型

 帮助中心 > AI开发平台ModelArts > API参考 > 工作空间管理
CogVideoX1.5 5b模型基于Lite Server适配PyTorch NPU全量训练指导（6.5.901） - AI开发平台ModelArts

档。确保容器可以访问公网。步骤一：准备环境请参考Lite Server资源开通，购买Server资源，并确保机器已开通，密码已获取，能通过SSH登录，不同机器之间网络互通。当容器需要提供服务给多个用户，或者多个用户共享使用该容器时，应限制容器访问Openstack的管理地址（169

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生视频模型训练推理
执行训练任务（推荐） - AI开发平台ModelArts

非必填。表示训练step迭代次数，有默认值 seed 1234 随机种子数。每次数据采样时，保持一致。 save-interval 1000 用于模型中间版本地保存。当参数值>=TRAIN_ITERS时，生成模型仅保存经过TRAIN_ITERS次训练后的最后一个版本。当参数值<TRAIN_IT

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.912） > 执行训练任务
pipeline代码适配 - AI开发平台ModelArts

tableDiffusionImg2ImgPipeline中增加mindir模型初始化函数，然后在pipeline类的__init__方法调用该函数，在pipeline初始化的时候直接初始化模型。您可以参照如下样例，通过修改use_ascend修改该模型是否使用mindir运行，也可以编写代码通过环境变量指定。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导 > 应用迁移
demo.sh方式启动（历史版本） - AI开发平台ModelArts

export PYTORCH_NPU_ALLOC_CONF = expandable_segments:False 否，demo.sh添加变量，开启虚拟显存； export PYTORCH_NPU_ALLOC_CONF=expandable_segments:True ②修改路径：修改demo

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.912） > 执行训练任务
预训练 - AI开发平台ModelArts
预训练 - AI开发平台ModelArts

/scripts/install.sh; sh ./scripts/llama2/0_pl_pretrain_13b.sh 如果镜像使用ECS中构建新镜像构建的新镜像时，训练作业启动命令中输入： cd /home/ma-user/work/llm_train/AscendSpeed;

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.911）

总条数： 977

上一页
1
...
43
44
45
...
49
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

扩缩容Lite Cluster资源池 - AI开发平台ModelArts

部署预测分析服务 - AI开发平台ModelArts

批量删除标签 - AI开发平台ModelArts

查询API和APP - AI开发平台ModelArts

查看Standard专属资源池详情 - AI开发平台ModelArts

查询Notebook支持的可切换规格列表 - AI开发平台ModelArts

CogVideoX1.5 5b模型基于Lite Server适配PyTorch NPU全量训练指导（6.3.912） - AI开发平台ModelArts

执行训练任务 - AI开发平台ModelArts

查看训练作业监控指标 - AI开发平台ModelArts

创建API - AI开发平台ModelArts

demo.sh方式启动（历史版本） - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

在Lite Cluster资源池上使用ranktable路由规划完成Pytorch NPU分布式训练 - AI开发平台ModelArts

执行训练任务（推荐） - AI开发平台ModelArts

创建工作空间 - AI开发平台ModelArts

CogVideoX1.5 5b模型基于Lite Server适配PyTorch NPU全量训练指导（6.5.901） - AI开发平台ModelArts

执行训练任务（推荐） - AI开发平台ModelArts

pipeline代码适配 - AI开发平台ModelArts

demo.sh方式启动（历史版本） - AI开发平台ModelArts

预训练 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线