搜索_华为云

Standard资源池 - AI开发平台ModelArts

吗？ 1个节点的专属资源池，能否部署多个服务？专属资源池购买后，中途扩容了一个节点，如何计费？共享池和专属池的区别是什么？如何通过ssh登录专属资源池节点？训练任务的排队逻辑是什么？专属资源池下的在线服务停止后，启动新的在线服务，提示资源不足不同实例的资源池安装的cuda和驱动版本号分别是什么？

帮助中心 > AI开发平台ModelArts > 常见问题
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

|── install.sh # 环境部署脚本 |——src/ # 启动命令行封装脚本，在install.sh里面自动构建 |──llm_inference

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU训练指导（6.3.909） > 准备工作
Finetune训练 - AI开发平台ModelArts

（fine-tuning）以优化模型性能。启动SD1.5 Finetune训练服务使用ma-user用户执行如下命令运行训练脚本。 sh diffusers_finetune_train.sh 启动SDXL Finetune训练服务使用ma-user用户执行如下命令运行训练脚本。

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理 > SD1.5&SDXL Diffusers框架基于DevServer适配PyTorch NPU训练指导（6.3.908）
AI Gallery（新版） - AI开发平台ModelArts

发布和管理AI Gallery中的AI应用使用AI Gallery微调大师训练模型使用AI Gallery在线推理服务部署模型 Gallery CLI配置工具指南计算规格说明

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery）
分布式训练功能介绍 - AI开发平台ModelArts

cifar10数据集上的分类任务，给出了分布式训练改造(DDP)的完整代码示例，供用户学习参考。基于开发环境使用SDK调测训练作业：介绍如何在ModelArts的开发环境中，使用SDK调测单机和多机分布式训练作业。父主题：分布式模型训练

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 分布式模型训练
功能咨询 - AI开发平台ModelArts
功能咨询 - AI开发平台ModelArts

ModelArts支持将模型部署为哪些类型的服务？在线服务和批量服务有什么区别？在线服务和边缘服务有什么区别？为什么选择不了Ascend Snt3资源？线上训练得到的模型是否支持离线部署在本地？服务预测请求体大小限制是多少？在线服务部署是否支持包周期？部署服务如何选择计算节点规格？部署GPU服务支持的Cuda版本是多少？

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署 > 部署上线
查询资源池 - AI开发平台ModelArts

Infer：推理任务 Notebook：Notebook作业 state String 业务状态。可选值如下： Enabling：启动中 Enabled：已启动 Disabling：关闭中 Disabled：已关闭表17 driver 参数参数类型描述 gpu PoolDriverStatus

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
迁移过程使用工具概览 - AI开发平台ModelArts

迁移过程使用工具概览基础的开发工具在迁移的预置镜像和开发环境中都已经进行预置，用户原则上不需要重新安装和下载，如果预置的版本不满足要求，用户可以执行下载和安装与覆盖操作。模型自动转换评估工具Tailor 为了简化用户使用，ModelArts提供了Tailor工具，将模型转换、

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
删除资源池 - AI开发平台ModelArts

Infer：推理任务 Notebook：Notebook作业 state String 业务状态。可选值如下： Enabling：启动中 Enabled：已启动 Disabling：关闭中 Disabled：已关闭表17 driver 参数参数类型描述 gpu PoolDriverStatus

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
准备工作 - AI开发平台ModelArts
准备工作 - AI开发平台ModelArts

准备工作准备环境准备代码准备镜像环境准备数据（可选）父主题：主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.907）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.907）
Lite Server资源配置流程 - AI开发平台ModelArts

配置Lite Server软件环境不同镜像中预安装的软件不同，您通过Lite Server算力资源和镜像版本配套关系章节查看已安装的软件。当Server服务器中预装的软件无法满足业务需求时，您可在Server服务器中配置所需要的软件环境。父主题： Lite Server资源配置

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源配置
权限策略和授权项 - AI开发平台ModelArts

权限策略和授权项策略及授权项说明数据管理权限开发环境权限训练作业权限模型管理权限服务管理权限工作空间管理权限 DevServer权限

 帮助中心 > AI开发平台ModelArts > API参考
Finetune训练 - AI开发平台ModelArts

（fine-tuning）以优化模型性能。启动SD1.5 Finetune训练服务使用ma-user用户执行如下命令运行训练脚本。 sh diffusers_finetune_train.sh 启动SDXL Finetune训练服务使用ma-user用户执行如下命令运行训练脚本。

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理 > SD1.5&SDXL Diffusers框架基于DevServer适配PyTorch NPU训练指导（6.3.907）
为什么资源充足还是在排队？ - AI开发平台ModelArts

等待中（排队）？方法降低排队时间。如果是专属资源池，建议您进行以下排查：排查专属资源池中是否存在其他作业（包括推理作业、训练作业、开发环境作业等）。可通过总览页面，快速判断是否有其他模块的作业或实例在运行中，并进入到相关作业或实例上，判断是否使用了专属资源池。如判断相关作业

 帮助中心 > AI开发平台ModelArts > 常见问题 > 一般性问题
OBS复制过程中提示“BrokenPipeError: Broken pipe” - AI开发平台ModelArts

一个桶的文件，导致OBS桶限流。 OBS Client连接数过多，进程/线程之间的轮询，导致一个OBS Client与服务端连接30S内无响应，超过超时时间，服务端断开了连接。处理方法如果是限流问题，日志中还会出现如下报错，OBS相关的错误码解释请参见OBS官方文档，这种情况建议提工单。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > OBS操作相关故障
应用示例 - AI开发平台ModelArts
应用示例 - AI开发平台ModelArts

应用示例创建图像分类数据集并进行标注任务创建并完成图像分类的智能标注任务开发环境的应用示例以PyTorch框架创建训练作业（新版训练）创建和修改工作空间管理ModelArts服务的委托授权

 帮助中心 > AI开发平台ModelArts > API参考
Standard Notebook - AI开发平台ModelArts

Standard Notebook 规格限制文件上传下载数据存储环境配置相关 Notebook实例常见错误代码运行常见错误 CodeLab PyCharm Toolkit使用 VS Code使用技巧 VS Code连接开发环境失败常见问题在Notebook中使用自定义镜像常见问题更多功能咨询

 帮助中心 > AI开发平台ModelArts > 常见问题
LoRA训练 - AI开发平台ModelArts
LoRA训练 - AI开发平台ModelArts

run_lora_sdxl.sh 启动SD1.5 LoRA训练服务使用ma-user用户执行如下命令运行训练脚本。 sh run_lora.sh 所有数据保存在auto_log/avg_step_time.txt文本中 auto_log/log/目录下存放各个shapes的数据启动SDXL LoRA训练服务

 帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理 > SD1.5&SDXL Koyha框架基于DevServer适配PyTorch NPU训练指导（6.3.907）
LoRA训练 - AI开发平台ModelArts
LoRA训练 - AI开发平台ModelArts

run_lora_sdxl.sh 启动SD1.5 LoRA训练服务使用ma-user用户执行如下命令运行训练脚本。 sh run_lora.sh 所有数据保存在auto_log/avg_step_time.txt文本中 auto_log/log/目录下存放各个shapes的数据。启动SDXL LoRA训练服务

 帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理 > SD1.5&SDXL Koyha框架基于DevServer适配PyTorch NPU训练指导（6.3.908）
准备工作 - AI开发平台ModelArts
准备工作 - AI开发平台ModelArts

准备工作准备环境准备代码准备数据准备镜像环境父主题：主流开源大模型基于Lite Cluster适配PyTorch NPU训练指导（6.3.909）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU训练指导（6.3.909）

总条数： 962

上一页
1
...
39
40
41
...
49
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Standard资源池 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

Finetune训练 - AI开发平台ModelArts

AI Gallery（新版） - AI开发平台ModelArts

分布式训练功能介绍 - AI开发平台ModelArts

功能咨询 - AI开发平台ModelArts

查询资源池 - AI开发平台ModelArts

迁移过程使用工具概览 - AI开发平台ModelArts

删除资源池 - AI开发平台ModelArts

准备工作 - AI开发平台ModelArts

Lite Server资源配置流程 - AI开发平台ModelArts

权限策略和授权项 - AI开发平台ModelArts

Finetune训练 - AI开发平台ModelArts

为什么资源充足还是在排队？ - AI开发平台ModelArts

OBS复制过程中提示“BrokenPipeError: Broken pipe” - AI开发平台ModelArts

应用示例 - AI开发平台ModelArts

Standard Notebook - AI开发平台ModelArts

LoRA训练 - AI开发平台ModelArts

LoRA训练 - AI开发平台ModelArts

准备工作 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线