搜索_华为云

升级模型服务 - AI开发平台ModelArts

务列表。选择“我的服务”页签。选择模型服务，单击操作列的“更多 > 服务升级”。在服务升级页面，配置升级参数。 “模型设置”：单击“更换”，选择原模型下的其他模型版本。其他参数不可修改，但可以了解原模型服务的配置。配置完成后，单击“提交”启动服务升级。父主题：管理我的服务

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio） > 管理我的服务
Lite Server - AI开发平台ModelArts
Lite Server - AI开发平台ModelArts

A系列裸金属服务器无法获取显卡如何解决 GPU裸金属服务器无法Ping通如何解决 GPU A系列裸金属服务器RoCE带宽不足如何解决？ GPU裸金属服务器更换NVIDIA驱动后执行nvidia-smi提示Failed to initialize NVML 训练速度突然下降以及执行nvidia-smi卡顿如何解决？

帮助中心 > AI开发平台ModelArts > 故障排除
Lite Cluster资源开通 - AI开发平台ModelArts

节点的功能。污点：默认为空。支持给节点加污点来设置反亲和性，每个节点最多配置5条污点。安装后执行脚本：请输入脚本命令，命令中不能包含中文字符，需传入Base64转码后的脚本，转码后的字符数不能超过2048。脚本将在Kubernetes软件安装后执行，不影响Kubernetes软件安装。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster）
在ModelArts Standard使用run.sh脚本实现OBS和训练容器间的数据传输 - AI开发平台ModelArts

行工具。训练数据、代码、模型下载。（本地使用硬盘挂载或者docker cp，在ModelArts上使用OBSutil）启动脚本，用法无切换，一般就是到达执行目录，然后python xxx.py。训练结果、日志、checkpoints上传。（本地使用硬盘挂载或者docker

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练作业
run.sh脚本测试ModelArts训练整体流程 - AI开发平台ModelArts

和配置。训练数据、代码、模型下载。（本地使用硬盘挂载或者docker cp，在ModelArts上使用OBSutil）启动脚本，用法无切换，一般就是到达执行目录，然后python xxx.py。训练结果、日志、checkpoints上传。（本地使用硬盘挂载或者docker

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > FAQ
个人用户快速配置ModelArts访问权限 - AI开发平台ModelArts

委托用户：选择委托名称。使用账号A创建一个权限委托，在此处将该委托授权给账号B拥有的委托。在使用账号B登录控制台时，可以在控制台右上角的个人账号切换角色到账号A，使用账号A的委托权限。图3 委托用户切换角色说明： ModelArts暂不支持创建身份策略权限的委托。 “委托选择” 已有委托：列表中如果已有委托选

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践
配置仪表盘查看指标数据 - AI开发平台ModelArts

到导入的视图，单击视图即可打开监控。模板使用导入成功后，单击想查看的模板即可查看响应内容。这里介绍一些常用功能的使用。切换数据源和资源池图5 切换数据源和资源池单击红框中相应位置，即可出现下拉框，修改响应的数据源和资源池。刷新数据单击右上角的图标，即可刷新整个Das

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源监控 > 使用Grafana查看AOM中的监控指标
迁移Standard专属资源池和网络至其他工作空间 - AI开发平台ModelArts

子用户仅限于对自己创建的工作空间下的资源池进行迁移操作。网络工作空间迁移登录ModelArts管理控制台，选择“AI专属资源池 > 弹性集群Cluster”，切换到“网络”页签。在网络列表中，选择目标网络“操作 > 更多 > 工作空间迁移”。在弹出的“迁移网络”中，选择要迁移的“目标工作空间”，单击“确定”。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理 > 管理Standard专属资源池
训练过程中无法找到so文件 - AI开发平台ModelArts

txt") 支持。当前cuda版本无so文件，需外部导入so文件（自行在浏览器下载），再设置LD_LIBRARY_PATH，具体见2。不支持。尝试更换引擎，重新下发作业。或者使用自定义镜像创建作业，可参考使用自定义镜像创建作业。父主题：云上迁移适配故障

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
使用SFS盘出现报错rpc_check_timeout:939 callbacks suppressed - AI开发平台ModelArts

取处理。处理方法结合当前购买的SFS盘性能规划业务，建议不要运行到性能上限。可以购买多个SFS Turbo实例分担业务压力，或者更换高性能的SFS盘。一个SFS实例容量建议不要太大，建议以同样的成本换成购买多个SFS实例。父主题： Lite Server

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
服务部署、启动、升级和修改时，资源不足如何处理？ - AI开发平台ModelArts

专属资源池扩容，可参考扩缩容资源池。如果磁盘空间不够，可以尝试重试，使实例调度到其他节点。如果单实例仍磁盘空间不足，请联系系统管理员，更换合适的规格。如果是大模型导入的模型部署服务，请确保专属资源池磁盘空间大于1T（1000GB）。父主题：服务部署

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
GP Vnt1裸金属服务器用PyTorch报错CUDA initialization:CUDA unknown error - AI开发平台ModelArts

命令，将必要的内核模块加载到系统中。但有时候也可能需要手动执行该命令。例如，在更新了NVIDIA驱动后，需要重新加载新版本的内核模块才能使变更生效。此外，如果使用了多个NVIDIA显卡，每个显卡都需要加载相应的内核模块才能正常工作。在这种情况下，也需要手动执行“nvidia-m

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
释放Standard专属资源池和删除网络 - AI开发平台ModelArts

在专属资源池列表中，在需要删除的资源池的右侧操作列选择“ > 删除”。在“删除资源池”页面，需在文本框中输入“DELETE”，单击“确定”，删除资源池。可切换“训练作业”、“推理服务”、“开发环境”页签查看资源池上创建的训练作业、部署的推理服务、创建的Notebook实例。图1 删除资源池释放游离节点

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理 > 管理Standard专属资源池
删除DevServer实例 - AI开发平台ModelArts

停止失败： REBOOTING: 重启中： REBOOT_FAILED: 重启失败； CHANGINGOS: 切换操作系统中： CHANGINGOS_FAILED: 切换操作系统失败： REINSTALLINGOS: 重装操作系统中： REINSTALLINGOS_FAILED。重装操作系统失败。

帮助中心 > AI开发平台ModelArts > API参考 > DevServer管理
停止DevServer实例 - AI开发平台ModelArts

停止失败： REBOOTING: 重启中： REBOOT_FAILED: 重启失败； CHANGINGOS: 切换操作系统中： CHANGINGOS_FAILED: 切换操作系统失败： REINSTALLINGOS: 重装操作系统中： REINSTALLINGOS_FAILED。重装操作系统失败。

帮助中心 > AI开发平台ModelArts > API参考 > DevServer管理
查询DevServer实例详情 - AI开发平台ModelArts

停止失败： REBOOTING: 重启中： REBOOT_FAILED: 重启失败； CHANGINGOS: 切换操作系统中： CHANGINGOS_FAILED: 切换操作系统失败： REINSTALLINGOS: 重装操作系统中： REINSTALLINGOS_FAILED。重装操作系统失败。

帮助中心 > AI开发平台ModelArts > API参考 > DevServer管理
multi-lora - AI开发平台ModelArts
multi-lora - AI开发平台ModelArts

轻量化适配：无需改变原始模型结构，通过低秩矩阵的调整即可适配不同任务。多任务并行：支持同时加载多个LoRA模块，使得VLLM可以在不同任务间快速切换，提高多任务推理的效率。约束限制 multi-lora特性不能和Chunked Prefill特性一起使用。 multi-lora特性使用说明

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用
Lite Cluster高危操作一览表 - AI开发平台ModelArts

可能影响ModelArts侧基本功能，包括但不限于资源池管理、节点管理、扩缩容、驱动升级等。高不可恢复。节点退订、移除、关机、污点管理、切换/重装操作系统等。可能影响ModelArts侧基本功能，包括但不限于节点管理、扩缩容、驱动升级、带本地盘机型的本地盘数据丢失等。高不可恢复。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster使用前必读
启动DevServer实例 - AI开发平台ModelArts

停止失败： REBOOTING: 重启中： REBOOT_FAILED: 重启失败； CHANGINGOS: 切换操作系统中： CHANGINGOS_FAILED: 切换操作系统失败： REINSTALLINGOS: 重装操作系统中： REINSTALLINGOS_FAILED。重装操作系统失败。

帮助中心 > AI开发平台ModelArts > API参考 > DevServer管理
SD1.5&SDXL ComfyUI、WebUI、Diffusers套件适配PyTorch NPU的推理指导（6.3.912） - AI开发平台ModelArts

2 ${image_name} 代表 ${image_name}。 -p 8183:8183 开启一个端口，可以web访问（如冲突，可自行更换其他端口）。进入容器。需要将${container_name}替换为实际的容器名称，例如：webui。 docker exec -it ${container_name}

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理

总条数： 924

上一页
1
...
42
43
44
...
47
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

升级模型服务 - AI开发平台ModelArts

Lite Server - AI开发平台ModelArts

Lite Cluster资源开通 - AI开发平台ModelArts

在ModelArts Standard使用run.sh脚本实现OBS和训练容器间的数据传输 - AI开发平台ModelArts

run.sh脚本测试ModelArts训练整体流程 - AI开发平台ModelArts

个人用户快速配置ModelArts访问权限 - AI开发平台ModelArts

配置仪表盘查看指标数据 - AI开发平台ModelArts

迁移Standard专属资源池和网络至其他工作空间 - AI开发平台ModelArts

训练过程中无法找到so文件 - AI开发平台ModelArts

使用SFS盘出现报错rpc_check_timeout:939 callbacks suppressed - AI开发平台ModelArts

服务部署、启动、升级和修改时，资源不足如何处理？ - AI开发平台ModelArts

GP Vnt1裸金属服务器用PyTorch报错CUDA initialization:CUDA unknown error - AI开发平台ModelArts

释放Standard专属资源池和删除网络 - AI开发平台ModelArts

删除DevServer实例 - AI开发平台ModelArts

停止DevServer实例 - AI开发平台ModelArts

查询DevServer实例详情 - AI开发平台ModelArts

multi-lora - AI开发平台ModelArts

Lite Cluster高危操作一览表 - AI开发平台ModelArts

启动DevServer实例 - AI开发平台ModelArts

SD1.5&SDXL ComfyUI、WebUI、Diffusers套件适配PyTorch NPU的推理指导（6.3.912） - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线