搜索_华为云

准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

支持vllm的openai，atb的tgi模板 ├── ...

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905） > 准备工作
准备权重 - AI开发平台ModelArts
准备权重 - AI开发平台ModelArts

准备权重获取对应模型的权重文件，获取链接参考表1。在创建的OBS桶下创建文件夹用以存放权重文件，例如在桶中创建文件夹。将下载的权重文件上传至OBS中，得到OBS下数据集结构。此处以qwen-14b举例。 obs://${bucket_name}/${folder-name}/

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906） > 准备工作
Lite Server资源配置流程 - AI开发平台ModelArts

Lite Server资源配置流程在开通Lite Server资源后，需要完成相关配置才能使用，配置流程如下图所示。图1 Lite Server资源配置流程图表1 Server资源配置流程配置顺序配置任务场景说明 1 配置Lite Server网络 Server资源开通后

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源配置
Lite Cluster资源管理介绍 - AI开发平台ModelArts

扩缩容Lite Cluster资源池：当Cluster资源池创建完成，使用一段时间后，由于用户AI开发业务的变化，对于资源池资源量的需求可能会产生变化，面对这种场景，ModelArts提供了扩缩容功能，用户可以根据自己的需求动态调整。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理
按标签名称删除标签及仅包含此标签的文件 - AI开发平台ModelArts

按标签名称删除标签及仅包含此标签的文件功能介绍按标签名称删除标签及仅包含此标签的文件。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI DELETE /v2/{project_id

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
创建新版Notebook无法使用已购买的专属资源池，如何解决？ - AI开发平台ModelArts

创建新版Notebook无法使用已购买的专属资源池，如何解决？问题现象已购买专属资源池，但创建Notebook时该资源池不可选择，无法创建Notebook。提示当前专属资源池未初始化开发环境，请到专属资源池页面初始化开发环境。原因分析新购买的专属资源池，需要初始化环境才能用于创建

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 其他故障
GPU A系列裸金属服务器RoCE带宽不足如何解决？ - AI开发平台ModelArts

GPU A系列裸金属服务器RoCE带宽不足如何解决？问题现象 GP Ant8支持RoCE网卡， Ubuntu20.04场景，在进行nccl-tests时，总线带宽理论峰值可达90GB/s，但实际测试下来的结果只有35GB/s。原因分析 “nv_peer_mem”是一个Linux

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
【下线公告】华为云ModelArts自动学习模块的文本分类功能下线公告 - AI开发平台ModelArts

【下线公告】华为云ModelArts自动学习模块的文本分类功能下线公告华为云计划于2024/12/06 00:00（北京时间）将AI开发平台ModelArts自动学习模块的文本分类功能正式下线。下线范围下线Region：华为云全部Region。

帮助中心 > AI开发平台ModelArts > 服务公告 > 下线公告
在ModelArts的Notebook中如何将git clone的py文件变为ipynb文件？ - AI开发平台ModelArts

在ModelArts的Notebook中如何将git clone的py文件变为ipynb文件？问题描述在ModelArts的Notebook中如何将git clone的py文件变为ipynb文件？处理方法在ipynb文件中，执行%load XXX.py命令，即可将py文件内容加载到

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
GPU A系列裸金属服务器如何更换NVIDIA和CUDA？ - AI开发平台ModelArts

具体操作请参考GPU裸金属服务器更换NVIDIA驱动后执行nvidia-smi提示Failed to initialize NVML。若遇到加载到内核的nvidia进程循环依赖，无法从内核中卸载nvidia，此时执行reboot命令重启服务器即可。

帮助中心 > AI开发平台ModelArts > 常见问题 > Lite Server
如何保证自定义镜像能不因为超过35G而保存失败？ - AI开发平台ModelArts

如何保证自定义镜像能不因为超过35G而保存失败？可以从如下几方面考虑：请选择较小的基础镜像创建Notebook实例，这样在实例中可操作的空间才会大，可自由安装的包才能更多，一般建议原始的启动Notebook的基础镜像在SWR侧查看大小不要超过6G。镜像保存主要保存在/home

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard镜像相关
扩缩容Standard专属资源池 - AI开发平台ModelArts

扩缩容Standard专属资源池场景介绍当专属资源池创建完成，使用一段时间后，由于用户AI开发业务的变化，对于资源池资源量的需求可能会产生变化，面对这种场景，ModelArts Standard专属资源池提供了扩缩容功能，用户可以根据自己的需求动态调整。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理 > 管理Standard专属资源池
扩缩容Lite Cluster资源池 - AI开发平台ModelArts

Kubelet通过Container Runtime Interface (CRI) 与容器引擎交互，以管理镜像和容器。其中Containerd调用链更短，组件更少，更稳定，占用节点资源更少，Containerd和Docker差异对比请见容器引擎。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理
升级Lite Cluster资源池驱动 - AI开发平台ModelArts

资源池驱动升级操作登录ModelArts管理控制台，在左侧菜单栏中选择“AI专属资源池 > 弹性集群 Cluster”，在“弹性集群”页面，选择“Lite资源池”页签，查看资源池列表。在资源池列表中，选择需要进行驱动升级的资源池“ > 驱动升级”。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理
使用Windows下生成的文本文件时报错找不到路径？ - AI开发平台ModelArts

使用Windows下生成的文本文件时报错找不到路径？问题现象当在Notebook中使用Windows下生成的文本文件时，文本内容无法正确读取，可能报错找不到路径。原因分析 Notebook是Linux环境，和Windows环境下的换行格式不同，Windows下是CRLF，而Linux

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 代码运行故障
Notebook中已安装对应库，仍报错import numba ModuleNotFoundError: No module named 'numba' - AI开发平台ModelArts

Notebook中已安装对应库，仍报错import numba ModuleNotFoundError: No module named 'numba' 问题现象在Notebook中使用!pip install numba命令安装了numba库且运行正常（且已保存为自定义镜像），

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 环境配置故障
GPU裸金属服务器使用EulerOS内核误升级如何解决 - AI开发平台ModelArts

h934.eulerosv2r9.x86_64 下安装的nvidia-driver-515，由于执行了yum update并reboot服务器，发现再次执行nvidia命令时报错： [root@Server-ddff ~]# nvidia-smi NVIDIA-SMI has failed

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
GPU A系列裸金属服务器使用CUDA cudaGetDeviceCount()提示CUDA initializat失败 - AI开发平台ModelArts

systemctl status nvidia-fabricmanager 发现nvidia-fabricmanager的服务为failed状态，尝试重新启动nvidia-fabricmanager失败，且提示以下信息： nvidia-fabricmanager.service failed

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
管理在线服务生命周期 - AI开发平台ModelArts

管理在线服务生命周期启动服务您可以对处于“运行完成”、“异常”和“停止”状态的服务进行启动操作，“部署中”状态的服务无法启动。启动服务，当服务处于“运行中”状态后，ModelArts将开始计费。您可以通过如下方式启动服务：登录ModelArts管理控制台，在左侧菜单栏中选择“

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理同步在线服务
通过OBS导入模型时，如何编写打印日志代码才能在ModelArts日志查询界面看到日志 - AI开发平台ModelArts

通过OBS导入模型时，如何编写打印日志代码才能在ModelArts日志查询界面看到日志问题现象用户通过OBS导入模型时，选择使用基础镜像，用户自己编写了部分推理代码实现自己的推理逻辑，出现故障后希望通过故障日志排查定位故障原因，但是通过logger打印日志无法在“在线服务”的日志中查看到部分内容

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 模型管理

总条数： 2637

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

准备代码 - AI开发平台ModelArts

准备权重 - AI开发平台ModelArts

Lite Server资源配置流程 - AI开发平台ModelArts

Lite Cluster资源管理介绍 - AI开发平台ModelArts

按标签名称删除标签及仅包含此标签的文件 - AI开发平台ModelArts

创建新版Notebook无法使用已购买的专属资源池，如何解决？ - AI开发平台ModelArts

GPU A系列裸金属服务器RoCE带宽不足如何解决？ - AI开发平台ModelArts

【下线公告】华为云ModelArts自动学习模块的文本分类功能下线公告 - AI开发平台ModelArts

在ModelArts的Notebook中如何将git clone的py文件变为ipynb文件？ - AI开发平台ModelArts

GPU A系列裸金属服务器如何更换NVIDIA和CUDA？ - AI开发平台ModelArts

如何保证自定义镜像能不因为超过35G而保存失败？ - AI开发平台ModelArts

扩缩容Standard专属资源池 - AI开发平台ModelArts

扩缩容Lite Cluster资源池 - AI开发平台ModelArts

升级Lite Cluster资源池驱动 - AI开发平台ModelArts

使用Windows下生成的文本文件时报错找不到路径？ - AI开发平台ModelArts

Notebook中已安装对应库，仍报错import numba ModuleNotFoundError: No module named 'numba' - AI开发平台ModelArts

GPU裸金属服务器使用EulerOS内核误升级如何解决 - AI开发平台ModelArts

GPU A系列裸金属服务器使用CUDA cudaGetDeviceCount()提示CUDA initializat失败 - AI开发平台ModelArts

管理在线服务生命周期 - AI开发平台ModelArts

通过OBS导入模型时，如何编写打印日志代码才能在ModelArts日志查询界面看到日志 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线