搜索_华为云

场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

确保容器可以访问公网。训练支持的模型列表本方案支持以下模型的训练，如表1所示。表1 支持的模型列表序号支持模型支持模型参数量权重文件获取地址 1 llama2 llama2-7b https://huggingface.co/meta-llama/Llama-2-7b-chat-hf

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.907）
GP Vnt1裸金属服务器用PyTorch报错CUDA initialization:CUDA unknown error - AI开发平台ModelArts

命令，将必要的内核模块加载到系统中。但有时候也可能需要手动执行该命令。例如，在更新了NVIDIA驱动后，需要重新加载新版本的内核模块才能使变更生效。此外，如果使用了多个NVIDIA显卡，每个显卡都需要加载相应的内核模块才能正常工作。在这种情况下，也需要手动执行“nvidia-m

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
查询网络资源 - AI开发平台ModelArts

Turbo的连接状态信息。可选值如下： Active：SFS连通状态正常 Abnormal：SFS连通状态异常 ipAddr String SFS Turbo的访问地址。状态码： 404 表13 响应Body参数参数参数类型描述 error_code String ModelArts错误码。 error_msg

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
创建API - AI开发平台ModelArts
创建API - AI开发平台ModelArts

String API的认证方式。枚举值如下： NONE：无认证 APP：APP认证 IAM：IAM认证 predict_url String 预测地址。 service_id String 服务编号。 service_name String 服务名称。 support_app_code Boolean

帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理
查询节点列表 - AI开发平台ModelArts

Abnormal：节点不正常 Checking: 节点自检中 az String 节点所在的可用区。 privateIp String 节点的IP地址。 resources NodeResource object 节点资源量信息。 availableResources NodeResource

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
查询节点池的节点列表 - AI开发平台ModelArts

Abnormal：节点不正常 Checking: 节点自检中 az String 节点所在的可用区。 privateIp String 节点的IP地址。 resources NodeResource object 节点资源量信息。 availableResources NodeResource

帮助中心 > AI开发平台ModelArts > API参考 > 节点池管理
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

本案例仅支持在专属资源池上运行。支持的模型列表本方案支持以下模型的训练，如表1所示。表1 支持的模型列表序号支持模型支持模型参数量权重文件获取地址 1 llama2 llama2-7b https://huggingface.co/meta-llama/Llama-2-7b-chat-hf

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.906）
按需计费 - AI开发平台ModelArts
按需计费 - AI开发平台ModelArts

本文价格仅供参考，实际计算请以ModelArts价格详情中的价格为准。变更配置后对计费的影响如果您在购买按需计费资源池后变更了规格配置，会产生一个新订单并开始按新配置的价格计费，旧订单自动失效。如果您在一个小时内变更了规格配置，将会产生多条计费信息。每条计费信息的开始时间和结束时间对应不同配置在该小时内的生效时间。

帮助中心 > AI开发平台ModelArts > 计费说明 > 计费模式
推理场景介绍 - AI开发平台ModelArts

具体如表1所示。表1 支持的模型列表和权重获取地址序号模型名称是否支持fp16/bf16推理是否支持W4A16量化是否支持W8A8量化是否支持W8A16量化是否支持 kv-cache-int8量化开源权重获取地址 1 llama-7b √ √ √ √ √ https://huggingface

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910）
从0制作自定义镜像用于创建训练作业（Tensorflow+GPU） - AI开发平台ModelArts

0-cp37-cp37m-manylinux_2_17_x86_64.manylinux2014_x86_64.whl文件。下载Miniconda3安装文件。使用地址https://repo.anaconda.com/miniconda/Miniconda3-py37_4.12.0-Linux-x86_64

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于训练模型
服务部署、启动、升级和修改时，资源不足如何处理？ - AI开发平台ModelArts

专属资源池扩容，可参考扩缩容资源池。如果磁盘空间不够，可以尝试重试，使实例调度到其他节点。如果单实例仍磁盘空间不足，请联系系统管理员，更换合适的规格。如果是大模型导入的模型部署服务，请确保专属资源池磁盘空间大于1T（1000GB）。父主题：服务部署

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
ModelArts中的作业为什么一直处于等待中？ - AI开发平台ModelArts

费规格资源较少，排队概率高。规格选择卡数尽量少，如可以选择1卡，相比于选择8卡排队几率大大降低。可以尝试使用其他Region（如北京四切换为上海一）。如果有长期的资源使用诉求，可以购买独占使用的专属资源池。如果是专属资源池，建议您进行以下排查：排查专属资源池中是否存在其

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard专属资源池
释放Standard专属资源池和删除网络 - AI开发平台ModelArts

在专属资源池列表中，在需要删除的资源池的右侧操作列选择“ > 删除”。在“删除资源池”页面，需在文本框中输入“DELETE”，单击“确定”，删除资源池。可切换“训练作业”、“推理服务”、“开发环境”页签查看资源池上创建的训练作业、部署的推理服务、创建的Notebook实例。图1 删除资源池释放游离节点

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理 > 管理Standard专属资源池
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

本案例仅支持在专属资源池上运行。支持的模型列表本方案支持以下模型的训练，如表1所示。表1 支持的模型列表序号支持模型支持模型参数量权重文件获取地址 1 llama2 llama2-7b https://huggingface.co/meta-llama/Llama-2-7b-chat-hf

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.907）
查询网络资源列表 - AI开发平台ModelArts

Turbo的连接状态信息。可选值如下： Active：SFS连通状态正常 Abnormal：SFS连通状态异常 ipAddr String SFS Turbo的访问地址。请求示例查询资源池列表。 GET https://{endpoint}/v2/{project_id}/pools { } 响应示例

 帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
从0制作自定义镜像用于创建训练作业（MPI+CPU/GPU） - AI开发平台ModelArts

Engine来制作自定义镜像。准备名为context的文件夹。 mkdir -p context 下载Miniconda3安装文件。使用地址https://repo.anaconda.com/miniconda/Miniconda3-py37_4.12.0-Linux-x86_64

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于训练模型
示例：从 0 到 1 制作自定义镜像并用于训练（MPI+CPU/GPU） - AI开发平台ModelArts

Engine来制作自定义镜像。准备名为context的文件夹。 mkdir -p context 下载Miniconda3安装文件。使用地址 https://repo.anaconda.com/miniconda/Miniconda3-py37_4.12.0-Linux-x86_64

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例
推理场景介绍 - AI开发平台ModelArts

具体如表1所示。表1 支持的模型列表和权重获取地址序号模型名称是否支持fp16/bf16推理是否支持W4A16量化是否支持W8A8量化是否支持W8A16量化是否支持 kv-cache-int8量化开源权重获取地址 1 llama-7b √ √ √ √ √ https://huggingface

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911）
VS Code连接开发环境失败时的排查方法 - AI开发平台ModelArts

排查/home/ma-user/.ssh目录权限是否为755/750，不是该权限请修改。连接时如果报错密钥无权限，排查密钥是否为自己的密钥（可能使用了重名密钥），请更换密钥后重新连接实例。本地排查检查配置是否正确。打开config文件进行检查：Host必须放在每组配置的第一行，作为每组配置的唯一ID。

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

确保集群可以访问公网。训练支持的模型列表本方案支持以下模型的训练，如表1所示。表1 支持的模型列表序号支持模型支持模型参数量权重文件获取地址 1 llama2 llama2-7b https://huggingface.co/meta-llama/Llama-2-7b-chat-hf

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.909）

总条数： 1003

上一页
1
...
43
44
45
...
51
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

场景介绍 - AI开发平台ModelArts

GP Vnt1裸金属服务器用PyTorch报错CUDA initialization:CUDA unknown error - AI开发平台ModelArts

查询网络资源 - AI开发平台ModelArts

创建API - AI开发平台ModelArts

查询节点列表 - AI开发平台ModelArts

查询节点池的节点列表 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

按需计费 - AI开发平台ModelArts

推理场景介绍 - AI开发平台ModelArts

从0制作自定义镜像用于创建训练作业（Tensorflow+GPU） - AI开发平台ModelArts

服务部署、启动、升级和修改时，资源不足如何处理？ - AI开发平台ModelArts

ModelArts中的作业为什么一直处于等待中？ - AI开发平台ModelArts

释放Standard专属资源池和删除网络 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

查询网络资源列表 - AI开发平台ModelArts

从0制作自定义镜像用于创建训练作业（MPI+CPU/GPU） - AI开发平台ModelArts

示例：从 0 到 1 制作自定义镜像并用于训练（MPI+CPU/GPU） - AI开发平台ModelArts

推理场景介绍 - AI开发平台ModelArts

VS Code连接开发环境失败时的排查方法 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线