搜索_华为云

GPU业务迁移至昇腾训练推理 - AI开发平台ModelArts

GPU业务迁移至昇腾训练推理 ModelArts昇腾迁移调优工具总览 GPU训练业务迁移至昇腾的通用指导基于AIGC模型的GPU推理业务迁移至昇腾指导 GPU推理业务迁移至昇腾的通用指导基于advisor的昇腾训练性能自助调优指导 Dit模型PyTorch迁移与精度性能调优 msprobe工具使用指导

 帮助中心 > AI开发平台ModelArts > 最佳实践
Standard镜像相关 - AI开发平台ModelArts

注意事项？镜像在SWR上显示只有13G，安装少量的包，然后镜像保存过程会提示超过35G大小保存失败，为什么？如何保证自定义镜像能不因为超过35G而保存失败？如何减小本地或ECS构建镜像的目的镜像的大小？镜像过大，卸载原来的包重新打包镜像，最终镜像会变小吗？在ModelA

帮助中心 > AI开发平台ModelArts > 常见问题
配置Lite Server网络 - AI开发平台ModelArts

选择按需计费的NAT网关时，单击“提交”。选择包年/包月计费的NAT网关时，单击“去支付”。进入订单支付页面，确认订单信息，单击“确认付款”。虚拟私有云和子网和Server资源的网络保持一致。配置SNAT规则。 SNAT功能通过绑定弹性公网IP，实现私有IP向公有IP的转换，可

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源配置
启动Notebook实例 - AI开发平台ModelArts

String 任务某个步骤的描述。表5 EndpointsRes 参数参数类型描述 allowed_access_ips Array of strings 允许通过SSH协议访问Notebook的公网IP地址白名单列表，默认都可以访问。当配置指定IP后，则仅允许IP所在的客户端实现对Notebook的访问。

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
批量修改标签 - AI开发平台ModelArts

@modelarts:color 否 String 内置属性：标签展示的颜色，为色彩的16进制代码，默认为空。例如：“#FFFFF0”。 @modelarts:default_shape 否 String 内置属性：物体检测标签的默认形状（物体检测标签专用属性），默认为空。可选值如下： bndbox：矩形。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
Lite Server部署推理服务 - AI开发平台ModelArts

表示需要在容器中挂载宿主机中文件在目录。dir为宿主机中的${path-to-file}目录，存放的是权重文件和rank_table_file.json文件，${container_work_dir}为要挂载到的容器中的目录。为方便两个地址可以相同。容器不能挂载到/home/

帮助中心 > AI开发平台ModelArts > 最佳实践 > DeepSeek系列模型推理 > DeepSeek模型基于ModelArts Lite Server适配MindIE推理部署指导
Standard专属资源池 - AI开发平台ModelArts

资源池吗？在ModelArts中1个节点的专属资源池，能否部署多个服务？在ModelArts中公共资源池和专属资源池的区别是什么？ ModelArts中的作业为什么一直处于等待中？ ModelArts控制台为什么能看到创建失败被删除的专属资源池？ ModelArts训练专属资

 帮助中心 > AI开发平台ModelArts > 常见问题
查询开发环境实例详情 - AI开发平台ModelArts

存储路径。如果type为“obs”类型，该值必须填写，该值需为有效的OBS桶路径，且以“/”结束。不能指定为OBS桶的根目录，需指定为OBS桶下的具体目录。如果type为“obsfs”类型，该值需为有效的OBS并行文件系统的桶名（当前CCE不支持挂载子目录）。如果type为“evs”类型，该值不需要填写。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 开发环境（旧版）
查询数据集详情 - AI开发平台ModelArts

数据集版本名称。 with_column_header Boolean 发布的CSV文件的第一行是否为列名，对于表格数据集有效。可选值如下： true：发布的CSV文件的第一行是列名 false：发布的CSV文件的第一行不是列名表10 LabelStats 参数参数类型描述 attributes

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
代码运行故障 - AI开发平台ModelArts

kernel，并导致实例崩溃如何解决训练过程中出现的cudaCheckError错误？如何处理使用opencv.imshow造成的内核崩溃？使用Windows下生成的文本文件时报错找不到路径？创建Notebook文件后，右上角的Kernel状态为“No Kernel”如何处理？

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境
Studio - AI开发平台ModelArts
Studio - AI开发平台ModelArts

重校验失败使用AWQ或SQ压缩后的模型新增版本时，权重校验失败使用Qwen2.5-72B-1K、Qwen2.5-32B调优的Checkpoint创建模型时，权重校验失败创建Qwen2-0.5B或Qwen2-1.5B模型的LoRA微调类型的调优任务，显示创建失败创建训练任务，显示创建失败

 帮助中心 > AI开发平台ModelArts > 常见问题
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

/etc/profile # 注意这里的echo 要使用单引号，单引号会原样输出，双引号会解析变量 source /etc/profile # 使刚才配置生效创建buildkitd的启动服务。其中都是buildkitd.service的内容。复制以下全部命令并运行即可。 cat

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911） > 准备工作
数据管理权限 - AI开发平台ModelArts

modelarts:dataset:getWorkforceTask - √ √ 表2 数据集版本管理的细化权限说明权限对应API接口授权项依赖的授权项 IAM项目企业项目查询数据集的版本列表 GET /v2/{project_id}/datasets/{dataset_id}/versions

帮助中心 > AI开发平台ModelArts > API参考 > 权限策略和授权项
使用Gallery CLI配置工具下载文件 - AI开发平台ModelArts

Gallery仓库依次下载除某种格式之外的其他格式的文件到服务器的缓存目录下。 gallery-cli download {repo_id} --exclude "*.json" 如下所示，表示下载除“.json”格式之外的其他格式的文件到服务器的缓存目录“/test”下，当回显“100%”时表示下载完成。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > Gallery CLI配置工具指南
创建算法 - AI开发平台ModelArts
创建算法 - AI开发平台ModelArts

算法名称。限制为1-64位只含数字、字母、下划线和中划线的名称。 description 否 String 对算法的描述，默认为“NULL”，字符串的长度限制为[0, 256]。 workspace_id 否 String 指定算法所处的工作空间，默认值为“0”。“0” 为默认的工作空间。 ai_project

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
创建节点池 - AI开发平台ModelArts

String 用户在运营平台选择的折扣信息。 os.modelarts/service.console.url 否 String 订购订单支付完成后跳转的url地址。 os.modelarts/order.id 否 String 订单id，包周期资源创建或者计费模式变更的时候该参数必需。表5

帮助中心 > AI开发平台ModelArts > API参考 > 节点池管理
查询团队标注验收任务报告 - AI开发平台ModelArts

历史汇总后的统计信息。表4 CheckTaskStats 参数参数类型描述 accepted_sample_count Integer 通过的样本数目。 checked_sample_count Integer 已验收的样本数目。 pass_rate Double 样本的通过率。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
查询服务列表 - AI开发平台ModelArts

息头中X-Subject-Token的值）。响应参数状态码： 200 表4 响应Body参数参数参数类型描述 total_count Integer 不分页的情况下符合查询条件的总服务数量。 count Integer 当前查询结果的服务数量，不设置offset、lim

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
无法导入模块 - AI开发平台ModelArts

xxx”的报错，可以判断是环境中没有包含用户依赖的python包。处理方法训练作业导入模块时日志出现前两条报错信息，处理方法如下：首先保证被导入的module中有“__init__.py”存在，创建“module_dir”的“__init__.py”，如原因分析中的结构所示。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
GPU A系列裸金属服务器使用CUDA cudaGetDeviceCount()提示CUDA initializat失败 - AI开发平台ModelArts

导致。执行以下命令，查看NVIDIA和CUDA的版本，以及nvidia-fabricmanager的状态。 systemctl status nvidia-fabricmanager 发现nvidia-fabricmanager的服务为failed状态，尝试重新启动nvidia

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server

总条数： 2290

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

GPU业务迁移至昇腾训练推理 - AI开发平台ModelArts

Standard镜像相关 - AI开发平台ModelArts

配置Lite Server网络 - AI开发平台ModelArts

启动Notebook实例 - AI开发平台ModelArts

批量修改标签 - AI开发平台ModelArts

Lite Server部署推理服务 - AI开发平台ModelArts

Standard专属资源池 - AI开发平台ModelArts

查询开发环境实例详情 - AI开发平台ModelArts

查询数据集详情 - AI开发平台ModelArts

代码运行故障 - AI开发平台ModelArts

Studio - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

数据管理权限 - AI开发平台ModelArts

使用Gallery CLI配置工具下载文件 - AI开发平台ModelArts

创建算法 - AI开发平台ModelArts

创建节点池 - AI开发平台ModelArts

查询团队标注验收任务报告 - AI开发平台ModelArts

查询服务列表 - AI开发平台ModelArts

无法导入模块 - AI开发平台ModelArts

GPU A系列裸金属服务器使用CUDA cudaGetDeviceCount()提示CUDA initializat失败 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线