搜索_华为云

准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

PyTorch：2.1.0 Step1 创建ECS 下文中介绍如何在ECS中构建一个训练镜像，请参考ECS文档购买一个Linux弹性云服务器。完成网络配置、高级配置等步骤，可根据默认选择，或进行自定义。创建完成后，单击“远程登录”，后续安装Docker等操作均在该ECS上进行。注意：CPU架构必

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.906） > 准备工作
使用Notebook进行AI开发调试 - AI开发平台ModelArts

实例通过VS Code远程使用Notebook实例通过SSH工具远程使用Notebook 管理Notebook实例使用CodeLab免费体验Notebook ModelArts CLI命令参考在Notebook中使用Moxing命令

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard）
训练作业找不到GPU - AI开发平台ModelArts

可见的GPU： os.environ['CUDA_VISIBLE_DEVICES'] = '0,1,2,3,4,5,6,7' 其中，0为服务器的GPU编号，可以为0，1，2，3等，表明对程序可见的GPU编号。如果未进行添加配置则该编号对应的GPU不可用。父主题： GPU相关问题

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > GPU相关问题
GPT-2基于Server适配PyTorch GPU的训练推理指导 - AI开发平台ModelArts

关于Ant8裸金属服务器的购买，可以在华为云官网提工单至ModelArts云服务，完成资源的申请。步骤1 安装模型安装Megatron-DeepSpeed框架。使用root用户SSH的方式登录GPU裸金属服务器。具体登录方式请参见SSH密钥方式登录裸金属服务器。拉取pyto

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源使用
pipeline应用准备 - AI开发平台ModelArts

Diffusion v1.5的onnx pipeline代码为例进行说明。进入容器环境，创建自己的工作目录。由于在Snt9B裸金属服务器环境配置指南的配置环境步骤中，在启动容器时将物理机的home目录挂载到容器的“/home_host”目录下，该目录可以直接使用上传到物理机

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导
将数据预热到SFS Turbo - AI开发平台ModelArts

从OBS导入到SFS Turbo高性能文件存储中，数据预热功能的具体操作请参考创建SFS Turbo 和 OBS 之间的联动任务。在ECS服务器挂载SFS Turbo已经将SFS Turbo挂载到了/mnt/sfs_turbo目录，这里参考obsutil文档，直接使用obsut

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.912） > 准备工作
配置Lite Server存储 - AI开发平台ModelArts

Turbo文件系统。同一区域不同可用区之间文件系统与云服务器互通，因此保证SFS Turbo与Server服务器在同一区域即可。当创建文件系统后，您需要使用弹性裸金属服务器来挂载该文件系统，具体步骤请参考挂载NFS协议类型文件系统到云服务器（Linux）。为避免已挂载文件系统的云服务器重启后，挂载信息丢失，

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源配置
使用DCGM监控Lite Server资源 - AI开发平台ModelArts

GPU大规模集群的一体化工具，提供多种能力，包括主动健康监控、诊断、系统验证、策略、电源和时钟管理、配置管理和审计等。约束限制仅适用于GPU资源监控。前提条件裸金属服务器需要安装driver、cuda、fabric-manager软件包。步骤一：安装Docker 使用Docker官方脚本安装最新版Docker：

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源管理 > 监控Lite Server资源
将Notebook的Conda环境迁移到SFS磁盘 - AI开发平台ModelArts

重新启动镜像激活SFS盘中的虚拟环境保存并共享虚拟环境前提条件创建一个Notebook，“资源类型”选择“专属资源池”，“存储配置”选择“SFS弹性文件服务器”，打开terminal。创建新的虚拟环境并保存到SFS目录创建新的conda虚拟环境。 # shell conda create --prefix

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard开发环境
ModelArts中的作业为什么一直处于等待中？ - AI开发平台ModelArts

空出来30卡，这个1卡的任务也排不上。如果是公共资源池，一般是由于其他用户占用资源导致。有以下方法可以尝试：如果使用的是免费规格，可以换成收费规格，免费规格资源较少，排队概率高。规格选择卡数尽量少，如可以选择1卡，相比于选择8卡排队几率大大降低。可以尝试使用其他Region（如北京四切换为上海一）。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard专属资源池
使用ModelArts Standard自定义算法实现手写数字识别 - AI开发平台ModelArts

完成在线服务创建。本案例适用于CPU规格，节点规格需选择CPU。如果有免费CPU规格，可选择免费规格进行部署（每名用户限部署一个免费的在线服务，如果您已经部署了一个免费在线服务，需要先将其删除才能部署新的免费在线服务）。图7 部署模型完成服务部署后，返回在线服务页面列表页，等

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练
MaaS使用场景和使用流程 - AI开发平台ModelArts

服务进行预测。调用MaaS部署的模型服务免费体验预置服务 ModelArts Studio大模型即服务平台给新用户分配了每个模型100万Tokens的免费调用额度，无需部署即可一键体验通义千问、ChatGLM等预置模型服务。免费体验MaaS预置服务 - 应用体验 ModelArts

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
服务管理权限 - AI开发平台ModelArts

服务管理权限表1 服务管理细化权限说明权限对应API接口授权项依赖的授权项 IAM项目企业项目部署模型服务 POST /v1/{project_id}/services modelarts:service:create - √ √ 查询模型服务列表 GET /v1/

帮助中心 > AI开发平台ModelArts > API参考 > 权限策略和授权项
推理部署计费项 - AI开发平台ModelArts

由云日志服务（LTS）提供日志收集、分析、存储等服务。部署服务时，开启“运行日志输出”后，日志数据超出LTS免费额度后，会产生费用。具体可云日志服务价格详情按实际日志量付费超过免费额度后，按实际日志存储量和存储时长收费计费示例以下案例中出现的费用价格仅供参考，实际价格请参见各服务价格详情。

帮助中心 > AI开发平台ModelArts > 计费说明 > 计费项
查询支持的服务部署规格 - AI开发平台ModelArts

自己产生的模型；取值为auto时，代表是自动学习训练的模型，计费方式有差别。 is_free Boolean 当前规格是否是免费规格，“true”表示是免费规格。 over_quota Boolean 当前规格是否超过可用配额，“true”表示超过可用配额。 extend_params

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
发布ModelArts模型 - AI开发平台ModelArts

、模型开发商、解决方案集成商、企业级个人开发者等群体，提供安全、开放的共享，加速AI资产的开发与落地。发布至AI Gallery的资产是免费的，只需要支付在使用过程中消耗的硬件资源，硬件资源费用将根据实际使用情况由ModelArts管理控制台向使用方收取。发布至AI云商店华

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理ModelArts模型
管理Lite Cluster节点 - AI开发平台ModelArts

留。 - 重部署：通过更换为新服务器实现修复，修复耗时较短，本地盘数据会丢失。修复期间实例将无法工作，请确保相关实例业务已离线。如果云服务器上的业务不可停止，请勿修复，并联系技术支持进行处理。若选择了重部署修复方式，实例会立即关机并迁移到新服务器，本地盘数据会被清空，请提前做好业务迁移和数据备份。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理
Lite Cluster资源配置流程 - AI开发平台ModelArts

点名称，跳转至弹性云服务器页面。图8 节点管理单击“远程登录”，在弹出的窗口中，单击“CloudShell登录”。图9 远程登录在CloudShell中设置密码等参数后，单击“连接”即可登录节点，CloudShell介绍可参见远程登录Linux弹性云服务器（CloudShell方式）

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源配置
Lite Server - AI开发平台ModelArts
Lite Server - AI开发平台ModelArts

Lite Server GPU裸金属服务器使用EulerOS内核误升级如何解决 GPU A系列裸金属服务器无法获取显卡如何解决 GPU裸金属服务器无法Ping通如何解决 GPU A系列裸金属服务器RoCE带宽不足如何解决？ GPU裸金属服务器更换NVIDIA驱动后执行nvidia-smi提示Failed

帮助中心 > AI开发平台ModelArts > 故障排除
运行第一条Workflow - AI开发平台ModelArts

”区域选择推理需要使用到的资源规格，完成后选择“继续运行”，等待服务部署完成。计算节点规格：华北-北京四可支持限时免费的规格，但每个用户仅允许创建一个基于此免费规格的实例。按需计费规格，使用完之后请及时停止Workflow，避免产生不必要的费用。测试推理服务：工作流运行完成

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发

总条数： 1638

上一页
1
...
5
6
7
...
82
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

准备镜像 - AI开发平台ModelArts

使用Notebook进行AI开发调试 - AI开发平台ModelArts

训练作业找不到GPU - AI开发平台ModelArts

GPT-2基于Server适配PyTorch GPU的训练推理指导 - AI开发平台ModelArts

pipeline应用准备 - AI开发平台ModelArts

将数据预热到SFS Turbo - AI开发平台ModelArts

配置Lite Server存储 - AI开发平台ModelArts

使用DCGM监控Lite Server资源 - AI开发平台ModelArts

将Notebook的Conda环境迁移到SFS磁盘 - AI开发平台ModelArts

ModelArts中的作业为什么一直处于等待中？ - AI开发平台ModelArts

使用ModelArts Standard自定义算法实现手写数字识别 - AI开发平台ModelArts

MaaS使用场景和使用流程 - AI开发平台ModelArts

服务管理权限 - AI开发平台ModelArts

推理部署计费项 - AI开发平台ModelArts

查询支持的服务部署规格 - AI开发平台ModelArts

发布ModelArts模型 - AI开发平台ModelArts

管理Lite Cluster节点 - AI开发平台ModelArts

Lite Cluster资源配置流程 - AI开发平台ModelArts

Lite Server - AI开发平台ModelArts

运行第一条Workflow - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线