-
监控 - AI开发平台ModelArts
监控 CES服务监控方案 DCGM监控方案 父主题: DevServer资源配置
-
Notebook提示磁盘空间已满 - AI开发平台ModelArts
--max-depth 0 如果Notebook实例的存储配置采用的是云硬盘EVS,可在Notebook详情页申请扩容磁盘。 建议与总结 建议在使用Notebook时注意磁盘空间大小,随时删除不需要的文件。以免因磁盘空间问题导致训练失败。 父主题: 环境配置故障
-
配置流程 - AI开发平台ModelArts
配置流程 图1 DevServer资源配置流程图 表1 Server资源配置流程 配置顺序 配置分类 配置任务 使用场景说明 是否必选操作 1 网络 单EIP实现多节点的SSH登录和外网访问 指导一个租户VPC配置一个EIP,通过NAT网关配置进行EIP资源共享,实现该VPC下的
-
网络访问 - AI开发平台ModelArts
网络访问 单EIP实现多节点的SSH登录和外网访问 单EIP绑定裸金属服务器 裸金属服务器支持IPV6解决方案 父主题: DevServer资源配置
-
环境配置 - AI开发平台ModelArts
环境配置 GPU裸金属服务器环境配置 NPU Snt9B裸金属服务器环境配置 父主题: DevServer资源配置
-
DevServer资源配置 - AI开发平台ModelArts
DevServer资源配置 使用前须知 配置流程 网络访问 存储 环境配置 监控 父主题: 弹性裸金属DevServer
-
为什么项目删除完了,仍然还在计费? - AI开发平台ModelArts
制台,清理您不再使用的数据、文件夹以及OBS桶,避免产生不必要的费用。 您在创建Notebook时,选择了云硬盘EVS存储,该存储会单独收费,Notebook停止后,EVS还在计费,请及时删除该Notebook实例。 您在体验CodeLab时,切换规格为付费的规格时会收费。请前往
-
欠费说明 - AI开发平台ModelArts
入保留期,资源状态变为“已冻结”,您将无法对处于保留期的按需计费资源执行任何操作。 保留期到期后,如果您仍未支付账户欠款,那么计算资源、云硬盘和对象存储都将被释放,数据无法恢复。 图1 按需计费资源生命周期 华为云根据客户等级定义了不同客户的宽限期和保留期时长。 避免和处理欠费
-
Ascend上如何查看实时性能指标? - AI开发平台ModelArts
Ascend上如何查看实时性能指标? Ascend芯片上查看实时性能指标:npu-smi info,类似GPU的nvidia-smi。 父主题: 更多功能咨询
-
存储 - AI开发平台ModelArts
存储 裸金属服务器存储指南 父主题: DevServer资源配置
-
主流开源大模型基于DevServer适配PyTorch NPU推理指导(6.3.905) - AI开发平台ModelArts
主流开源大模型基于DevServer适配PyTorch NPU推理指导(6.3.905) 推理场景介绍 部署推理服务 推理性能测试 推理精度测试 附录:大模型推理常见问题 父主题: LLM大语言模型
-
开通流程 - AI开发平台ModelArts
开通流程 图1 DevServer资源开通流程图 表1 DevServer资源开通流程 阶段 任务 参考 准备工作 1、申请开通资源规格。 Step1:申请开通资源规格 2、资源配额提升。 Step2:资源配额提升 3、基础权限开通。 Step3:基础权限开通 4、配置ModelArts委托授权。
-
裸金属服务器存储指南 - AI开发平台ModelArts
裸金属服务器结合OBS、SFS两种云存储服务,提供了多种场景下的存储解决方案。两种存储类型对比可参考SFS和OBS的区别。 1、弹性文件服务SFS 提供按需扩展的高性能文件存储(NAS),可为云上多个裸金属服务器(BMS)提供共享访问。 购买指南 挂载指南 服务器重启后自动挂载指南 2、对象存储服务OBS
-
GP Ant8裸金属本地盘实现软RAID5的解决方案 - AI开发平台ModelArts
了本地盘数据的可靠性,当其中一块硬盘故障时,备份硬盘可自动恢复数据。 RAID1:同时对2个硬盘读写(同样的数据),强调数据的绝对安全性,一般会对系统盘做RAID1方案,但是该方案磁盘利用率只有50%,比较浪费。 RAID5:把多个(最少3个)硬盘合并成1个逻辑盘使用,数据读写时
-
容器中挂载存储 - AI开发平台ModelArts
SFS容量型文件系统不适合海量小文件业务。 静态挂载 动态挂载 EVS 适用于Notebook场景,开发过程的数据持久化。 每个云盘只能在单个节点挂载。 存储大小根据云硬盘的大小而定。 静态挂载 动态挂载 数据盘空间分配详细说明请参见文档数据盘空间分配说明。 常见问题 当用户发现可访问的存储空间比较小,如
-
DevServer管理 - AI开发平台ModelArts
DevServer管理 查询用户所有DevServer实例列表 创建DevServer 查询DevServer实例详情 删除DevServer实例 实时同步用户所有DevServer实例状态 启动DevServer实例 停止DevServer实例
-
创建云上开发环境 - AI开发平台ModelArts
根据选择的芯片类型不同,可选资源规格也不同。请根据界面实际情况和需要选择。 “存储配置” 包括“云硬盘EVS”和“弹性文件服务SFS”。请根据界面实际情况和需要选择。 选择“云硬盘EVS”作为存储位置。 根据实际使用量设置磁盘规格。磁盘规格默认5GB。磁盘规格的取值范围为5GB~4096GB。
-
CES服务监控方案 - AI开发平台ModelArts
memory_utilization 显存使用率。 该GPU的显存使用率。 % instance_id,gpu gpu_performance gpu性能状态。 该GPU的性能状态。 - instance_id,gpu encoder_utilization 编码使用率。 该GPU的编码能力使用率。 %
-
主流开源大模型基于DevServer适配PyTorch NPU推理指导(6.3.904) - AI开发平台ModelArts
主流开源大模型基于DevServer适配PyTorch NPU推理指导(6.3.904) 推理场景介绍 部署推理服务 推理性能测试 推理精度测试 父主题: LLM大语言模型
-
主流开源大模型基于DevServer适配PyTorch NPU训练指导(6.3.905) - AI开发平台ModelArts
主流开源大模型基于DevServer适配PyTorch NPU训练指导(6.3.905) 场景介绍 准备工作 预训练任务 SFT全参微调训练任务 LoRA微调训练 查看日志和性能 训练脚本说明 父主题: LLM大语言模型