搜索_华为云

哪里可以了解Atlas800训练服务器硬件相关内容 - AI开发平台ModelArts

Tool接口参考中的指导。 NPU上的网卡在哪里可以看到，会健康检查吗？ 8*NPU的网卡为机头上配置的四个2*100GE网卡。华为云有网卡健康状态监控机制。父主题： Lite Server

帮助中心 > AI开发平台ModelArts > 常见问题 > Lite Server
AI开发基本概念 - AI开发平台ModelArts

户的分类、客户的属性和特征分析、客户满意度分析、客户的购买趋势预测等。聚类聚类是把一组数据按照相似性和差异性分为几个类别，其目的是使得属于同一类别的数据间的相似性尽可能大，不同类别中的数据间的相似性尽可能小。它可以应用到客户群体的分类、客户背景分析、客户购买趋势预测、市场的细分等。

帮助中心 > AI开发平台ModelArts > 产品介绍 > AI开发基础知识
为什么无法启动训练？ - AI开发平台ModelArts

为什么无法启动训练？如果启动脚本选择了不属于本工程的代码，则无法启动训练，错误信息如下图所示。建议将启动脚本添加至本工程，或者是打开启动脚本所在工程后，再启动训练作业。图1 错误信息父主题： PyCharm Toolkit使用

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > PyCharm Toolkit使用
安全边界 - AI开发平台ModelArts
安全边界 - AI开发平台ModelArts

可以访问云服务，保证租户之前的相互隔离。提供可靠的备份和灾难恢复机制，以确保数据不会因为硬件故障或自然灾害等原因而丢失。提供透明的安全监控和事件响应服务，及时的安全更新和漏洞修补。而云服务客户则需要执行以下任务：将数据和应用程序加密，以保护数据的机密性和完整性。确保AI

帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
API概览 - AI开发平台ModelArts
API概览 - AI开发平台ModelArts

查询服务详情，根据服务ID查询服务详情。启动停止边缘节点服务实例启动停止边缘节点服务实例。更新服务配置更新模型服务。查询服务监控信息查询服务监控信息。查询服务更新日志查询实时服务更新日志。查询服务事件日志查询服务事件日志，包含服务的操作记录及部署过程中的关键动作、部署失败原因。

帮助中心 > AI开发平台ModelArts > API参考
Cluster资源池节点故障如何定位 - AI开发平台ModelArts

规则类型：选择阈值类告警。监控对象：选择命令行输入。命令行输入框： sum(nt_npg{type="NT_NPU_CARD_LOSE"} !=2) by (cluster_name, node_ip,type) 图2 告警规则设置告警条件：选择触发条件在1个监控周期内，如果平均值>=1达到连续1次时，产生重要告警。

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Cluster
Lite Cluster高危操作一览表 - AI开发平台ModelArts

回退版本、重装插件。升级、卸载volcano插件。可能导致作业调度异常。中回退版本、重装插件。卸载ICAgent插件。可能导致日志、监控功能异常。中回退版本、重装插件。 helm 升级、回退、卸载os-node-agent。导致驱动升级、故障检测、指标采集、节点运维功能异常。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster使用前必读
ModelArts通过OBS的API访问OBS中的文件，算内网还是公网？ - AI开发平台ModelArts

ModelArts通过OBS的API访问OBS中的文件，算内网还是公网？在同一区域，ModelArts通过OBS的API访问OBS中的文件属于内网通信，不消耗公网流量费。如果是通过互联网从OBS下载数据到本地，这时候会产生OBS公网流量费。OBS的详细计费说明可以参见计费项。父主题：

帮助中心 > AI开发平台ModelArts > 常见问题 > API/SDK
Standard模型训练 - AI开发平台ModelArts

个训练作业，方便用户选择最优的模型提供训练作业的事件信息（训练作业生命周期中的关键事件点）、训练日志（训练作业运行过程和异常信息）、资源监控（资源使用率数据）、Cloud Shell（登录训练容器的工具）等能力，方便用户更清楚得了解训练作业运行过程，并在遇到任务异常时更加准确的排查定位问题

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍 > Standard功能介绍
依赖和委托 - AI开发平台ModelArts

aom:event:list aom:event:get 建议配置，若需要AOM查看告警事件则需要配置。监控指标上报CES CES CES ReadOnlyAccess ces:metricMeta:create 建议配置，监控指标上报CES。企业项目 EPS EPS ReadOnlyAccess 可选配置，如果企业项目则需要配置。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 权限控制方式
分离部署推理服务 - AI开发平台ModelArts

将用户请求的prompt传入大模型，进行计算，中间结果写入KVCache并推出第1个token，属于计算密集型。 Decode阶段（增量推理）将请求的前1个token传入大模型，从显存读取前文产生的KVCache再进行计算，属于访存密集型。分离部署场景下，全量推理和增量推理在不同的容器上进行，用于提高资源利用效率。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.908） > 部署推理服务
分离部署推理服务 - AI开发平台ModelArts

将用户请求的prompt传入大模型，进行计算，中间结果写入KVCache并推出第1个token，属于计算密集型。 Decode阶段（增量推理）将请求的前1个token传入大模型，从显存读取前文产生的KVCache再进行计算，属于访存密集型。分离部署场景下，全量推理和增量推理在不同的容器上进行，用于提高资源利用效率。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.909） > 部署推理服务
给子账号配置开发环境基本使用权限 - AI开发平台ModelArts

通过ModelArts的Notebook，在JupyterLab中使用OBS上传下载数据。建议配置。开发环境监控功能 AOM aom:alarm:put 调用AOM的接口，获取Notebook相关的监控数据和事件，展示在ModelArts的Notebook中。建议配置。 VPC接入 VPC vpc:ports:create

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践
配置Lite Server存储 - AI开发平台ModelArts

高性能计算：主要是高带宽的需求，用于共享文件存储，比如基因测序、图片渲染这些。如大数据分析、静态网站托管、在线视频点播、基因测序和智能视频监控等。如高性能计算、企业核心集群应用、企业应用系统和开发测试等。说明：高性能计算：主要是高速率、高IOPS的需求，用于作为高性能存储，比如工业设计、能源勘探这些。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源配置
自动学习简介 - AI开发平台ModelArts

性维护，根据设备实时数据的分析，进行故障识别。声音分类声音分类项目，是识别一段音频中是否包含某种声音。可应用于生产或安防场景的异常声音监控。文本分类文本分类项目，识别一段文本的类别。可应用于情感分析或新闻分类等场景。父主题：使用自动学习实现零代码AI开发

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发
JupyterLab常用功能介绍 - AI开发平台ModelArts

图20 创建“dropdown”类型的表单图21 删除表单资源监控在使用过程中，如果想了解资源使用情况，可在右侧区域选择“Resource Monitor”，展示“CPU使用率”和“内存使用率”。图22 资源监控父主题：通过JupyterLab在线使用Notebook实例进行AI开发

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过JupyterLab在线使用Notebook实例进行AI开发
Standard资源管理 - AI开发平台ModelArts

池的任务中访问自己VPC上的资源，可通过“打通VPC”来实现。更加完善的集群信息：全新改版的专属资源池详情页面中，提供了作业、节点、资源监控等更加全面的集群信息，可帮助您及时了解集群现状，更好的规划使用资源。自助管理集群GPU/NPU驱动：每个用户对集群的驱动要求不同，在新版

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍 > Standard功能介绍
ma-cli configure鉴权命令 - AI开发平台ModelArts

时需要指定，属于PWD鉴权的一部分。 -u / --username String 否用户名，在使用账号认证时表示账号名，IAM认证时表示IAM用户名，在云星账号场景不需要指定，属于PWD鉴权的一部分。 -p / --password String 否密码，属于PWD鉴权的一部分。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > ModelArts CLI命令参考
ModelArts Standard推理服务支持VPC直连的高速访问通道配置 - AI开发平台ModelArts

接经VPC对等连接发送到实例处理，访问速度更快。由于请求不经过推理平台，所以会丢失以下功能：认证鉴权流量按配置分发负载均衡告警、监控和统计图1 VPC直连的高速访问通道示意图准备工作使用专属资源池部署在线服务，服务状态为“运行中”。只有专属资源池部署的服务才支持VPC直连的高速访问通道。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
数据管理权限 - AI开发平台ModelArts

{dataset_id}/data-annotations/stats modelarts:dataset:get - √ √ 查询数据集监控数据 GET /v2/{project_id}/datasets/{dataset_id}/metrics modelarts:dataset:get

帮助中心 > AI开发平台ModelArts > API参考 > 权限策略和授权项

总条数： 115

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

哪里可以了解Atlas800训练服务器硬件相关内容 - AI开发平台ModelArts

AI开发基本概念 - AI开发平台ModelArts

为什么无法启动训练？ - AI开发平台ModelArts

安全边界 - AI开发平台ModelArts

API概览 - AI开发平台ModelArts

Cluster资源池节点故障如何定位 - AI开发平台ModelArts

Lite Cluster高危操作一览表 - AI开发平台ModelArts

ModelArts通过OBS的API访问OBS中的文件，算内网还是公网？ - AI开发平台ModelArts

Standard模型训练 - AI开发平台ModelArts

依赖和委托 - AI开发平台ModelArts

分离部署推理服务 - AI开发平台ModelArts

分离部署推理服务 - AI开发平台ModelArts

给子账号配置开发环境基本使用权限 - AI开发平台ModelArts

配置Lite Server存储 - AI开发平台ModelArts

自动学习简介 - AI开发平台ModelArts

JupyterLab常用功能介绍 - AI开发平台ModelArts

Standard资源管理 - AI开发平台ModelArts

ma-cli configure鉴权命令 - AI开发平台ModelArts

ModelArts Standard推理服务支持VPC直连的高速访问通道配置 - AI开发平台ModelArts

数据管理权限 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线