搜索_华为云

ma-cli dli-job提交DLI Spark作业支持的命令 - AI开发平台ModelArts

re”参数配合使用，指定作业运行使用自定义的Spark镜像。 -obs / --obs-bucket String 否保存Spark作业的obs桶，需要保存作业时配置该参数。同时也可作为提交本地文件到resource的中转站。 -sv/ --spark-version String

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > ModelArts CLI命令参考
分离部署推理服务 - AI开发平台ModelArts

`gen`模式表示生成rank_table文件，`merge`模式表示合并global rank_table文件。 --save-dir：保存生成的rank_table文件的根目录，默认为当前目录。 --api-server：仅在`gen`模式有效，可选输入，当存在该输入时，表示

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.908） > 部署推理服务
将AI Gallery中的模型部署为AI应用 - AI开发平台ModelArts

在“所在区”选择计算规格所在的区域。默认显示全部区域的计算规格。选择计算规格不可用的资源会置灰。右侧“配置信息”区域会显示计算规格的详细数据，AI Gallery会基于资产和资源情况分析该任务是否支持设置“商品数量”，用户可以基于业务需要选择任务所需的资源卡数。在“运行时长控制”选择是否指定运行时长。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery中的AI应用
使用前必读 - AI开发平台ModelArts

不同地区创建云资源，可以将应用程序设计的更接近特定客户的要求，或满足不同地区的法律或其他要求。可用区一个可用区（AZ）是一个或多个物理数据中心的集合，有独立的风火水电，AZ内逻辑上再将计算、网络、存储等资源划分成多个集群。一个Region中的多个AZ间通过高速光纤相连，以满足用户跨AZ构建高可用性系统的需求。

帮助中心 > AI开发平台ModelArts > API参考
修复Standard专属资源池故障节点 - AI开发平台ModelArts

修复Standard专属资源池故障节点 Standard专属资源池支持对故障节点进行修复操作，目前提供了替换节点、高可用冗余节点、重置节点和重启节点等方式。华为云技术支持在故障定位和性能诊断时，部分运维操作需要用户授权才可进行，本章节同时也介绍了如何进行授权操作。故障节点处理方式

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理 > 管理Standard专属资源池
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

之间的float，实际使用的显存是系统读取的最大显存*gpu-memory-utilization。 --max-model-len：最大数据输入+输出长度，不能超过模型配置文件config.json里面定义的“max_position_embeddings”和“seq_leng

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905）
使用自定义引擎在ModelArts Standard创建模型 - AI开发平台ModelArts

自定义引擎的规范可以在安装有docker的本地机器上通过以下步骤提前验证：将自定义引擎镜像下载至本地机器，假设镜像名为custom_engine:v1。将模型包文件夹复制到本地机器，假设模型包文件夹名字为model。在模型包文件夹的同级目录下验证如下命令拉起服务： docker run --user 1000:100

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
PD分离部署使用说明 - AI开发平台ModelArts

rge。gen模式表示生成rank_table文件，merge模式表示合并global rank_table文件。 --save-dir：保存生成的rank_table文件的根目录，默认为当前目录。 --api-server：仅在gen模式有效，可选输入，当存在该输入时，表示分离

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用 > 分离部署
Standard资源池功能介绍 - AI开发平台ModelArts

运行的作业可以访问打通网络中的存储和资源。例如，在创建训练作业时选择打通了网络的专属资源池，训练作业创建成功后，支持在训练时访问SFS中的数据。专属资源池支持自定义物理节点运行环境相关的能力，例如GPU/Ascend驱动的自助升级，而公共资源池暂不支持。专属资源池使用说明如

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

source /etc/profile # 使刚才配置生效创建buildkitd的启动服务。其中都是buildkitd.service的内容。复制以下全部命令并运行即可。 cat <<EOF > /usr/lib/systemd/system/buildkitd.service [Unit]

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909） > 准备工作
自定义引擎创建模型规范 - AI开发平台ModelArts

自定义引擎的规范可以在安装有docker的本地机器上通过以下步骤提前验证：将自定义引擎镜像下载至本地机器，假设镜像名为custom_engine:v1。将模型包文件夹复制到本地机器，假设模型包文件夹名字为model。在模型包文件夹的同级目录下验证如下命令拉起服务： docker run --user 1000:100

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型规范参考
管理Lite Cluster资源池 - AI开发平台ModelArts

是一种应用性能调优手段，在大部分场景下可以提升应用性能。但是清除缓存也可能会导致容器启动失败或系统性能暂时下降（因为系统需要重新从磁盘加载数据到内存中）。关闭表示不启用缓存清理功能。大页内存：开启表示配置使用透明大页功能。大页内存是一种内存管理机制，可以通过增大内存页的大小来提

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理
查询资源规格列表 - AI开发平台ModelArts

object GPU信息。 npu npu object NPU信息。 dataVolume Array of dataVolume objects 数据盘列表。 billingModes Array of integers 资源规格支持的计费模式。可选值如下： 0：按需计费 1：包周期计费

 帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
查询Notebook支持的可切换规格列表 - AI开发平台ModelArts

参数类型描述 current Integer 当前页数。 data Array of NotebookFlavor objects 分页数据。 flavors Array of NotebookFlavor objects 支持切换的规格列表。 pages Integer 总的页数。

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
如何在ModelArts的Notebook中上传下载OBS文件？ - AI开发平台ModelArts

持跨站点访问OBS桶。具体请参见查看OBS桶与ModelArts是否在同一个区域。请确认操作Notebook的账号有权限读取OBS桶中的数据。如没有权限，请参见在ModelArts的Notebook中，如何访问其他账号的OBS桶？。父主题： Standard Notebook

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

source /etc/profile # 使刚才配置生效创建buildkitd的启动服务。其中都是buildkitd.service的内容。复制以下全部命令并运行即可。 cat <<EOF > /usr/lib/systemd/system/buildkitd.service [Unit]

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910） > 准备工作
使用DCGM监控Lite Server资源 - AI开发平台ModelArts

口：在浏览器地址栏输入xx.xx.xx.xx:3000，登录Grafana，默认账号密码为：admin/admin。在配置管理页面，添加数据源，类型选择Prometheus。备注：xx.xx.xx.xx为Grafana的所在宿主机的IP地址图1 Prometheus 在HT

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源管理 > 监控Lite Server资源
在Notebook中通过Dockerfile从0制作自定义镜像 - AI开发平台ModelArts

Console上注册镜像登录ModelArts控制台，在左侧导航栏选择“镜像管理”，进入镜像管理页面。单击“注册镜像”。请将完整的SWR地址复制到这里即可，或单击可直接从SWR选择自有镜像进行注册。 “架构”和“类型”根据实际情况选择，与镜像源保持一致。创建Notebook并使用

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于创建Notebook
在Lite Cluster资源池上使用Snt9B完成推理任务 - AI开发平台ModelArts

测试该在线服务的功能。图1 任务示意图操作步骤拉取镜像。本测试镜像为bert_pretrain_mindspore:v1，已经把测试数据和代码打进镜像中。 docker pull swr.cn-southwest-2.myhuaweicloud.com/os-public-

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源使用
查看ModelArts模型事件 - AI开发平台ModelArts

- 异常模型导入失败。 Failed to import the model. 模型导入失败情况较多，请参考FAQ定位和处理。异常复制模型文件失败，请检查OBS权限是否正常。 Failed to copy model file due to obs exception. Please

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理ModelArts模型

总条数： 1618

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

ma-cli dli-job提交DLI Spark作业支持的命令 - AI开发平台ModelArts

分离部署推理服务 - AI开发平台ModelArts

将AI Gallery中的模型部署为AI应用 - AI开发平台ModelArts

使用前必读 - AI开发平台ModelArts

修复Standard专属资源池故障节点 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

使用自定义引擎在ModelArts Standard创建模型 - AI开发平台ModelArts

PD分离部署使用说明 - AI开发平台ModelArts

Standard资源池功能介绍 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

自定义引擎创建模型规范 - AI开发平台ModelArts

管理Lite Cluster资源池 - AI开发平台ModelArts

查询资源规格列表 - AI开发平台ModelArts

查询Notebook支持的可切换规格列表 - AI开发平台ModelArts

如何在ModelArts的Notebook中上传下载OBS文件？ - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

使用DCGM监控Lite Server资源 - AI开发平台ModelArts

在Notebook中通过Dockerfile从0制作自定义镜像 - AI开发平台ModelArts

在Lite Cluster资源池上使用Snt9B完成推理任务 - AI开发平台ModelArts

查看ModelArts模型事件 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线