搜索_华为云

ModelArts Standard资源监控概述 - AI开发平台ModelArts

方式二：通过AOM查看所有监控指标 ModelArts Standard上报的所有监控指标都保存在AOM中，用户可以通过AOM服务提供的指标消费和使用的能力来进行指标消费。设置指标阈值告警、告警上报等，都可以直接在AOM控制台查看。具体参见通过AOM控制台查看ModelArts所有监控指标。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源监控
推理场景介绍 - AI开发平台ModelArts

https://huggingface.co/deepseek-ai/DeepSeek-V2-Lite 各模型支持的卡数请参见附录：基于vLLM不同模型推理支持最小卡数和最大序列说明章节。父主题：主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909）
审计与日志 - AI开发平台ModelArts

后，系统会记录ModelArts的相关操作，且控制台保存最近7天的操作记录。本节介绍如何在云审计服务管理控制台查看最近7天的操作记录。对接云审计服务的配置方法请参见查看审计日志章节。父主题：安全

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
发布数据集到AI Gallery - AI开发平台ModelArts

过。可见范围 “所有用户可见”：表示公开资产，所有用户都可以查看该资产。 “指定用户可见”：输入账号名、账号ID或用户昵称搜索并选择用户，使其可见该资产。可用范围选择是否启用“申请用户可用”。勾选启用：当用户要使用该数据集时需要提交申请，只有数据集所有者同意申请后，才能使用数据集。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery数据集
模型NPU卡数、梯度累积值取值表 - AI开发平台ModelArts

& 4*Ascend表示单机4卡，以此类推。表1 NPU卡数、加速框架、梯度配置取值表模型 Template 模型参数量训练策略类型序列长度cutoff_len 梯度累积值优化工具(Deepspeed) 规格与节点数 llama2 llama2 7B lora 4096/8192

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.910） > 训练脚本说明
注册自定义镜像 - AI开发平台ModelArts

镜像可见度，默认值PRIVATE。枚举值： PRIVATE：私有镜像。 PUBLIC: 所有用户可以根据ImageId来进行只读使用。 workspace_id 否 String 工作空间ID。获取方法请参见查询工作空间列表。未创建工作空间时默认值为“0”，存在创建并使用的工作空间，以实际取值为准。

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
训练启动脚本说明和参数配置 - AI开发平台ModelArts

中的1*节点 & 4*Ascend表示单机4卡，以此类推。表1 不同模型推荐的参数与NPU卡数设置序号支持模型支持模型参数量文本序列长度并行参数设置规格与节点数 1 llama2 llama2-7b SEQ_LEN=4096 TP(tensor model parallel

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.908） > 训练脚本说明
在云监控平台查看在线服务性能指标 - AI开发平台ModelArts

ModelArts”。查看监控图表。查看在线服务监控图表：单击目标在线服务“操作”列的“查看监控指标”。查看模型负载监控图标：单击目标在线服务左侧的，在下拉列表中选择模型负载“操作”列的“查看监控指标”。在监控区域，您可以通过选择时长，查看对应时间的监控数据。当前支持查看近1小时、近

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理同步在线服务
查找Workflow工作流 - AI开发平台ModelArts

查找Workflow工作流查找Workflow 在Workflow列表页，您可以通过搜索框，根据工作流的属性类型快速搜索过滤到相应的工作流，可节省您的时间。登录ModelArts管理控制台，在左侧导航栏选择“开发空间>Workflow”，进入Workflow总览页面。在工作

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 管理Workflow
训练预测分析模型 - AI开发平台ModelArts

recall：召回率被用户标注为某个分类的所有样本中，模型正确预测为该分类的样本比率，反映模型对正样本的识别能力。 precision：精确率被模型预测为某个分类的所有样本中，模型正确预测的样本比率，反映模型对负样本的区分能力。 accuracy：准确率所有样本中，模型正确预测的样本比率，反映模型对样本整体的识别能力。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用自动学习实现预测分析
包年/包月转按需 - AI开发平台ModelArts

在弹出的“调整到期策略”页面，确认无误后单击“确定”。图1 调整到期策略进入“费用中心 > 续费管理”页面。自定义查询条件。可在“到期转按需项”页签查询已经设置到期转按需的资源。可对“手动续费项”、“自动续费项”、“到期不续费项”页签的资源设置到期转按需的操作。设置包年/包月资源到期后转按需。

帮助中心 > AI开发平台ModelArts > 计费说明 > 变更计费模式
使用前必读 - AI开发平台ModelArts

s SDK参考。终端节点终端节点（Endpoint）即调用API的请求地址，不同服务不同区域的终端节点不同，您可以从地区和终端节点中查询所有服务的终端节点。约束与限制您能创建的ModelArts资源的数量与配额有关系，具体请参见服务配额。更详细的限制请参见具体API的说明。

帮助中心 > AI开发平台ModelArts > API参考
ModelArts中常用概念 - AI开发平台ModelArts

I引擎解耦，在ModelArts支持的所有AI引擎(TensorFlow、MXNet、PyTorch、MindSpore等)下均可以使用。 MoXing Framework模块提供了OBS中常见的数据文件操作，如读写、列举、创建文件夹、查询、移动、复制、删除等。在ModelArts

帮助中心 > AI开发平台ModelArts > 产品介绍 > AI开发基础知识
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

https://huggingface.co/deepseek-ai/DeepSeek-V2-Lite 各模型支持的卡数请参见附录：基于vLLM不同模型推理支持最小卡数和最大序列说明章节。操作流程图1 操作流程图表2 操作任务流程说明阶段任务说明准备工作准备资源本教程案例是基于ModelArts

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909）
发布数据 - AI开发平台ModelArts
发布数据 - AI开发平台ModelArts

单击许可证类型后面的可以查看许可证详情。谁可以看设置此数据集的公开权限。可选值有： “公开”：表示所有使用AI Gallery的用户都可以查看且使用该资产。 “指定用户”：表示仅特定用户可以查看及使用该资产。 “仅自己可见”：表示只有当前账号可以查看并使用该资产。发布来源为

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（旧版） > 发布分享
停止Notebook实例 - AI开发平台ModelArts

Identifier，简称UUID）。预置镜像的ID参考查询支持的镜像列表获取。 name String 镜像名称，长度限制512个字符，支持小写字母、数字、中划线、下划线和点。 namespace String 镜像所属组织，可以在SWR控制台“组织管理”创建和查看。 origin String 指

 帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
GPU A系列裸金属服务器节点内如何进行NVLINK带宽性能测试方法？ - AI开发平台ModelArts

Pytorch2.0。 GPU A系列裸金属服务器，单台服务器GPU间是走NVLINK，可以通过相关命令查询GPU拓扑模式： nvidia-smi topo -m 图1 查询GPU拓扑模式操作步骤使用以下脚本测得GPU服务器内NVLINK带宽性能。 import torch import

帮助中心 > AI开发平台ModelArts > 常见问题 > Lite Server
启动Notebook实例 - AI开发平台ModelArts

Identifier，简称UUID）。预置镜像的ID参考查询支持的镜像列表获取。 name String 镜像名称，长度限制512个字符，支持小写字母、数字、中划线、下划线和点。 namespace String 镜像所属组织，可以在SWR控制台“组织管理”创建和查看。 origin String 指

 帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
分离部署推理服务 - AI开发平台ModelArts

Str 请求输入的问题。 max_tokens 否 16 Int 每个输出序列要生成的最大tokens数量。 top_k 否 -1 Int 控制要考虑的前几个tokens的数量的整数。设置为-1表示考虑所有tokens。适当降低该值可以减少采样时间。 top_p 否 1.0 Float

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.908） > 部署推理服务
分离部署推理服务 - AI开发平台ModelArts

Str 请求输入的问题。 max_tokens 否 16 Int 每个输出序列要生成的最大tokens数量。 top_k 否 -1 Int 控制要考虑的前几个tokens的数量的整数。设置为-1表示考虑所有tokens。适当降低该值可以减少采样时间。 top_p 否 1.0 Float

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.909） > 部署推理服务

总条数： 1409

上一页
1
...
19
20
21
...
71
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

ModelArts Standard资源监控概述 - AI开发平台ModelArts

推理场景介绍 - AI开发平台ModelArts

审计与日志 - AI开发平台ModelArts

发布数据集到AI Gallery - AI开发平台ModelArts

模型NPU卡数、梯度累积值取值表 - AI开发平台ModelArts

注册自定义镜像 - AI开发平台ModelArts

训练启动脚本说明和参数配置 - AI开发平台ModelArts

在云监控平台查看在线服务性能指标 - AI开发平台ModelArts

查找Workflow工作流 - AI开发平台ModelArts

训练预测分析模型 - AI开发平台ModelArts

包年/包月转按需 - AI开发平台ModelArts

使用前必读 - AI开发平台ModelArts

ModelArts中常用概念 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

发布数据 - AI开发平台ModelArts

停止Notebook实例 - AI开发平台ModelArts

GPU A系列裸金属服务器节点内如何进行NVLINK带宽性能测试方法？ - AI开发平台ModelArts

启动Notebook实例 - AI开发平台ModelArts

分离部署推理服务 - AI开发平台ModelArts

分离部署推理服务 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线