搜索_华为云

发布ModelArts模型 - AI开发平台ModelArts

Gallery”获取他人共享的内容，快速完成构建。在您完成模型的训练和导入之后，您可以将自己的模型分享至“AI Gallery”，进行知识共享。登录ModelArts管理控制台，在左侧导航栏中选择“模型管理”，进入模型列表页面。单击模型的“版本数量”，在展开的版本列表中，单击“操作”列的“发布”进入发布页面。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理ModelArts模型
在云监控平台查看在线服务性能指标 - AI开发平台ModelArts

只有“运行中”的在线服务，支持对接CES监控。前提条件：已创建ModelArts在线服务。已在云监控服务创建ModelArts监控服务。登录“云监控服务”控制台，在“自定义监控”页面，根据界面提示创建ModelArts监控服务。设置告警规则有多种方式。您可以根据实际应用场景，选择设置告警规则的方式。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理同步在线服务
AI Gallery简介 - AI开发平台ModelArts

AI Gallery的数据模块支持数据集的共享和下载。在AI Gallery的“数据”中，可以查找并下载满足业务需要的数据集。也可以将自己本地的数据集发布至AI Gallery中，共享给其他用户使用。 “资产集市 > 算法”：共享了算法。 AI Gallery的算法模块支持算法的共享和订阅。在AI

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（旧版）
语言模型推理性能测试 - AI开发平台ModelArts

评测动态性能脚本 ├── generate_dataset.py # 生成自定义数据集的脚本 ├── benchmark_utils.py # 工具函数集 ├── benchmark.py # 执行静态、动态性能评测脚本 ├── requirements.txt

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理服务性能评测
执行训练任务（历史版本） - AI开发平台ModelArts

D_CKPT_PATH则需选中存放已处理好数据集的目录文件夹。 “输入”和“输出”中的获取方式全部选择为：环境变量。 “输出”中的预下载至本地目标选择：下载，此时输出路径中的数据则会下载至OBS中。 Step3 配置环境变量单击“增加环境变量”，在增加的环境变量填写框中，按照表1表格中的配置进行填写。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.912） > 执行训练任务
从OBS中导入模型文件创建模型 - AI开发平台ModelArts

已完成训练的模型包，及其对应的推理代码和配置文件，且已上传至OBS目录中。确保您使用的OBS与ModelArts在同一区域。创建模型操作步骤登录ModelArts管理控制台，在左侧导航栏中选择“模型管理”，进入模型列表页面。单击左上角的“创建模型”，进入“创建模型”页面。在“创建模型”页面，填写相关参数。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型
infiniband驱动的安装 - AI开发平台ModelArts

finiband官方驱动，以使用infiniband网卡进行分布式通信，提升训练性能。infiniband驱动需要在制作镜像时安装。操作步骤下载MLNX_OFED_LINUX-4.3-1.0.1.0-ubuntu16.04-x86_64.tgz。进入地址，单击“Download”，选择“Archive

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > FAQ
修改批量服务配置 - AI开发平台ModelArts

支持，创建模型的自定义镜像需要满足创建模型的自定义镜像规范。从OBS中选择元模型不支持不支持方式一：通过服务管理页面修改服务信息登录ModelArts管理控制台，在左侧菜单栏中选择“模型部署”，进入目标服务类型管理页面。在服务列表中，单击目标服务操作列的“修改”，修改

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理批量推理作业
更新算法 - AI开发平台ModelArts
更新算法 - AI开发平台ModelArts

指定算法所属的ai项目，默认值为"default-ai-project"。ai项目已下线，无需关注。 user_name String 用户名称。 domain_id String 用户的domainID。 source String 算法来源类型。 api_version String

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
Lite Cluster使用流程 - AI开发平台ModelArts

等插件。完成Cluster资源池的购买后，您即可对资源进行配置，并将数据上传至存储云服务中。当您需要使用集群资源时，可以使用kubectl工具或k8s API来下发作业。此外，ModelArts还提供了扩缩容、驱动升级等功能，方便您对集群资源进行管理。图2 使用流程推荐您根据以下使用流程对Lite

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster使用前必读
创建算法 - AI开发平台ModelArts
创建算法 - AI开发平台ModelArts

指定算法所属的ai项目，默认值为"default-ai-project"。ai项目已下线，无需关注。 user_name String 用户名称。 domain_id String 用户的domainID。 source String 算法来源类型。 api_version String

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
预训练 - AI开发平台ModelArts
预训练 - AI开发平台ModelArts

NAL_TRAIN_DATA_PATH中则直接选中数据集文件。 “输入”和“输出”中的获取方式全部选择为：环境变量。 “输出”中的预下载至本地目标选择：下载，此时输出路径中的数据则会下载至OBS中。 Step3 配置环境变量单击“增加环境变量”，在增加的环境变量填写框中，按照表1表格中的配置进行填写。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.907）
同步Lite Server服务器状态 - AI开发平台ModelArts

Server为一台弹性裸金属服务器，当用户在云服务器页面修改了裸金属服务器状态后，您可通过“同步”功能，同步其状态至ModelArts。登录ModelArts管理控制台。在左侧导航栏中，选择“AI专属资源池 > 弹性节点 Server”，进入“节点”列表页面。在弹性节点Se

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源管理
训练启动脚本说明和参数配置 - AI开发平台ModelArts

、2_convert_mg_hf.sh中的具体python指令，并在Notebook环境中运行执行。本代码中有许多环境变量的设置，在下面的指导步骤中，会展开进行详细的解释。若用户希望自定义参数进行训练，可直接编辑对应模型的训练脚本，可编辑参数以及详细介绍如下。以llama2-13b预训练为例：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.905） > 训练脚本说明
LoRA微调训练 - AI开发平台ModelArts

NAL_TRAIN_DATA_PATH中则直接选中数据集文件。 “输入”和“输出”中的获取方式全部选择为：环境变量。 “输出”中的预下载至本地目标选择：下载，此时输出路径中的数据则会下载至OBS中。 Step3 配置环境变量单击“增加环境变量”，在增加的环境变量填写框中，按照表1表格中的配置进行填写。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.907）
准备数据（可选） - AI开发平台ModelArts

将下载的原始数据存放在{work_dir}/llm_train/LLaMAFactory/LLaMA-Factory/data目录下。具体步骤如下：进入到/home/ma-user/ws/llm_train/LLaMAFactory/LLaMA-Factory/data目录下。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.908） > 准备工作
安全边界 - AI开发平台ModelArts
安全边界 - AI开发平台ModelArts

部署上线部署服务时，需要注意为服务设置合适计算节点规格，防止服务因资源不足而过载或者资源过大而浪费。尽量避免在容器中监听其他端口，有本地内部需要访问的其他端口，监听在localhost上。避免通过环境变量传递敏感信息，需要通过加密组件进行加密后再通过环境变量配置。部署在线

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
SFT全参微调训练 - AI开发平台ModelArts

NAL_TRAIN_DATA_PATH中则直接选中数据集文件。 “输入”和“输出”中的获取方式全部选择为：环境变量。 “输出”中的预下载至本地目标选择：下载，此时输出路径中的数据则会下载至OBS中。 Step3 配置环境变量单击“增加环境变量”，在增加的环境变量填写框中，按照表1表格中的配置进行填写。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.907）
使用CES监控Lite Server资源 - AI开发平台ModelArts

ascend-dmi不可用请检查工具包ToolBox是否正常安装无法使用ascend-dmi进行性能分析 Snt9B Snt9C 安装CES Agent监控插件当前账户需要给CES授权委托，请参考创建用户并授权使用云监控服务。当前还不支持在CES界面直接一键安装监控，需要登录到服务器上执行以

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源管理 > 监控Lite Server资源
华为云CCE集群纳管GPU裸金属服务器由于CloudInit导致纳管失败的解决方案 - AI开发平台ModelArts

ser-data，所以CCE能纳管成功。处理方法制作镜像前，清理“/var/lib/cloud/”目录下的所有信息，请参考清理临时文件步骤对文件进行清理，然后再制作镜像。CCE重新纳管服务器A时，使用最新制作的镜像即可。父主题： Lite Server

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server

总条数： 1326

上一页
1
...
59
60
61
...
67
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

发布ModelArts模型 - AI开发平台ModelArts

在云监控平台查看在线服务性能指标 - AI开发平台ModelArts

AI Gallery简介 - AI开发平台ModelArts

语言模型推理性能测试 - AI开发平台ModelArts

执行训练任务（历史版本） - AI开发平台ModelArts

从OBS中导入模型文件创建模型 - AI开发平台ModelArts

infiniband驱动的安装 - AI开发平台ModelArts

修改批量服务配置 - AI开发平台ModelArts

更新算法 - AI开发平台ModelArts

Lite Cluster使用流程 - AI开发平台ModelArts

创建算法 - AI开发平台ModelArts

预训练 - AI开发平台ModelArts

同步Lite Server服务器状态 - AI开发平台ModelArts

训练启动脚本说明和参数配置 - AI开发平台ModelArts

LoRA微调训练 - AI开发平台ModelArts

准备数据（可选） - AI开发平台ModelArts

安全边界 - AI开发平台ModelArts

SFT全参微调训练 - AI开发平台ModelArts

使用CES监控Lite Server资源 - AI开发平台ModelArts

华为云CCE集群纳管GPU裸金属服务器由于CloudInit导致纳管失败的解决方案 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线