搜索_华为云

准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

sh # 环境部署脚本 |——src/ # 启动命令行封装脚本，在install.sh里面自动构建 |──llm_inference # 推理代码包 |──llm_tools

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.908） > 准备工作
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

准备代码本教程中用到的代码和权重文件如下表所示，请提前准备，并按要求在容器中创建工作目录。获取代码和权重文件表1 准备代码代码包名称代码说明下载地址 AscendCloud-3rdLLM-6.3.904-xxx.zip 说明：软件包名称中的xxx表示时间戳。包含了

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > Qwen系列模型基于Lite Server适配PyTorch NPU训练指导（6.3.904） > 准备工作
准备环境 - AI开发平台ModelArts
准备环境 - AI开发平台ModelArts

页面。图2 配置中心根据图3，按步骤进行：判断是否安装 kubectl、下载kubectl配置文件、在机器中安装和配置kubectl。图3 kubectl访问集群配置在节点机器中，输入命令，查看Kubernetes集群信息。若显示如图图4的内容，则配置成功。 kubectl

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909） > 准备工作
创建可视化作业 - AI开发平台ModelArts

is is a visualization job”，OBS路径为“/obs/name/”的可视化作业为例。 POST https://endpoint/v1/{project_id}/visualization-jobs { "job_name": "visualization-job"

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 可视化作业
准备环境 - AI开发平台ModelArts
准备环境 - AI开发平台ModelArts

页面。图2 配置中心根据图3，按步骤进行：判断是否安装 kubectl、下载kubectl配置文件、在机器中安装和配置kubectl。图3 kubectl访问集群配置在节点机器中，输入命令，查看Kubernetes集群信息。如果显示如图4的内容，则配置成功。 kubectl

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910） > 准备工作
准备环境 - AI开发平台ModelArts
准备环境 - AI开发平台ModelArts

页面。图2 配置中心根据图3，按步骤进行：判断是否安装 kubectl、下载kubectl配置文件、在机器中安装和配置kubectl。图3 kubectl访问集群配置在节点机器中，输入命令，查看Kubernetes集群信息。如果显示如图图4的内容，则配置成功。 kubectl

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911） > 准备工作
MA-Advisor性能调优建议工具使用指导 - AI开发平台ModelArts

在过往性能调优场景中，如果性能profiling数据在OBS上，通常需要将TB或者GB级别的profiling数据下载至本地后才能使用msprof-analyze进行分析，大量数据的下载耗时以及对本地大规格存储盘的要求容易导致分析受阻。为了能自动串联高性能挂载OBS至ModelArts环境和mspr

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导 > PyTorch迁移性能调优
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

month...' } 上传数据集至OBS 准备数据集，例如根据Alpaca数据部分给出的预训练数据集、SFT全参微调训练、LoRA微调训练数据集下载链接下载数据集。在创建OBS桶创建的桶下创建文件夹用以存放数据，例如在桶standard-lla

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.905） > 准备工作
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

sh # 环境部署脚本 |——src/ # 启动命令行封装脚本，在install.sh里面自动构建 |──llm_inference # 推理代码包 |──llm_tools

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.909） > 准备工作
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

载权限，请联系您所在企业的华为方技术支持下载获取。修改代码将AscendSpeed代码包AscendCloud-LLM-xxx.zip在本地解压缩后。在上传代码前，需要对解压后的训练脚本代码进行修改。具体文件为：修改llm_train/AscendSpeed/scripts/dev_pipeline

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.910） > 准备工作
查询训练作业列表 - AI开发平台ModelArts

数据传输周期，默认为30s。表37 Remote 参数参数类型描述 obs RemoteObs object 数据实际输出到OBS。表38 RemoteObs 参数参数类型描述 obs_url String 数据实际输出到OBS的路径。表39 AlgorithmEngine 参数参数类型

 帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

info # 在每个实例节点上运行此命令可以看到NPU卡状态 npu-smi info -l | grep Total # 在每个实例节点上运行此命令可以看到总卡数如出现错误，可能是机器上的NPU设备没有正常安装，或者NPU镜像被其他容器

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909） > 准备工作
查询数据处理任务的版本详情 - AI开发平台ModelArts

path String 工作路径。可选值如下：如果type是OBS，source为OBS路径。如果type是DATASET，source为数据集ID。 type String 工作路径的类型。可选值如下： OBS：OBS路径 DATASET：数据集 version_id String

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
查询可视化作业列表 - AI开发平台ModelArts

job_count_limit Integer 用户还可以创建可视化作业的数量。 jobs jobs结构数组可视化作业的属性列表，具体请参见表4。 quotas Integer 可视化作业的运行数量上限。表4 jobs属性列表参数参数类型说明 job_name String 可视化作业的名称。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 可视化作业
测试用户权限 - AI开发平台ModelArts

验证DEW权限。在左上角的服务列表中，选择DEW服务，进入DEW管理控制台。在DEW管理控制台，在“密钥对管理”-“私有密钥对”中单击“创建密钥对”，如果能正常打开页面，表示当前用户具备DEW的操作权限。验证OBS权限。在左上角的服务列表中，选择OBS服务，进入OBS管理控制台。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 基本配置 > 权限配置
手动部署推理服务 - AI开发平台ModelArts

${container_name}：容器名称，进入容器时会用到，此处可以自己定义一个容器名称。 {image_id} 为docker镜像的ID，在宿主机上可通过docker images查询得到。步骤五：在每个节点进入容器并启动推理服务进入容器。 docker exec -it -u root ${container-name}

帮助中心 > AI开发平台ModelArts > 最佳实践 > DeepSeek系列模型推理应用 > DeepSeek模型基于ModelArts Lite Server适配MindIE推理部署指导 > 部署推理服务
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

sh # 环境部署脚本 |——src/ # 启动命令行封装脚本，在install.sh里面自动构建 |──llm_inference # 推理代码包 |──llm_tools

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.909） > 准备工作
基于MindSpore Lite的模型转换 - AI开发平台ModelArts

主要通过MindSpore Lite（简称MSLite）进行模型的转换，进一步通过MindSpore Runtime支持昇腾后端的能力来将推理业务运行到昇腾设备上。模型准备 MindSpore Lite提供的模型convertor工具可以支持主流的模型格式到MindIR的格式转换，用户需要导出对应的模型文件，推荐导出为ONNX格式。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导 > 模型适配
使用DCGM监控Lite Server资源 - AI开发平台ModelArts

grafana/grafana-oss 在BMS页面打开Grafana所在节点的安全组配置，添加入方向规则，允许外部访问3000、9090端口：在浏览器地址栏输入xx.xx.xx.xx:3000，登录Grafana，默认账号密码为：admin/admin。在配置管理页面，添加数据源，类型选择Prometheus。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源管理 > 监控Lite Server资源
ModelArts Standard使用流程 - AI开发平台ModelArts

作流运行方式。具体请参见什么是Workflow。 Standard的开发环境Notebook提供了云上JupyterLab环境和本地IDE插件，方便用户编写训练推理代码，并使用云上资源进行代码调试。具体请参见Notebook使用场景。 Standard的模型训练功能提供了界面化的

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard）

总条数： 1461

上一页
1
...
65
66
67
...
74
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

准备代码 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

准备环境 - AI开发平台ModelArts

创建可视化作业 - AI开发平台ModelArts

准备环境 - AI开发平台ModelArts

准备环境 - AI开发平台ModelArts

MA-Advisor性能调优建议工具使用指导 - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

查询训练作业列表 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

查询数据处理任务的版本详情 - AI开发平台ModelArts

查询可视化作业列表 - AI开发平台ModelArts

测试用户权限 - AI开发平台ModelArts

手动部署推理服务 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

基于MindSpore Lite的模型转换 - AI开发平台ModelArts

使用DCGM监控Lite Server资源 - AI开发平台ModelArts

ModelArts Standard使用流程 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线