搜索_华为云

ECS中构建新镜像 - AI开发平台ModelArts

编辑llm_train/AscendSpeed中的Dockerfile文件第一行镜像地址，修改为本文档中的基础镜像地址。 FROM {image_url} （选填）编辑llm_train/AscendSpeed中的Dockerfile文件，修改git命令，填写自己的git账户信息。 git config --global

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.911） > 准备工作 > 准备镜像
在ModelArts中调整模型后，部署新版本模型能否保持原API接口不变？ - AI开发平台ModelArts

登录ModelArts管理控制台，在左侧导航栏中选择“部署上线 > 在线服务”，默认进入“在线服务”列表。在部署完成的目标服务中，单击操作列的“修改”，进入“修改服务”页面。在选择模型及配置中，单击“增加模型版本进行灰度发布”添加新版本。图1 灰度发布您可以设置两个版本的流量占比，服务调

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

配置需要的NPU卡。 export ASCEND_RT_VISIBLE_DEVICES=0,1,2,3 0,1,2,3修改为需要使用的卡，如需使用全部8张卡，修改为0,1,2,3,4,5,6,7。配置PYTHONPATH。 export PYTHONPATH=$PYTHONPATH:${vllm_path}

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905）
训练的数据集预处理说明 - AI开发平台ModelArts

可用户自定义执行数据处理脚本修改参数说明如果用户要自定义数据处理脚本并且单独执行，同样以 llama2 为例。方法一：用户可打开scripts/llama2/1_preprocess_data.sh脚本，将执行的python命令复制下来，修改环境变量的值，进入到 /home

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.908） > 训练脚本说明参考
训练的数据集预处理说明 - AI开发平台ModelArts

即可用户自定义执行数据处理脚本修改参数说明如果用户要自定义数据处理脚本并且单独执行，同样以llama2为例。方法一：用户可打开scripts/llama2/1_preprocess_data.sh脚本，将执行的python命令复制下来，修改环境变量的值。在Notebook进入到

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.909） > 训练脚本说明
训练的数据集预处理说明 - AI开发平台ModelArts

即可用户自定义执行数据处理脚本修改参数说明如果用户要自定义数据处理脚本并且单独执行，同样以llama2为例。方法一：用户可打开scripts/llama2/1_preprocess_data.sh脚本，将执行的python命令复制下来，修改环境变量的值。在Notebook进入到

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.910） > 训练脚本说明
通过自定义镜像创建模型失败 - AI开发平台ModelArts

图1 权限管理图2 查看权限详情和去IAM修改委托权限图3 给委托添加授权将镜像设置成私有镜像登录容器镜像服务（SWR），左侧导航栏选择“我的镜像”，查看镜像详情，单击右上角“编辑”按钮，把镜像类型修改为“私有”。图4 修改镜像类型为私有父主题：模型管理

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 模型管理
创建生产训练作业 - AI开发平台ModelArts

默认用户权限可选择优先级1和2，配置了“设置作业为高优先级权限”的用户可选择优先级1~3。如果训练作业长时间处于“等待中”的状态，则可以通过修改作业优先级来减少排队时长，请参见修改训练作业优先级。 SFS Turbo 当ModelArts和SFS Turbo间网络直通时，训练作业支持挂载多个SFS

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型
准备镜像环境 - AI开发平台ModelArts

-LLM/llm_train/AscendFactory 编辑llm_train/AscendFactory中的Dockerfile文件，修改git命令，填写自己的git账户信息。 git config --global user.email "you@example.com" &&

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.912） > 准备工作
训练的数据集预处理说明 - AI开发平台ModelArts

可用户自定义执行数据处理脚本修改参数说明如果用户要自定义数据处理脚本并且单独执行，同样以 llama2 为例。方法一：用户可打开scripts/llama2/1_preprocess_data.sh脚本，将执行的python命令复制下来，修改环境变量的值，进入到 /home

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.910） > 训练脚本说明参考
训练的数据集预处理说明 - AI开发平台ModelArts

可用户自定义执行数据处理脚本修改参数说明如果用户要自定义数据处理脚本并且单独执行，同样以 llama2 为例。方法一：用户可打开scripts/llama2/1_preprocess_data.sh脚本，将执行的python命令复制下来，修改环境变量的值，进入到 /home

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.909） > 训练脚本说明参考
重置节点后无法正常使用？ - AI开发平台ModelArts

解决方案二（默认全部使用volcano调度器）： CCE页面上配置中心修改默认调度器为kube-scheduler。删除maos-node-agent的pod（重启pod）。 CCE页面上删除节点上的污点A200008。 ModelArts上重置节点。 CCE页面上配置中心修改默认调度器为volcano。该方案

 帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Cluster
发布免费模型 - AI开发平台ModelArts

资产发布成功后，发布者可以进入详情页修改该资产的标题、封面图、描述等，让资产更吸引人。修改封面图和二级标题在发布的资产详情页面，单击右侧的“编辑”，选择上传新的封面图，为资产编辑独特的主副标题。编辑完成之后单击“保存”。封面图和二级标题内容自动同步，您可以直接在资产详情页查看修改结果。图1 修改封面图和二级标题

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（旧版） > 发布分享
创建网络 - AI开发平台ModelArts
创建网络 - AI开发平台ModelArts

切换到“网络”页签，单击“创建”，弹出“创建网络”页面。图1 网络列表在“创建网络”弹窗中填写网络信息。网络名称：创建网络时默认生成网络名称，也可自行修改。网段类型：可选“预置”和“自定义”。自定义网络目前支持网段范围：10.0.0.0/8~26、172.16.0.0/12~26、192.168

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 基本配置
在ECS中创建ma-user和ma-group - AI开发平台ModelArts

在ModelArts训练平台使用的自定义镜像时，默认用户为ma-user、默认用户组为ma-group。如果在训练时调用ECS中的文件，需要修改文件权限改为ma-user可读，否则会出现Permission denied错误，因此需要在ECS中提前创建好ma-user和ma-group。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 基本配置
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

在ascend_vllm目录下通过vLLM服务API接口启动服务，具体操作命令如下，API Server的命令相关参数说明如下，可以根据参数说明修改配置。 python -m vllm.entrypoints.api_server --model ${model_path} \ --max-num-seqs=256

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906）
查看日志和性能 - AI开发平台ModelArts

nk节点中；日志存放路径为：对应修改重要参数表格中output_dir参数值路径下的trainer_log.jsonl文件查看性能训练性能主要通过训练日志中的2个指标查看，吞吐量和loss收敛情况。吞吐量（tokens/s/p）：可通过修改重要参数表格中output_dir参数值路径下的trainer_log

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.912）
Lite Cluster资源管理介绍 - AI开发平台ModelArts

到资源池详情页，您可以在详情页进行下述操作。管理Lite Cluster资源池：ModelArts支持对资源池进行管理，包括续费、开通/修改自动续费、扩容、升级驱动等操作。管理Lite Cluster节点池：为帮助您更好地管理Kubernetes集群内的节点，ModelArt

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理
扩缩容Lite Cluster资源池 - AI开发平台ModelArts

分布。修改容器引擎空间大小。扩容资源池时，可以设置新建节点的容器引擎空间大小。可指定容器引擎空间大小和不限制空间大小。此操作会导致资源池内该规格下节点的dockerBaseSize不一致，可能会使得部分任务在不同节点的运行情况不一致，请谨慎操作。存量节点不支持修改容器引擎空间大小。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理
ascendfactory-cli方式启动（推荐） - AI开发平台ModelArts

|──llama_factory_accuracy_baseline.yaml # 精度基线配置修改样例如下，根据自己实际要求修改相应yaml文件： # 默认参数；根据自己实际要求修改 dataset_dir: /xxxx/benchmark/data/dataset dataset:

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.912） > 执行训练任务

总条数： 898

上一页
1
...
26
27
28
...
45
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

ECS中构建新镜像 - AI开发平台ModelArts

在ModelArts中调整模型后，部署新版本模型能否保持原API接口不变？ - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

训练的数据集预处理说明 - AI开发平台ModelArts

训练的数据集预处理说明 - AI开发平台ModelArts

训练的数据集预处理说明 - AI开发平台ModelArts

通过自定义镜像创建模型失败 - AI开发平台ModelArts

创建生产训练作业 - AI开发平台ModelArts

准备镜像环境 - AI开发平台ModelArts

训练的数据集预处理说明 - AI开发平台ModelArts

训练的数据集预处理说明 - AI开发平台ModelArts

重置节点后无法正常使用？ - AI开发平台ModelArts

发布免费模型 - AI开发平台ModelArts

创建网络 - AI开发平台ModelArts

在ECS中创建ma-user和ma-group - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

查看日志和性能 - AI开发平台ModelArts

Lite Cluster资源管理介绍 - AI开发平台ModelArts

扩缩容Lite Cluster资源池 - AI开发平台ModelArts

ascendfactory-cli方式启动（推荐） - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线