搜索_华为云

ECS中构建新镜像 - AI开发平台ModelArts

44.2 执行以下命令制作训练镜像。安装过程需要连接互联网git clone，请确保ECS可以访问公网 docker build -t <镜像名称>:<版本名称> . 如果无法访问公网，则可以配置代理，增加`--build-arg`参数指定代理地址，可访问公网。 docker build

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.910） > 准备工作 > 准备镜像
Ascend-vLLM介绍 - AI开发平台ModelArts

言处理、图像生成和语音识别等。 Ascend-vLLM的主要特点易用性：Ascend-vLLM简化了在大模型上的部署和推理过程，使开发者可以更轻松地使用它。易开发性：提供了友好的开发和调试环境，便于模型的调整和优化。高性能：通过自研特性和针对NPU的优化，如PD分离、前后处

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912）
VS Code手动连接Notebook - AI开发平台ModelArts

端插件时不稳定，需尝试多次。 Step4 云上环境依赖库安装在进入容器环境后，可以使用不同的虚拟环境，例如TensorFlow、PyTorch等，但是实际开发中，通常还需要安装其他依赖包，此时可以通过Terminal连接到环境里操作。在VS Code环境中，执行Ctrl+Shift+P。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过VS Code远程使用Notebook实例
ECS中构建新镜像 - AI开发平台ModelArts

44.2 执行以下命令制作训练镜像。安装过程需要连接互联网git clone，请确保ECS可以访问公网 docker build -t <镜像名称>:<版本名称> . 如果无法访问公网，则可以配置代理，增加`--build-arg`参数指定代理地址，可访问公网。 docker build

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.909） > 准备工作 > 准备镜像
在ModelArts镜像管理注册镜像报错ModelArts.6787怎么处理？ - AI开发平台ModelArts

而主账号没有给子账号赋SWR权限，子账号从SWR Console界面看不到该镜像，需要主账号给子账号在SWR侧赋予SWR权限，使得子账号可以看到该SWR镜像地址，否则该镜像子账号不可使用。该镜像不属于该租户（包括主账号和子账号），是其他人共享的public镜像，而这个镜像又被

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard镜像相关
扩缩容模型服务实例数 - AI开发平台ModelArts

扩缩容”，进入扩缩容页面。在扩缩容页面，根据业务需要增删模型服务的实例数，配置完成后，单击“确认”提交扩缩容任务。在我的服务列表，单击服务名称，进入服务详情页，可以查看修改后的实例数是否生效。父主题：管理我的服务

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio） > 管理我的服务
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

# 推理工具代码上传至OBS 将llm_train文件上传至OBS中。结合准备数据、准备权重、准备代码，将数据集、原始权重、代码文件都上传至OBS后，OBS桶的目录结构如下。 <bucket_name> |──llm_train

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.909） > 准备工作
工具介绍及准备工作 - AI开发平台ModelArts

和训练精度测试脚本。代码目录如下: benchmark ├── config # 默认的配置，使用前根据实际情况修改数据集路径dataset_dir、权重路径model_name_or_path ├── deepspeed

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.910） > 训练benchmark工具
修改模型服务QPS - AI开发平台ModelArts

选择模型服务，单击操作列的“更多 > 设置QPS”，在弹窗中修改数值，单击“提交”启动修改任务。图1 修改QPS 在我的服务列表，单击服务名称，进入服务详情页，可以查看修改后的QPS是否生效。父主题：管理我的服务

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio） > 管理我的服务
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

d-3rdLLM-905-xxx.zip在本地解压缩后，将llm_train文件上传至OBS中。结合准备数据、准备权重、准备代码，将数据集、原始权重、代码文件都上传至OBS后，OBS桶的目录结构如下。 <bucket_name> |──llm_train

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.905） > 准备工作
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

# 推理工具代码上传至OBS 将llm_train文件上传至OBS中。结合准备数据、准备权重、准备代码，将数据集、原始权重、代码文件都上传至OBS后，OBS桶的目录结构如下。 <bucket_name> |──llm_train

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.910） > 准备工作
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

# 推理工具代码上传至OBS 将llm_train文件上传至OBS中。结合准备数据、准备权重、准备代码，将数据集、原始权重、代码文件都上传至OBS后，OBS桶的目录结构如下。 <bucket_name> |──llm_train

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.911） > 准备工作
日志提示“RuntimeError: connect() timed out” - AI开发平台ModelArts

distributed.init_process_group()导致超时。处理方法如果是多个节点复制不同步，并且没有barrier的话导致的超时，可以在复制数据之前，先进行torch.distributed.init_process_group()，然后再根据local_rank()==0去复制数据，之后再调用torch

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > GPU相关问题
使用基础镜像 - AI开发平台ModelArts

/scripts/obs_pipeline.sh 使用基础镜像的方法，需要确认训练作业的资源池是否联通公网，否则执行 install.sh 文件时下载代码会失败。因此可以选择配置网络或使用ECS中构建新镜像的方法。若要对ChatCLMv3、GLMv4系列模型进行训练时，需要修改 install.sh 中的

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.910） > 准备工作 > 准备镜像
使用基础镜像 - AI开发平台ModelArts

/scripts/obs_pipeline.sh 使用基础镜像的方法，需要确认训练作业的资源池是否联通公网，否则执行 install.sh 文件时下载代码会失败。因此可以选择配置网络或使用ECS中构建新镜像的方法。若要对ChatCLMv3、GLMv4系列模型进行训练时，需要修改 install.sh 中的

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.911） > 准备工作 > 准备镜像
启动推理服务 - AI开发平台ModelArts

tarted/quickstart.html。推荐通过OpenAI服务的API接口启动推理，单机单卡和单机多卡场景下的具体操作命令如下，可以根据参数说明修改配置。 python -m vllm.entrypoints.openai.api_server --model ${container_model_path}

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理服务部署
Step3 为用户配置ModelArts的委托访问授权 - AI开发平台ModelArts

管理等。一般用户选择此项即可。自定义：如果对用户有更精细化的权限管理需求，可使用自定义模式灵活按需配置ModelArts创建的委托权限。可以根据实际需在权限列表中勾选要配置的权限。勾选“我已经详细阅读并同意《ModelArts服务声明》”，单击“创建”，完成委托授权配置。父主题：

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践 > 配置ModelArts基本使用权限
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

<模型下载路径> 方法三：使用专用多线程下载器 hfd：hfd 是本站开发的 huggingface 专用下载工具，基于成熟工具 git+aria2，可以做到稳定下载不断线。方法四：使用Git clone，官方提供了git clone repo_url 的方式下载，但是不支持断点续传，并且clone会下载历史版本占用磁盘空间。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.909） > 准备工作
日志提示"No CUDA-capable device is detected" - AI开发平台ModelArts

统默认里面自带的。如果必须指定卡ID，需要注意1/2/4规格下，指定的卡ID与实际分配的卡ID不匹配的情况。如果上述方法还出现了错误，可以去notebook里面调试打印CUDA_VISIBLE_DEVICES变量，或者用以下代码测试，查看结果是否返回的是True。 import

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > GPU相关问题
附录：config.json文件 - AI开发平台ModelArts

size。config.json文件中默认是50，并发请求数量超出设置，推理请求会被拒绝。用户可以根据实际修改。 maxSeqLen：输入长度+输出长度的最大值。config.json文件中默认是6k，用户可以根据自己的推理场景设置。 httpsEnabled：取值需要修改为false。 m

帮助中心 > AI开发平台ModelArts > 最佳实践 > DeepSeek系列模型推理 > DeepSeek模型基于ModelArts Lite Server适配MindIE推理部署指导

总条数： 1705

上一页
1
...
77
78
79
...
86
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

ECS中构建新镜像 - AI开发平台ModelArts

Ascend-vLLM介绍 - AI开发平台ModelArts

VS Code手动连接Notebook - AI开发平台ModelArts

ECS中构建新镜像 - AI开发平台ModelArts

在ModelArts镜像管理注册镜像报错ModelArts.6787怎么处理？ - AI开发平台ModelArts

扩缩容模型服务实例数 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

工具介绍及准备工作 - AI开发平台ModelArts

修改模型服务QPS - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

日志提示“RuntimeError: connect() timed out” - AI开发平台ModelArts

使用基础镜像 - AI开发平台ModelArts

使用基础镜像 - AI开发平台ModelArts

启动推理服务 - AI开发平台ModelArts

Step3 为用户配置ModelArts的委托访问授权 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

日志提示"No CUDA-capable device is detected" - AI开发平台ModelArts

附录：config.json文件 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线