搜索_华为云

GPU服务器上配置Lite Server资源软件环境 - AI开发平台ModelArts

2a1 -j 8 编译时需要加上MPI=1的参数，否则无法进行多机之间的测试。 MPI路径版本需要匹配，可以通过“ls /usr/mpi/gcc/”查看openmpi的具体版本。 nccl-test测试。单机测试： /root/nccl-tests/build/all_reduce_perf

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源配置 > 配置Lite Server软件环境
托管数据集到AI Gallery - AI开发平台ModelArts

托管数据集到AI Gallery AI Gallery上每个资产的文件都会存储在线上的AI Gallery存储库（简称AI Gallery仓库）里面。每一个数据集实例视作一个资产仓库，数据集实例与资产仓库之间是一一对应的关系。例如，模型名称为“Test”，则AI Gallery仓

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery数据集
上传远端文件至JupyterLab - AI开发平台ModelArts

图3 输入有效的远端文件URL 图4 远端文件上传成功异常处理远端文件上传失败。可能是网络原因。请先在浏览器中输入该远端文件的URL地址，测试该文件是否能下载。图5 远端文件上传失败父主题：上传文件至JupyterLab

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过JupyterLab在线使用Notebook实例进行AI开发 > 上传文件至JupyterLab
AI开发基本概念 - AI开发平台ModelArts

AI开发基本概念机器学习常见的分类有3种：监督学习：利用一组已知类别的样本调整分类器的参数，使其达到所要求性能的过程，也称为监督训练或有教师学习。常见的有回归和分类。非监督学习：在未加标签的数据中，试图找到隐藏的结构。常见的有聚类。强化学习：智能系统从环境到行为映射的学习，以使奖励信号（强化信号）函数值最大。

帮助中心 > AI开发平台ModelArts > 产品介绍 > AI开发基础知识
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

关闭详细日志命令： unset DETAIL_TIME_LOG 配置后重启推理服务生效。 Step7 推理性能和精度测试推理性能和精度测试操作请参见推理性能测试和推理精度测试。附录：基于vLLM（v0.3.2）不同模型推理支持的max-model-len长度说明基于vLLM（v0

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905）
简介 - AI开发平台ModelArts
简介 - AI开发平台ModelArts

模型编排。模型裁剪。精度校验。精度对比误差统计工具。自动化精度对比工具。网络结构可视化工具。性能调优。性能测试。性能调优三板斧。性能分析与诊断。迁移测试报告。推理迁移验收表。 ModelArts开发环境 ModelArts作为华为云上的AI开发平台，提供交互式云上

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
AIGC工具tailor使用指导 - AI开发平台ModelArts

具体功能模型转换固定shape转模型动态shape传入指定档位转模型支持fp32 支持AOE优化 benchmark 支持测试性能支持精度测试 profiling 支持分析算子的profiling 环境准备本工具支持x86和ARM的系统环境，使用前需要安装以下软件。表2

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

\"crossbow\"], \"type\": \"string\"}}}" }' Step5 推理性能和精度测试推理性能和精度测试操作请参见推理性能测试和推理精度测试。父主题：主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908）
通过OBS导入模型时，如何编写打印日志代码才能在ModelArts日志查询界面看到日志 - AI开发平台ModelArts

来。参考代码如下： import log # 创建一个logger logger = log.getLogger(__name__) # 测试日志输出 logger.info("This is an info message") 父主题：模型管理

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 模型管理
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

"top_k": -1 "use_beam_search":true "best_of":2 Step5 推理性能和精度测试推理性能和精度测试操作请参见推理性能测试和推理精度测试。父主题：主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906）
Standard模型部署 - AI开发平台ModelArts

供了一整套安全可靠的一站式部署方式。图1 部署模型的流程在线推理服务，可以实现高并发，低延时，弹性伸缩，并且支持多模型灰度发布、A/B测试。支持各种部署场景，既能部署为云端的在线推理服务和批量推理任务，也能部署到端，边等各种设备。一键部署，可以直接推送部署到边缘设备中，选择智能边缘节点，推送模型。

帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍 > Standard功能介绍
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

False Bool ignore_eos表示是否忽略EOS并且继续生成token。 Step5 推理性能和精度测试推理性能和精度测试操作请参见推理性能测试和推理精度测试。父主题：主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）
线下容器镜像构建及调试 - AI开发平台ModelArts

查看日志、错误等，并进行代码、环境变量的修正。预置脚本测试整体流程一般使用run.sh封装训练外的文件复制工作（数据、代码：OBS-->容器，输出结果：容器-->OBS），run.sh的构建方法参考run.sh脚本测试ModelArts训练整体流程。如果预置脚本调用结果不符

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 单机单卡
使用AI Gallery在线推理服务部署模型 - AI开发平台ModelArts

待在线推理服务状态变为“运行中”时，便可进行推理预测。在在线推理服务列表页面，选择服务“状态”为“运行中”的服务。单击操作列的“推理测试”，在测试页面根据任务类型以及页面提示完成对应的测试。调用API 待推理服务的状态变为“运行中”时，可单击操作列的“调用”，复制对应的接口代码，在本地环境或云端的开发环境中进行接口。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版）
日志提示"No CUDA-capable device is detected" - AI开发平台ModelArts

D不匹配的情况。如果上述方法还出现了错误，可以去notebook里面调试打印CUDA_VISIBLE_DEVICES变量，或者用以下代码测试，查看结果是否返回的是True。 import torch torch.cuda.is_available() 建议与总结在创建训练作业

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > GPU相关问题
使用kv-cache-int8量化 - AI开发平台ModelArts

--quantization-param-path kv_cache_scales.json #输入2. 抽取kv-cache量化系数生成的json文件路径; 如果只测试推理功能和性能，不需要此json文件，此时scale系数默认为1，但是可能会造成精度下降。 per-tensor+per-head静态量化场景

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

部署推理服务在Notebook调试环境中部署推理服务介绍如何在Notebook中配置NPU环境，部署并启动推理服务，完成精度测试和性能测试。如果需要部署量化模型，需在Notebook中进行模型权重转换后再部署推理服务。在推理生产环境中部署推理服务介绍如何在创建AI应

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

部署推理服务在Notebook调试环境中部署推理服务介绍如何在Notebook中配置NPU环境，部署并启动推理服务，完成精度测试和性能测试。如果需要部署量化模型，需在Notebook中进行模型权重转换后再部署推理服务。在推理生产环境中部署推理服务介绍如何在创建AI应

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910）
在推理生产环境中部署推理服务 - AI开发平台ModelArts

预测”即可看到预测结果。图5 预测-openai 在线服务的更多内容介绍请参见文档查看服务详情。 Step5 推理性能测试推理性能测试操作请参见推理性能测试。父主题：主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907）
在开发环境中部署本地服务进行调试 - AI开发平台ModelArts

configs结构决定。部署在线服务Predictor需要线上服务端根据AI引擎创建容器，较耗时；本地Predictor部署较快，最长耗时10s，可用以测试模型，不建议进行模型的工业应用。当前版本支持部署本地服务Predictor的AI引擎为：“XGBoost”、“Scikit_Learn”

帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理

总条数： 1491

上一页
1
...
8
9
10
...
75
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

GPU服务器上配置Lite Server资源软件环境 - AI开发平台ModelArts

托管数据集到AI Gallery - AI开发平台ModelArts

上传远端文件至JupyterLab - AI开发平台ModelArts

AI开发基本概念 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

简介 - AI开发平台ModelArts

AIGC工具tailor使用指导 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

通过OBS导入模型时，如何编写打印日志代码才能在ModelArts日志查询界面看到日志 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

Standard模型部署 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

线下容器镜像构建及调试 - AI开发平台ModelArts

使用AI Gallery在线推理服务部署模型 - AI开发平台ModelArts

日志提示"No CUDA-capable device is detected" - AI开发平台ModelArts

使用kv-cache-int8量化 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

在开发环境中部署本地服务进行调试 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线