搜索_华为云

下载JupyterLab文件到本地 - AI开发平台ModelArts

下载JupyterLab文件到本地在JupyterLab中开发的文件，可以下载至本地。关于如何上传文件至JupyterLab，请参见上传文件至JupyterLab。不大于100MB的文件，可以直接从JupyterLab中下载到本地，具体操作请参见从JupyterLab中下载不大于100MB的文件至本地。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过JupyterLab在线使用Notebook实例进行AI开发
使用SmoothQuant量化工具转换权重 - AI开发平台ModelArts

能同时降低首token时延和增量推理时延。支持SmoothQuant(W8A8)量化的模型列表请参见支持的模型列表和权重文件。本章节介绍如何在Notebook使用SmoothQuant量化工具实现推理量化。 SmoothQuant量化工具使用到的脚本存放在代码包AscendCloud-LLM-x

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907） > 推理模型量化
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

export USE_VOCAB_PARALLEL=1 # 是否使用词表并行；默认值为1表示开启并行，取值为0表示关闭并行。对于词表较小的模型（如llama2系模型），关闭并行可以减少推理时延，对于词表较大的模型（如qwen系模型），开启并行可以减少显存占用，以提升推理吞吐量。 export

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908）
开发用于预置框架训练的代码 - AI开发平台ModelArts

创建算法”的“代码目录”下放置相应的文件或安装包。安装python依赖包请参考模型中引用依赖包时，如何创建训练作业？安装C++的依赖库请参考如何安装C++的依赖库？在预训练模型中加载参数请参考如何在训练中加载部分训练好的参数？解析输入路径参数、输出路径参数运行在ModelArts

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 准备模型训练代码
使用AWQ量化工具转换权重 - AI开发平台ModelArts

AWQ(W4A16/W8A16)量化方案能显著降低模型显存以及需要部署的卡数。降低小batch下的增量推理时延。支持AWQ量化的模型列表请参见表1。本章节介绍如何在Notebook使用AWQ量化工具实现推理量化。量化方法：W4A16 per-group/per-channel, W8A16 per-channel

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908） > 推理模型量化
MaaS使用场景和使用流程 - AI开发平台ModelArts

本与难度。当您第一次使用MaaS服务时，可以参考快速入门使用ModelArts Studio的Qwen2-7B模型框架实现对话问答，了解如何在MaaS服务上的创建和部署模型。当您想更全面的了解MaaS服务的功能时，也可以参考最佳实践在ModelArts Studio基于Qwen2-7B模型实现新闻自动分类。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

export USE_VOCAB_PARALLEL=1 # 是否使用词表并行；默认值为1表示开启并行，取值为0表示关闭并行。对于词表较小的模型（如llama2系模型），关闭并行可以减少推理时延，对于词表较大的模型（如qwen系模型），开启并行可以减少显存占用，以提升推理吞吐量。 export

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907）
更新服务配置 - AI开发平台ModelArts

包括predictor configs结构和transformer configs 服务配置，不设置此参数时，表示不更新。关于configs如何生成，请参见部署在线服务。更新服务配置时，存在以下约束：参数status指定的目标状态不允许和当前服务状态相同。当前服务状态是dep

帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
联网下载SimSun.ttf时可能会遇到网络问题 - AI开发平台ModelArts

联网下载SimSun.ttf时可能会遇到网络问题联网下载SimSun.ttf时肯会遇到网络问题 tonkenization_qwen.py会在cache中读取SimSun.ttf 文件，如果没有，就会联网下载，可能会遇到： SSL:CERTIFICATE_VERIFY_FAILED

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.912） > 常见错误原因和解决方法
联网下载SimSun.ttf时可能会遇到网络问题 - AI开发平台ModelArts

联网下载SimSun.ttf时可能会遇到网络问题联网下载SimSun.ttf时肯会遇到网络问题 tonkenization_qwen.py会在cache中读取SimSun.ttf 文件，如果没有，就会联网下载，可能会遇到： SSL:CERTIFICATE_VERIFY_FAILED

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.912） > 常见错误原因和解决方法
MindSpore日志提示“ retCode=0x91, [the model stream execute failed]” - AI开发平台ModelArts

数据读入的速度跟不上模型迭代的速度。处理方法减少预处理shuffle操作。 dataset = dataset.shuffle(buffer_size=x) 关闭数据预处理开关，可能会影响性能。 NPURunConfig(enable_data_pre_proc=false) 建议与总结在创建训练

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
创建开发环境实例 - AI开发平台ModelArts

用户项目ID。获取方法请参见获取项目ID和名称。请求消息请求参数如表2所示。表2 请求参数参数是否必选参数类型说明 name 是 String 实例名称，长度限制为64个字符，支持大小写字母、数字、中划线和下划线。 profile_id 是 String 配置ID，当前支持： Ascend-Power-Engine

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 开发环境（旧版）
推理性能测试 - AI开发平台ModelArts

100，数量需和--request-rate的数量对应。 --max-tokens：输入+输出限制的最大长度，模型启动参数--max-input-length值需要大于该值。 --max-prompt-tokens：输入限制的最大长度，推理时最大输入tokens数量，模型启动参数--max-tota

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909）
推理性能测试 - AI开发平台ModelArts

100，数量需和--request-rate的数量对应。 --max-tokens：输入+输出限制的最大长度，模型启动参数--max-input-length值需要大于该值。 --max-prompt-tokens：输入限制的最大长度，推理时最大输入tokens数量，模型启动参数--max-tota

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.908）
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

otebook。部署推理服务在Notebook调试环境中部署推理服务介绍如何在Notebook中配置NPU环境，部署并启动推理服务，完成精度测试和性能测试。在推理生产环境中部署推理服务介绍如何在创建AI应用，部署并启动推理服务，在线预测在线服务。父主题：主流开源大模

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905）
GPU服务器上配置Lite Server资源软件环境 - AI开发平台ModelArts

GPU服务器上配置Lite Server资源软件环境场景描述本文旨在指导如何在GPU裸金属服务器上，安装NVIDIA、CUDA驱动等环境配置。由于不同GPU预置镜像中预安装的软件不同，您通过Lite Server算力资源和镜像版本配套关系章节查看已安装的软件。下面为常见的软件

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源配置 > 配置Lite Server软件环境
ModelArts Standard使用流程 - AI开发平台ModelArts

rts不仅提供了在线代码开发环境，还提供了从数据准备、模型训练、模型管理到模型部署上线的端到端开发流程（即AI全流程开发）。本文档介绍了如何在ModelArts管理控制台完成AI开发，如果您习惯使用API或者SDK进行开发，建议查看《ModelArts SDK参考》和《ModelArts

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard）
Standard模型训练 - AI开发平台ModelArts

在ModelArts中训练好后的模型如何获取？在ModelArts上如何获得RANK_TABLE_FILE用于分布式训练？在ModelArts上训练模型如何配置输入输出数据？在ModelArts上如何提升训练效率并减少与OBS的交互？在ModelArts中使用Moxing复制数据时如何定义路径变量？

帮助中心 > AI开发平台ModelArts > 常见问题
多模态模型推理性能测试 - AI开发平台ModelArts

# 执行静态、动态性能评测脚本 ├── requirements.txt # 第三方依赖静态benchmark验证本章节介绍如何进行静态benchmark验证。已经上传benchmark验证脚本到推理容器中。如果在步骤四制作推理镜像步骤中已经上传过AscendCloud-LLM-x

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.909） > 推理性能测试
多模态模型推理性能测试 - AI开发平台ModelArts

# 执行静态、动态性能评测脚本 ├── requirements.txt # 第三方依赖静态benchmark验证本章节介绍如何进行静态benchmark验证。已经上传benchmark验证脚本到推理容器中。如果在步骤四制作推理镜像步骤中已经上传过AscendCloud-LLM-x

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.910） > 推理性能测试

总条数： 911

上一页
1
...
21
22
23
...
46
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

下载JupyterLab文件到本地 - AI开发平台ModelArts

使用SmoothQuant量化工具转换权重 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

开发用于预置框架训练的代码 - AI开发平台ModelArts

使用AWQ量化工具转换权重 - AI开发平台ModelArts

MaaS使用场景和使用流程 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

更新服务配置 - AI开发平台ModelArts

联网下载SimSun.ttf时可能会遇到网络问题 - AI开发平台ModelArts

联网下载SimSun.ttf时可能会遇到网络问题 - AI开发平台ModelArts

MindSpore日志提示“ retCode=0x91, [the model stream execute failed]” - AI开发平台ModelArts

创建开发环境实例 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

GPU服务器上配置Lite Server资源软件环境 - AI开发平台ModelArts

ModelArts Standard使用流程 - AI开发平台ModelArts

Standard模型训练 - AI开发平台ModelArts

多模态模型推理性能测试 - AI开发平台ModelArts

多模态模型推理性能测试 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线