搜索_华为云

什么是区域、可用区？ - AI开发平台ModelArts

情。如何选择可用区？是否将资源放在同一可用区内，主要取决于您对容灾能力和网络时延的要求。如果您的应用需要较高的容灾能力，建议您将资源部署在同一区域的不同可用区内。如果您的应用要求实例之间的网络延时较低，则建议您将资源创建在同一可用区内。区域和终端节点当您通过API使用

 帮助中心 > AI开发平台ModelArts > 常见问题 > 一般性问题
ModelArts支持云审计的关键操作 - AI开发平台ModelArts

dataset createAutoLabelingTask 创建自动分组任务 dataset createAutoGroupingTask 创建自动部署任务 dataset createAutoDeployTask 导入样本到数据集 dataset importSamplesToDataset

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用CTS审计ModelArts服务
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

AscendCloud-6.3.906-xxx.zip 说明：软件包名称中的xxx表示时间戳。包含了本教程中使用到的模型训练代码、推理部署代码和推理评测代码。代码包具体说明请参见模型软件包结构说明。 AscendSpeed是用于模型并行计算的框架，其中包含了许多模型的输入处理方法。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.906） > 准备工作
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

AscendCloud-3rdLLM-6.3.905-xxx.zip 说明：软件包名称中的xxx表示时间戳。包含了本教程中使用到的模型训练代码、推理部署代码和推理评测代码。代码包具体说明请参见模型软件包结构说明。 AscendSpeed是用于模型并行计算的框架，其中包含了许多模型的输入处理方法。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.905） > 准备工作
查询支持的镜像列表 - AI开发平台ModelArts

分页记录的起始位置偏移量，默认值0。 service_type 否 String 镜像支持服务类型。枚举值如下： COMMON：通用镜像。 INFERENCE: 建议仅在推理部署场景使用。 TRAIN: 建议仅在训练任务场景使用。 DEV: 建议仅在开发调测场景使用。 UNKNOWN: 未明确设置的镜像支持的服务类型。

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

sh # 系列模型共同调用的多功能的脚本 |── install.sh # 环境部署脚本 |——src/ # 启动命令行封装脚本，在install.sh里面自动构建

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.909） > 准备工作
准备MaaS资源 - AI开发平台ModelArts

OBS桶必须和MaaS服务在同一个Region下，否则无法选择到该OBS路径。准备资源池在ModelArts Studio大模型即服务平台进行模型调优、压缩或部署时，需要选择资源池。MaaS服务支持专属资源池和公共资源池。专属资源池：专属资源池不与其他用户共享，资源更可控。在使用专属资源池之前，您

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

sh # 系列模型共同调用的多功能的脚本 |── install.sh # 环境部署脚本 |──llm_inference # 推理代码包 |──llm_tools

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.905） > 准备工作
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

sh # 系列模型共同调用的多功能的脚本 |── install.sh # 环境部署脚本 |——src/ # 启动命令行封装脚本，在install.sh里面自动构建

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.910） > 准备工作
昇腾云服务6.3.909版本说明 - AI开发平台ModelArts

deepseek-v2-236B deepseek-coder-v2-lite-16B Ascend-vllm支持如下推理特性：支持分离部署支持多机推理支持大小模型投机推理及eagle投机推理支持chunked prefill特性支持automatic prefix caching

帮助中心 > AI开发平台ModelArts > 服务公告 > 产品发布说明
推理性能测试 - AI开发平台ModelArts

已经上传benchmark验证脚本到推理容器中。如果在Step5 进入容器安装推理依赖软件步骤中已经上传过AscendCloud-3rdLLM-x.x.x.zip并解压，无需重复执行。进入benchmark_tools目录下，执行如下命令安装性能测试的关依赖。 pip install -r requirements

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.905）
推理性能测试 - AI开发平台ModelArts

已经上传benchmark验证脚本到推理容器中。如果在Step5 进入容器安装推理依赖软件步骤中已经上传过AscendCloud-LLM-x.x.x.zip并解压，无需重复执行。进入benchmark_tools目录下，切换一个conda环境，执行如下命令安装性能测试的关依赖。 conda activate

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.906）
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

AscendCloud-6.3.907-xxx.zip 说明：软件包名称中的xxx表示时间戳。包含了本教程中使用到的模型训练代码、推理部署代码和推理评测代码。代码包具体说明请参见模型软件包结构说明。获取路径：Support-E 说明：如果上述软件获取路径打开后未显示相应的

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.907） > 准备工作
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

sh # 系列模型共同调用的多功能的脚本 |── install.sh # 环境部署脚本 |——src/ # 启动命令行封装脚本，在install.sh里面自动构建

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.906） > 准备工作
使用GPTQ量化 - AI开发平台ModelArts

PTQ量化工具GPTQ (huggingface.co)量化模型权重，然后在NPU的机器上实现推理量化。具体操作如下：开始之前，请确保安装了以下库： pip install auto-gptq pip install --upgrade accelerate optimum transformers

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.910） > 推理模型量化
使用GPTQ量化 - AI开发平台ModelArts

PTQ量化工具GPTQ (huggingface.co)量化模型权重，然后在NPU的机器上实现推理量化。具体操作如下：开始之前，请确保安装了以下库： pip install auto-gptq pip install --upgrade accelerate optimum transformers

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910） > 推理模型量化
使用GPTQ量化 - AI开发平台ModelArts

PTQ量化工具GPTQ (huggingface.co)量化模型权重，然后在NPU的机器上实现推理量化。具体操作如下：开始之前，请确保安装了以下库： pip install auto-gptq pip install --upgrade accelerate optimum transformers

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
使用GPTQ量化 - AI开发平台ModelArts

PTQ量化工具GPTQ (huggingface.co)量化模型权重，然后在NPU的机器上实现推理量化。具体操作如下：开始之前，请确保安装了以下库： pip install auto-gptq pip install --upgrade accelerate optimum transformers

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.908） > 推理模型量化
使用GPTQ量化 - AI开发平台ModelArts

PTQ量化工具GPTQ (huggingface.co)量化模型权重，然后在NPU的机器上实现推理量化。具体操作如下：开始之前，请确保安装了以下库： pip install auto-gptq pip install --upgrade accelerate optimum transformers

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908） > 推理模型量化
使用GPTQ量化 - AI开发平台ModelArts

PTQ量化工具GPTQ (huggingface.co)量化模型权重，然后在NPU的机器上实现推理量化。具体操作如下：开始之前，请确保安装了以下库： pip install auto-gptq pip install --upgrade accelerate optimum transformers

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.909） > 推理模型量化

总条数： 1354

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

什么是区域、可用区？ - AI开发平台ModelArts

ModelArts支持云审计的关键操作 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

查询支持的镜像列表 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

准备MaaS资源 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

昇腾云服务6.3.909版本说明 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

使用GPTQ量化 - AI开发平台ModelArts

使用GPTQ量化 - AI开发平台ModelArts

使用GPTQ量化 - AI开发平台ModelArts

使用GPTQ量化 - AI开发平台ModelArts

使用GPTQ量化 - AI开发平台ModelArts

使用GPTQ量化 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线