搜索_华为云

使用AWQ量化 - AI开发平台ModelArts

模型列表和权重文件。本章节介绍如何使用AWQ量化工具实现推理量化。量化方法：W4A16 per-group/per-channel，W8A16 per-channel Step1 环境准备在节点自定义目录${node_path}下创建config.yaml文件 apiVersion:

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910） > 推理模型量化
从0制作自定义镜像用于创建训练作业（Tensorflow+GPU） - AI开发平台ModelArts

创建OBS桶和文件夹在OBS服务中创建桶和文件夹，用于存放样例数据集以及训练代码。需要创建的文件夹列表如表1所示，示例中的桶名称“test-modelarts” 和文件夹名称均为举例，请替换为用户自定义的名称。创建OBS桶和文件夹的操作指导请参见创建桶和新建文件夹。请确保您

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于训练模型
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

zip 运行推理构建脚本build.sh文件，自动获取ascend_vllm_adapter文件夹中提供的vLLM相关算子代码。 cd llm_inference bash build.sh 运行完后，在当前目录下会生成ascend_vllm文件夹，即为昇腾适配后的vLLM代码。 Step3

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905）
准备数据（可选） - AI开发平台ModelArts

fo.json文件。如使用以下示例数据集则命令如下。关于数据集文件格式及配置，更多信息请参考data/README_zh.md 的内容。 vim dataset_info.json 新加配置参数如下： "alpaca_gpt4_data": { "file_name": "alpaca_gpt4_data

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.908） > 准备工作
什么是区域、可用区？ - AI开发平台ModelArts

区域和可用区用于描述数据中心的位置，您可以在特定的区域、可用区创建资源。区域（Region）：从地理位置和网络时延维度划分，同一个Region内共享弹性计算、块存储、对象存储、VPC网络、弹性公网IP、镜像等公共服务。Region分为通用Region和专属Region，通用Region指面向公共租户提供通用云

 帮助中心 > AI开发平台ModelArts > 常见问题 > 一般性问题
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

获取模型软件包，并上传到机器SFS Turbo的目录下（可自定义路径），获取地址参考表1。解压AscendCloud压缩包及该目录下的推理代码AscendCloud-LLM-6.3.909-xxx.zip，并直接进入到llm_inference/ascend_vllm文件夹下面 unzip

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909） > 准备工作
迁移适配 - AI开发平台ModelArts
迁移适配 - AI开发平台ModelArts

ptuning/main.py \ --do_train \ --train_file ${HOME}/AdvertiseGen/train.json \ --validation_file ${HOME}/AdvertiseGen/dev.json \ --prompt_column

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于LLM模型的GPU训练业务迁移至昇腾指导
使用AWQ量化 - AI开发平台ModelArts

模型列表和权重文件。本章节介绍如何使用AWQ量化工具实现推理量化。量化方法：W4A16 per-group/per-channel，W8A16 per-channel Step1 环境准备在节点自定义目录${node_path}下创建config.yaml文件 apiVersion:

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
使用AWQ量化 - AI开发平台ModelArts

模型列表和权重文件。本章节介绍如何使用AWQ量化工具实现推理量化。量化方法：W4A16 per-group/per-channel，W8A16 per-channel Step1 环境准备在节点自定义目录${node_path}下创建config.yaml文件 apiVersion:

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911） > 推理模型量化
Paraformer基于DevServer适配PyTorch NPU推理指导（6.3.911) - AI开发平台ModelArts

python infer.py --model_path 模型文件所在的绝对路径 --input_file 测试音频所在路径参数说明： --model_path：为模型所在文件夹的绝对路径 --input_file：输入音频，相关格式说明参考文档。测试音频speech_par

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
创建训练作业 - AI开发平台ModelArts

训练作业的代码目录。如：“/usr/app/”。应与boot_file一同出现，如果boot_file填入id或subscription_id+item_version_id，则此参数无需填写。 boot_file 否 String 训练作业的代码启动文件，需要在代码目录下。如：“/usr/app/boot

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
查询数据集的版本列表 - AI开发平台ModelArts

数据集版本名称。 with_column_header Boolean 发布的CSV文件的第一行是否为列名，对于表格数据集有效。可选值如下： true：发布的CSV文件的第一行是列名 false：发布的CSV文件的第一行不是列名表5 LabelStats 参数参数类型描述 attributes

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
精度问题处理 - AI开发平台ModelArts

6，fp32的性能较差。因此，通常只在检测到某个模型精度存在问题时，才会考虑是否使用fp32进行尝试）。使用fp32精度模式的配置文件如下：配置文件： # config.ini [ascend_context] precision_mode=enforce_fp32 # 使用fp32。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导 > 模型精度调优
使用自定义引擎在ModelArts Standard创建模型 - AI开发平台ModelArts

使用自定义引擎创建模型，用户可以通过选择自己存储在SWR服务中的镜像作为模型的引擎，指定预先存储于OBS服务中的文件目录路径作为模型包来创建模型，轻松地应对ModelArts平台预置引擎无法满足个性化诉求的场景。自定义引擎创建模型的规范使用自定义引擎创建模型，用户的SWR镜像、OBS模型包和文件大小需要满足以下规范：

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
如何上传数据至OBS？ - AI开发平台ModelArts

创建桶桶是OBS中存储对象的容器，在上传对象前需要先创建桶。OBS提供多种使用方式，您可以根据使用习惯、业务场景选择不同的工具来创建桶。具体参考OBS文档创建桶章节。上传对象桶创建成功后，您可以通过以下多种方式将文件上传至桶，OBS最终将这些文件以对象的形式存储在桶中。具体参考OBS文档上传对象章节。

帮助中心 > AI开发平台ModelArts > 常见问题 > 一般性问题
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

${work_dir}:${container_work_dir} 代表需要在容器中挂载宿主机的目录。宿主机和容器使用不同的文件系统。work_dir为宿主机中工作目录，目录下存放着训练所需代码、数据等文件。container_work_dir为要挂载到的容器中的目录。为方便两个地址可以相同。容器不能挂

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.906） > 准备工作
GPT-2基于Server适配PyTorch GPU的训练推理指导 - AI开发平台ModelArts

1024 \ --temperature 1.0 \ --vocab-file $VOCAB_FILE \ --merge-file $MERGE_FILE \ --genfile unconditional_samples.json

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源使用
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

训练原始数据集 |── alpaca_gpt4_data.json # 微调数据文件注意：多机情况下，只有在rank_0节点进行数据预处理，转换权重等工作，所以原始数据集和原始权重，包括保存结果路径，都应该在共享目录下。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.907） > 准备工作
开发第一条Workflow - AI开发平台ModelArts

SDK安装包时，建议您同时下载校验文件，校验安装包的完整性，避免由于安装包下载问题导致后续的业务问题。依次完成下载ModelArts SDK安装包、校验文件和Workflow SDK安装包、校验文件。下载ModelArts SDK安装包下载ModelArts SDK校验文件下载Workflow

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

${work_dir}:${container_work_dir} 代表需要在容器中挂载宿主机的目录。宿主机和容器使用不同的文件系统。work_dir为宿主机中工作目录，目录下存放着训练所需代码、数据等文件。container_work_dir为要挂载到的容器中的目录。为方便两个地址可以相同。容器不能挂

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.907） > 准备工作

总条数： 1570

上一页
1
...
37
38
39
...
79
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用AWQ量化 - AI开发平台ModelArts

从0制作自定义镜像用于创建训练作业（Tensorflow+GPU） - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

准备数据（可选） - AI开发平台ModelArts

什么是区域、可用区？ - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

迁移适配 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

Paraformer基于DevServer适配PyTorch NPU推理指导（6.3.911) - AI开发平台ModelArts

创建训练作业 - AI开发平台ModelArts

查询数据集的版本列表 - AI开发平台ModelArts

精度问题处理 - AI开发平台ModelArts

使用自定义引擎在ModelArts Standard创建模型 - AI开发平台ModelArts

如何上传数据至OBS？ - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

GPT-2基于Server适配PyTorch GPU的训练推理指导 - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

开发第一条Workflow - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线