搜索_华为云

推理性能测试 - AI开发平台ModelArts

--dataset-type custom \ --tokenizer /path/to/tokenizer --request-rate 0.01 1 2 4 8 10 20 --num-prompts 10 1000 1000 1000 1000 1000 1000 \ --max-tokens

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.907）
kv-cache-int8量化 - AI开发平台ModelArts

#只支持int8，表示kvint8 per-tensor量化 --quantization-param-path kv_cache_scales.json #输入2. 抽取kv-cache量化系数生成的json文件路径; 如果只测试推理功能和性能，不需要此json文件，此时scale系数默认为1，但是可能会造成精度下降。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.5.901） > 推理关键特性使用 > 量化
kv-cache-int8量化 - AI开发平台ModelArts

#只支持int8，表示kvint8 per-tensor量化 --quantization-param-path kv_cache_scales.json #输入2. 抽取kv-cache量化系数生成的json文件路径; 如果只测试推理功能和性能，不需要此json文件，此时scale系数默认为1，但是可能会造成精度下降。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用 > 量化
查询OS的配额 - AI开发平台ModelArts

描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。请求参数无响应参数状态码：200 表2 响应Body参数参数参数类型描述 quotas Quota object 资源配额。表3 Quota 参数参数类型描述 resources

帮助中心 > AI开发平台ModelArts > API参考 > 配额管理
创建导入任务 - AI开发平台ModelArts

Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI POST /v2/{project_id}/datasets/{dataset_id}/import-tasks 表1 路径参数参数是否必选参数类型描述

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
查询推理服务标签 - AI开发平台ModelArts

路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。请求参数表2 请求Header参数参数是否必选参数类型描述 X-Auth-Token 是 String 用户Token。通过调用IAM服务获取用

 帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
数据导入方式介绍 - AI开发平台ModelArts

导入数据。图1 在数据集列表页导入数据在数据集列表页面，单击某个数据集的名称，进入数据集详情页中，单击“导入>导入”，导入数据。图2 在数据集详情页中导入数据在数据集列表页面，单击某个数据集的名称，进入数据集详情页中，单击“同步数据源”，同步OBS中的数据。图3 在数据集详情页中同步数据源

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 导入数据到ModelArts数据集
管理训练容器环境变量 - AI开发平台ModelArts

变量值。为保证数据安全，请勿输入敏感信息，例如明文密码。训练容器中预置的环境变量训练容器中预置的环境变量如下面表格所示，包括表1、表2、表3、表4、表5、表6、表7。此处的环境变量取值仅为示例，涉及不同规格、引擎、Region可能取值不一样，此处仅供参考。表1 路径相关环境变量

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
准备环境 - AI开发平台ModelArts
准备环境 - AI开发平台ModelArts

r。请参考本文档要求准备资源环境。资源规格要求计算规格：对于Qwen-7B和Qwen-14B单机训练需要使用单机8卡，多机训练需要使用2机16卡。对于Qwen-72B至少需要5机40卡才能训练，建议使用8机64卡执行训练相关任务。硬盘空间：至少200GB。 Ascend资源规格：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > Qwen系列模型基于Lite Server适配PyTorch NPU训练指导（6.3.904） > 准备工作
预训练 - AI开发平台ModelArts
预训练 - AI开发平台ModelArts

sh 若镜像使用ECS中构建新镜像（二选一）构建的新镜像时，训练作业启动命令中输入： cd /home/ma-user/modelarts/user-job-dir/AscendSpeed; sh ./scripts/obs_pipeline.sh Step2 配置数据输入和输出

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.907）
在ModelArts上训练模型如何配置输入输出数据？ - AI开发平台ModelArts

路径，输入和输出数据需要配置3个地方：训练代码中需解析输入路径参数和输出路径参数。ModelArts推荐以下方式实现参数解析。 1 2 3 4 5 6 7 8 9 10 import argparse # 创建解析 parser = argparse.Argu

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard模型训练
训练的数据集预处理说明 - AI开发平台ModelArts

训练的数据集预处理说明以llama2-13b举例，使用训练作业运行：obs_pipeline.sh 训练脚本后，脚本自动执行数据集预处理，并检查是否已经完成数据集预处理。如果已完成数据集预处理，则直接执行训练任务。如果未进行数据集预处理，则会自动执行scripts/llama2/1_preprocess_data

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.909） > 训练脚本说明
训练的数据集预处理说明 - AI开发平台ModelArts

训练的数据集预处理说明以llama2-13b举例，使用训练作业运行：obs_pipeline.sh 训练脚本后，脚本自动执行数据集预处理，并检查是否已经完成数据集预处理。如果已完成数据集预处理，则直接执行训练任务。如果未进行数据集预处理，则会自动执行scripts/llama2/1_preprocess_data

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.910） > 训练脚本说明
从OBS中导入模型文件创建模型 - AI开发平台ModelArts

的参数配置请参见表2。针对从OBS导入的元模型，ModelArts要求根据模型包规范，编写推理代码和配置文件，并将推理代码和配置文件放置元模型存储的“model”文件夹下。如果您选择的目录下不符合模型包规范，将无法创建模型。图1 从OBS中选择元模型表2 元模型来源参数说明

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型
作业状态参考 - AI开发平台ModelArts

表1 作业状态状态值作业状态说明 0 JOBSTAT_UNKNOWN，作业状态未知。 1 JOBSTAT_INIT，作业初始化状态。 2 JOBSTAT_IMAGE_CREATING，作业镜像正在创建。 3 JOBSTAT_IMAGE_FAILED，作业镜像创建失败。 4 J

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版）
Step1 创建用户组并加入用户 - AI开发平台ModelArts

请根据界面提示，填写必选参数，然后单击“下一步”。在“加入用户组”步骤中，选择“用户组02”，然后单击“创建用户”。系统将逐步创建好前面设置的2个用户。父主题：配置ModelArts基本使用权限

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践 > 配置ModelArts基本使用权限
准备资源 - AI开发平台ModelArts
准备资源 - AI开发平台ModelArts

在专属池详情页可查看驱动及固件版本。如下图显示Ascend驱动为7.1.0.7.220-23.0.5，表示固件版本为7.1.0.7.220，驱动版本为23.0.5。图2 查看专属池驱动创建OBS桶 ModelArts使用对象存储服务（Object Storage Service，简称OBS）存储输入输出数

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910） > 准备工作
准备资源 - AI开发平台ModelArts
准备资源 - AI开发平台ModelArts

在专属池详情页可查看驱动及固件版本。如下图显示Ascend驱动为7.1.0.7.220-23.0.5，表示固件版本为7.1.0.7.220，驱动版本为23.0.5。图2 查看专属池驱动创建OBS桶 ModelArts使用对象存储服务（Object Storage Service，简称OBS）存储输入输出数

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907） > 准备工作
准备资源 - AI开发平台ModelArts
准备资源 - AI开发平台ModelArts

在专属池详情页可查看驱动及固件版本。如下图显示Ascend驱动为7.1.0.7.220-23.0.5，表示固件版本为7.1.0.7.220，驱动版本为23.0.5。图2 查看专属池驱动创建OBS桶 ModelArts使用对象存储服务（Object Storage Service，简称OBS）存储输入输出数

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911） > 准备工作
解除API对APP的授权 - AI开发平台ModelArts

用户项目ID。获取方法请参见获取项目ID和名称。 service_id 是 String API所属的服务ID。 api_id 是 String API编号。表2 Query参数参数是否必选参数类型描述 workspace_id 否 String 工作空间ID。获取方法请参见查询工作空间列表。

帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理

总条数： 1147

上一页
1
...
51
52
53
...
58
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

推理性能测试 - AI开发平台ModelArts

kv-cache-int8量化 - AI开发平台ModelArts

kv-cache-int8量化 - AI开发平台ModelArts

查询OS的配额 - AI开发平台ModelArts

创建导入任务 - AI开发平台ModelArts

查询推理服务标签 - AI开发平台ModelArts

数据导入方式介绍 - AI开发平台ModelArts

管理训练容器环境变量 - AI开发平台ModelArts

准备环境 - AI开发平台ModelArts

预训练 - AI开发平台ModelArts

在ModelArts上训练模型如何配置输入输出数据？ - AI开发平台ModelArts

训练的数据集预处理说明 - AI开发平台ModelArts

训练的数据集预处理说明 - AI开发平台ModelArts

从OBS中导入模型文件创建模型 - AI开发平台ModelArts

作业状态参考 - AI开发平台ModelArts

Step1 创建用户组并加入用户 - AI开发平台ModelArts

准备资源 - AI开发平台ModelArts

准备资源 - AI开发平台ModelArts

准备资源 - AI开发平台ModelArts

解除API对APP的授权 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线