搜索_华为云

部署推理服务 - AI开发平台ModelArts

模型配置文件config.json里面定义的“max_position_embeddings”和“seq_length”；如果设置过大，会占用过多显存，影响kvcache的空间。不同模型推理支持的max-model-len长度不同，具体差异请参见附录：基于vLLM不同模型推理支持最小卡数和最大序列说明。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910）
部署推理服务 - AI开发平台ModelArts

模型配置文件config.json里面定义的“max_position_embeddings”和“seq_length”；如果设置过大，会占用过多显存，影响kvcache的空间。不同模型推理支持的max-model-len长度不同，具体差异请参见附录：基于vLLM不同模型推理支持最小卡数和最大序列说明。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911）
管理AI Gallery数据集 - AI开发平台ModelArts

单击资产名称，进入资产详情页。在资产详情页，单击“下架”，在弹窗中单击“确定”。即可将资产下架。删除数据集当资产不使用时，支持删除，释放AI Gallery仓库的存储空间。在资产详情页，选择“设置”页签。在“删除资产”处，单击“删除”按钮，确认后资产将被删除。删除操作不可撤销，执行此操作后该资产及相关文件将被永久删除，请谨慎操作。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery数据集
订阅免费模型 - AI开发平台ModelArts

在使用过程中如果消耗了硬件资源进行部署，管理控制台将根据实际使用情况收取硬件资源的费用。前提条件注册并登录华为云，且创建好OBS桶用于存储数据和模型。如果是订阅使用HiLens技能，则需要获取相关服务权限，详细操作请参见准备工作（华为HiLens）。订阅免费模型登录“AI

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（旧版） > 订阅使用
API概览 - AI开发平台ModelArts
API概览 - AI开发平台ModelArts

根据指定的实例规格、AI引擎镜像、存储等相关参数，创建一个开发环境实例。查询Notebook实例详情查询开发环境实例详情。更新Notebook实例更新开发环境实例。删除Notebook实例删除开发环境实例，删除的资源包括Notebook容器以及对应的所有存储资源。通过运行的实例保存成容器镜像

 帮助中心 > AI开发平台ModelArts > API参考
执行训练任务（推荐） - AI开发平台ModelArts

Face格式权重输出的路径（确保convert_mg2hf_at_last设置为True，默认为True）。分别单击“输入”和“输出”的数据存储位置，如图所示，选择OBS桶中指定的目录。超参：dataset中则直接选中数据集文件，超参：processed_data_dir则需选中存放已处理好数据集的目录文件夹。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.912） > 常见错误原因和解决方法 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.912） > 执行训练任务
创建IAM用户并授权使用MaaS - AI开发平台ModelArts

FullAccess 可选 ModelArts FullAccess权限和ModelArts CommonOperations权限建议二选一。 OBS对象存储服务授予子用户使用OBS服务的权限。ModelArts的数据管理、开发环境、训练作业、模型推理部署均需要通过OBS进行数据中转。 OBS

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio） > 配置MaaS访问授权
错误码 - AI开发平台ModelArts
错误码 - AI开发平台ModelArts

查询委托配额失败系统错误，请联系技术支持。 400 ModelArts.1002 OBS operation failed. 操作对象存储服务（OBS）失败。请确认对象存储服务（OBS）是否可用。 400 ModelArts.1003 The user account is abnormal

帮助中心 > AI开发平台ModelArts > API参考 > 公共参数
查询团队标注任务统计信息 - AI开发平台ModelArts

确认请求参数无响应参数状态码： 200 表3 响应Body参数参数参数类型描述 data_path String 数据集数据存储路径。 data_spliting_enable Boolean 根据样本标注统计，判断数据集是否可以进行训练/验证集切分。可选值如下：

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
管理AI Gallery模型 - AI开发平台ModelArts

单击资产名称，进入资产详情页。在资产详情页，单击“下架”，在弹窗中单击“确定”。即可将资产下架。删除模型当资产不使用时，支持删除，释放AI Gallery仓库的存储空间。在资产详情页，选择“设置”页签。在“删除资产”处，单击“删除”按钮，确认后资产将被删除。删除操作不可撤销，执行此操作后该资产及相关文件将被永久删除，请谨慎操作。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery模型
查询数据集的统计信息 - AI开发平台ModelArts

确认请求参数无响应参数状态码： 200 表3 响应Body参数参数参数类型描述 data_path String 数据集数据存储路径。 data_spliting_enable Boolean 根据样本标注统计，判断数据集是否可以进行训练/验证集切分。可选值如下：

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
Standard开发环境 - AI开发平台ModelArts

代码开发与调测。云化JupyterLab使用，本地IDE+ModelArts插件远程开发能力，贴近开发人员使用习惯云上开发环境，包含AI计算资源，云上存储，预置AI引擎运行环境自定义，将开发环境直接保存成为镜像，供训练、推理使用 ModelArts CodeLab（JupyterLab），让AI探索&教学更简单

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍 > Standard功能介绍
给子账号配置训练作业基本使用权限 - AI开发平台ModelArts

训练作业启动前下载数据、模型、代码。训练作业运行中上传日志、模型。建议配置。操作步骤本案例场景为单机单卡场景下创建训练作业，数据和代码存储在OBS服务的并行文件系统下，创建自定义镜像训练作业。使用主用户账号登录管理控制台，单击右上角用户名，在下拉框中选择“统一身份认证”，进入统一身份认证（IAM）服务。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

闭并行。对于词表较小的模型（如llama2系模型），关闭并行可以减少推理时延，对于词表较大的模型（如qwen系模型），开启并行可以减少显存占用，以提升推理吞吐量。 export USE_PFA_HIGH_PRECISION_MODE=1 # PFA算子是否使用高精度模式；默认值

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907）
在ECS上构建自定义镜像并在Notebook中使用 - AI开发平台ModelArts

000的用户ma-user和gid为100的用户组ma-group。如果基础镜像中uid 1000或者gid 100已经被其他用户和用户组占用，需要将其对应的用户和用户组删除。如下Dockerfile文件已添加指定的用户和用户组，您直接使用即可。用户只需要设置uid为1000的

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于创建Notebook
ma-cli image镜像构建支持的命令 - AI开发平台ModelArts

显示详细的信息开关，默认关闭。示例：在ModelArts Notebook里查看所有镜像缓存。 ma-cli image df 示例：显示镜像缓存占用磁盘的详细信息。 ma-cli image df --verbose 使用ma-cli image prune命令在ModelArts Notebook中清理镜像构建缓存

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > ModelArts CLI命令参考
部署推理服务 - AI开发平台ModelArts

填写ascend_vllm文件夹绝对路径。高阶配置（可选）。词表切分。在分布式场景下，默认不使用词表切分能提升推理性能，同时也会增加单卡的显存占用。不建议开启词表并行，如确需使用词表切分，配置以下环境变量： export USE_VOCAB_PARALLEL=1 #打开词表切分开关

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.905）
使用MaaS调优模型 - AI开发平台ModelArts

Qwen2-VL-7B √ √ x 支持的数据集格式创建模型调优任务时，支持选择MOSS、Alpaca和ShareGPT这三种数据集格式。 MOSS：用于存储和交换机器学习模型数据的数据集格式，文件类型为jsonl。 Alpaca：用于训练语言模型的数据集格式，文件类型为jsonl。 Share

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
部署服务 - AI开发平台ModelArts
部署服务 - AI开发平台ModelArts

容器中的日志路径。表9 PersistentVolumes 参数是否必选参数类型描述 name 否 String 存储卷的名称。 mount_path 是 String 存储卷在容器中的挂载路径。如：/tmp。请不要挂载在系统目录下，如“/”、“/var/run”等，会导致容器异常。

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
Eagle投机小模型训练 - AI开发平台ModelArts

填写到卡号的文件夹之前。命令中的./sharegpt_0_199_mufp16/"为举例，需要替换为实际地址。 new_folder为需要存储新的data的地址。命令中的./sharegpt_0_199_mufp16/"为举例，需要替换为实际地址。 tp为需要切分成的文件夹数量，默认为8。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）

总条数： 561

上一页
1
...
24
25
26
...
29
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

部署推理服务 - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

管理AI Gallery数据集 - AI开发平台ModelArts

订阅免费模型 - AI开发平台ModelArts

API概览 - AI开发平台ModelArts

执行训练任务（推荐） - AI开发平台ModelArts

创建IAM用户并授权使用MaaS - AI开发平台ModelArts

错误码 - AI开发平台ModelArts

查询团队标注任务统计信息 - AI开发平台ModelArts

管理AI Gallery模型 - AI开发平台ModelArts

查询数据集的统计信息 - AI开发平台ModelArts

Standard开发环境 - AI开发平台ModelArts

给子账号配置训练作业基本使用权限 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

在ECS上构建自定义镜像并在Notebook中使用 - AI开发平台ModelArts

ma-cli image镜像构建支持的命令 - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

使用MaaS调优模型 - AI开发平台ModelArts

部署服务 - AI开发平台ModelArts

Eagle投机小模型训练 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线