搜索_华为云

使用GPTQ量化 - AI开发平台ModelArts

"bits": 8, "group_size": -1, "desc_act": false } 2. 启动vLLM，如果是使用命令行的方式，指定--quantization "gptq"参数，其他参数请参考Step3 创建服务启动脚本 python -m vllm.entrypoints

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911） > 推理模型量化
查询API - AI开发平台ModelArts
查询API - AI开发平台ModelArts

AuthTypeApiBasicInfo 参数参数类型描述 api_id String API编号。 api_method String 请求方式包含GET、POST、PUT、DELETE、HEAD、PATCH、OPTIONS、ANY，固定返回ANY。 api_name String

帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理
附录：工作负载Pod异常问题和解决方法 - AI开发平台ModelArts

通过打印所有Pod的信息，并找到命名有scheduler字段的Pod。 kubectl get pod -A -o wide 重启该Pod，通过delete的方式删除，但随后会自动重新启动。 kubectl delete pod -n kube-system ${pod_scheduler_name}

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911）
开发环境中不同Notebook规格资源“/cache”目录的大小 - AI开发平台ModelArts

映射规则：当前不支持CPU配置cache盘；GPU与昇腾资源为单卡时，cache目录保持500G大小限制；除单卡外，cache盘大小与卡数有关，计算方式为卡数*500G，上限为3T。详细表1所示。表1 不同Notebook规格资源“/cache”目录的大小规格类别 cache盘大小 GPU-0

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > 更多功能咨询
附录：工作负载Pod异常问题和解决方法 - AI开发平台ModelArts

通过打印所有Pod的信息，并找到命名有scheduler字段的Pod。 kubectl get pod -A -o wide 重启该Pod，通过delete的方式删除，但随后会自动重新启动。 kubectl delete pod -n kube-system ${pod_scheduler_name}

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909）
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

准备数据集，例如根据Alpaca数据部分给出的预训练数据集、SFT全参微调训练、LoRA微调训练数据集下载链接下载数据集。可通过两种方式，将数据集上传至SFS Turbo中。方式一：将下载的原始数据通过SSH直接上传至SFS Turbo中。具体步骤如下：进入到/mnt/sfs_turbo/目

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.910） > 准备工作
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

准备数据集，例如根据Alpaca数据部分给出的预训练数据集、SFT全参微调训练、LoRA微调训练数据集下载链接下载数据集。可通过两种方式，将数据集上传至SFS Turbo中。方式一：将下载的原始数据通过SSH直接上传至SFS Turbo中。具体步骤如下：进入到/mnt/sfs_turbo/目

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.908） > 准备工作
发布免费模型 - AI开发平台ModelArts

在“资产版本”填写新的版本号。发布HiLens技能表1 发布HiLens技能的参数说明参数说明资产分类选择“模型”。发布方式发布方式选择“创建新资产”。资产标题在AI Gallery显示的资产名称，建议按照您的实现目的设置。来源选择“HiLens”。 HiLens区域

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（旧版） > 发布分享
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

准备数据集，例如根据Alpaca数据部分给出的预训练数据集、SFT全参微调训练、LoRA微调训练数据集下载链接下载数据集。可通过两种方式，将数据集上传至SFS Turbo中。方式一：将下载的原始数据通过SSH直接上传至SFS Turbo中。具体步骤如下：进入到/mnt/sfs_turbo/目

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.909） > 准备工作
查询数据集的标注任务列表 - AI开发平台ModelArts

排序字段。可选值如下： create_time：根据创建时间排序 task_name：根据任务名称进行排序 sort_dir 否 String 排序方式。可选值如下： asc：按照升序排序 desc：默认值，按照降序排序父主题：标注任务管理

 帮助中心 > AI开发平台ModelArts > SDK参考 > 数据管理 > 标注任务管理
迁移适配 - AI开发平台ModelArts
迁移适配 - AI开发平台ModelArts

OME} 需要根据数据集模型等路径做对应替换，这里脚本适配的数据集是Firefly，其中deepspeed使用了zero 1显存优化方式，配置方式如下： { "fp16": { "enabled": "auto", "loss_scale":

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于LLM模型的GPU训练业务迁移至昇腾指导
创建网络资源 - AI开发平台ModelArts

参数类型描述 peerConnectionList 否 Array of peerConnectionList objects Peer方式打通网络列表。表7 peerConnectionList 参数是否必选参数类型描述 peerVpcId 是 String 对端的VPC

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
在推理生产环境中部署推理服务 - AI开发平台ModelArts

SSL证书制作包含cert.pem和key.pem，需自行生成。生成方式请参见•通过openssl创建SSLpem证书。图1 准备模型文件和权重文件创建推理脚本文件run_vllm.sh run_vllm.sh脚本示例如下。方式一：通过OpenAI服务API接口启动服务（1）非多模态

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908）
工作负载Pod异常 - AI开发平台ModelArts

通过打印所有Pod的信息，并找到命名有scheduler字段的Pod。 kubectl get pod -A -o wide 重启该Pod，通过delete的方式删除，但随后会自动重新启动。 kubectl delete pod -n kube-system ${pod_scheduler_name}

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU训练指导（6.3.910） > 常见错误原因和解决方法
工作负载Pod异常 - AI开发平台ModelArts

通过打印所有Pod的信息，并找到命名有scheduler字段的Pod。 kubectl get pod -A -o wide 重启该Pod，通过delete的方式删除，但随后会自动重新启动。 kubectl delete pod -n kube-system ${pod_scheduler_name}

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU训练指导（6.3.911） > 常见错误原因和解决方法
训练作业进程被kill - AI开发平台ModelArts

根据规格情况合理使用数据盘，数据盘大小请参考训练环境中不同规格资源大小。 CPU过载减少线程数。排查办法根据错误信息判断，报错原因来源于用户代码。您可以通过以下两种方式排查：线上环境调试代码（仅适用于非分布式代码）在开发环境（notebook）申请相同规格的开发环境实例。在notebook调试用户代码，并找出问题的代码段。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
数据保护技术 - AI开发平台ModelArts

allery的资产在上传过程中，有可能会因为网络劫持、数据缓存等原因，存在数据不一致的问题。ModelArts提供通过计算SHA256值的方式对上传下载的数据进行一致性校验。数据隔离机制在ModelArts的开发环境中创建Notebook实例时，数据存储是按照租户隔离，租户之间互相看不到数据。

帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
部署服务 - AI开发平台ModelArts
部署服务 - AI开发平台ModelArts

络资源。 config 是 Array of ServiceConfig objects 模型运行配置，当推理方式为batch/edge时仅支持配置一个模型；当推理方式为real-time时，可根据业务需要配置多个模型并分配权重，但多个模型的版本号不能相同。 additional_properties

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
添加图片时，图片大小有限制吗？ - AI开发平台ModelArts

图片大小限制不同，要求上传的图片大小不超过5MB。解决方案：方法1：使用导入功能。将图片上传至OBS任意目录，通过“从OBS目录导入”方式导入到已有数据集。方法2：使用同步数据源功能。将图片上传到数据集输入目录下（或者其子目录），单击数据集详情页中的“同步数据源”将新增图片

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard数据管理
使用ModelArts时提示“权限不足”，如何解决？ - AI开发平台ModelArts

定义策略操作和参数说明请参见创建自定义策略。目前华为云支持可视化视图创建自定义策略和JSON视图创建自定义策略，本章节将使用JSON视图方式的策略，以为ModelArts用户授予开发环境的使用权限并且配置ModelArts用户OBS相关的最小化权限项为例，指导您进行自定义策略配置。

帮助中心 > AI开发平台ModelArts > 常见问题 > 一般性问题

总条数： 745

上一页
1
...
20
21
22
...
38
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用GPTQ量化 - AI开发平台ModelArts

查询API - AI开发平台ModelArts

附录：工作负载Pod异常问题和解决方法 - AI开发平台ModelArts

开发环境中不同Notebook规格资源“/cache”目录的大小 - AI开发平台ModelArts

附录：工作负载Pod异常问题和解决方法 - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

发布免费模型 - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

查询数据集的标注任务列表 - AI开发平台ModelArts

迁移适配 - AI开发平台ModelArts

创建网络资源 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

工作负载Pod异常 - AI开发平台ModelArts

工作负载Pod异常 - AI开发平台ModelArts

训练作业进程被kill - AI开发平台ModelArts

数据保护技术 - AI开发平台ModelArts

部署服务 - AI开发平台ModelArts

添加图片时，图片大小有限制吗？ - AI开发平台ModelArts

使用ModelArts时提示“权限不足”，如何解决？ - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线