搜索_华为云

使用AWQ量化 - AI开发平台ModelArts

model：模型路径。 Step4 启动AWQ量化服务参考部署推理服务，使用量化后权重部署AWQ量化服务。注：Step3 创建服务启动脚本启动脚本中，服务启动命令需添加如下命令。 -q awq 或者--quantization awq 父主题：推理模型量化

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
使用AWQ量化 - AI开发平台ModelArts

model：模型路径。 Step4 启动AWQ量化服务参考部署推理服务，使用量化后权重部署AWQ量化服务。注：Step3 创建服务启动脚本启动脚本中，服务启动命令需添加如下命令。 -q awq 或者--quantization awq 父主题：推理模型量化

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911） > 推理模型量化
从OBS中导入模型文件创建模型 - AI开发平台ModelArts

例。 3种探针的配置参数均为：检查方式：仅支持“HTTP请求检查”。健康检查URL：健康检查的URL固定为“/health”。健康检查周期（秒）：填写1-2147483647之前的整数，单位为秒。延迟时间（秒）：实例启动后，延迟执行健康检查的时间。填写0-2147483647之间的整数，单位为秒，不能为空。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型
自定义模型规范 - AI开发平台ModelArts

gallery_train文件列表文件类型文件说明 “train.py” 必选文件，训练脚本文件，定义了自定义模型的训练处理方式。代码示例请参见train.py示例。如果训练脚本里使用了其他脚本文件，则必须一起打包在gallery_train文件夹里上传，否则会导致微调失败。 “train_params

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery模型 > 构建模型
查看训练作业日志 - AI开发平台ModelArts

ma-pre-start脚本在与训练启动文件同级的目录下放置，命名为ma-pre-start.sh or ma-pre-start.py脚本。在训练启动文件被执行前，系统会在 /home/work/user-job-dir/ 目录下执行上述ma-pre-start脚本，使用该机制可以更新容器镜像内安装的Ascend

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
模型适配 - AI开发平台ModelArts
模型适配 - AI开发平台ModelArts

ost/work/runwayml/pytorch_models）。进入工作目录： cd /home_host/work 新建Python脚本文件“parse_models_shape.py”用于获取shape。其中，model_path是指上面下载的pytorch_models的路径。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导 > 应用迁移
创建训练作业 - AI开发平台ModelArts

InputData from modelarts.estimatorV2 import Estimator session = Session() #训练脚本里接收的参数，请根据实际情况填写 parameters = [{"name": "mod", "value":"gpu"},

帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业
执行训练任务 - AI开发平台ModelArts

如需其他配置参数，可参考表1按照实际需求修改。步骤三：启动训练脚本修改完yaml配置文件后，启动训练脚本。模型不同最少NPU卡数不同，NPU卡数建议值可参考表1。修改启动脚本demo.sh 进入代码目录{work_dir}/llm_train/LLaMAFactory下修改启动脚本，其中{work_dir}为容器挂载路径。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.911）
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

图1 购买ECS 创建镜像组织。在SWR服务页面创建镜像组织。图2 创建镜像组织安装Docker。检查docker是否安装。 docker -v #检查docker是否安装如尚未安装，运行以下命令安装docker。 yum install -y docker 配

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.907） > 准备工作
使用ModelArts Standard一键完成商超商品识别模型部署 - AI开发平台ModelArts

品），并给出置信度最高的5类商品的置信度得分。步骤1：准备工作已注册华为账号并开通华为云，进行了实名认证，且在使用ModelArts前检查账号状态，账号不能处于欠费或冻结状态。注册华为账号并开通华为云进行实名认证配置委托访问授权 ModelArts使用过程中涉及到OBS

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例
ModelArts中提示OBS路径错误 - AI开发平台ModelArts

称进入概览页。在左侧菜单栏选择“访问权限控制>桶ACLs”，检查当前账号是否具备读写权限，如果没有权限，请联系桶的拥有者配置权限。在左侧菜单栏选择“访问权限控制>桶策略”，检查当前OBS桶是否允许子用户访问。检查训练作业的代码目录和启动文件地址进入ModelArts管理控制台，在“作业管理

 帮助中心 > AI开发平台ModelArts > 故障排除 > 通用问题
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

# 样例yaml配置文件 |──demo.sh # 指令微调启动shell脚本 |──intall.sh # 需要的依赖包 |──LLaMA-Factory

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.908） > 准备工作
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

# 样例yaml配置文件 |──demo.sh # 指令微调启动shell脚本 |──intall.sh # 需要的依赖包 |──LLaMA-Factory

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.907） > 准备工作
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

# 样例yaml配置文件 |──demo.sh # 指令微调启动shell脚本 |──intall.sh # 需要的依赖包 |──LLaMA-Factory

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.910） > 准备工作
训练作业使用MoXing复制数据较慢，重复打印日志 - AI开发平台ModelArts

如果文件较小，可以将OBS上的数据保存成“.tar”包。训练开始时从OBS上下载到“/cache”目录，解压以后使用。如果文件较大，可以保存成多个“.tar”包，在入口脚本中调用多进程进行并行解压数据。不建议把散文件保存到OBS上，这样会导致下载数据很慢。在训练作业中，使用如下代码进行“.tar”包解压： import

帮助中心 > AI开发平台ModelArts > 故障排除 > MoXing
批量服务输入/输出obs目录不存在或者权限不足 - AI开发平台ModelArts

3567：使用的数据输入或者输出obs目录存在，但是当前账号无权限访问处理方法 ModelArts.3551：到obs检查输入数据目录是否存在，如果不存在，请按照实际需要创建obs目录；如果检查发现目录存在，但依然报同样的错，可以提工单申请技术支持 ModelArts.3567：用户只能访问自己

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
Lite Server资源开通 - AI开发平台ModelArts

择已有RoCE网络即可（不支持重复创建）。安全组安全组是一个逻辑上的分组，为同一个VPC内具有相同安全保护需求并相互信任的Server提供访问策略。表6 管理参数说明参数名称说明登录凭证 “密钥对”方式创建的裸金属服务器安全性更高，建议选择“密钥对”方式。如果您习惯使

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server）
使用基础镜像 - AI开发平台ModelArts

transformers==4.45.0 修改为：transformers==4.44.2 以创建llama2-13b预训练作业为例，执行脚本0_pl_pretrain_13b.sh时，命令如下： cd /home/ma-user/work/llm_train/AscendSpeed;

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.910） > 准备工作 > 准备镜像
（可选）Session鉴权 - AI开发平台ModelArts

session import Session # 认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全； # 本示例以password保存在环境变量中来实现身份验证为例，运行本示例前请先在本地环境中设置环境变

 帮助中心 > AI开发平台ModelArts > SDK参考 > Session鉴权
查看ModelArts模型详情 - AI开发平台ModelArts

存活探针失败，即应用程序不健康，将会自动重启实例。每种探针下会显示以下字段：检查方式、健康检查URL（检查方式为“HTTP请求检查”时显示）、健康检查命令（检查方式为“执行命令检查”时显示）、健康检查周期、延迟时间、超时时间、最大失败次数。模型说明显示创建模型时添加的模型说明文档信息。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理ModelArts模型

总条数： 968

上一页
1
...
35
36
37
...
49
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用AWQ量化 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

从OBS中导入模型文件创建模型 - AI开发平台ModelArts

自定义模型规范 - AI开发平台ModelArts

查看训练作业日志 - AI开发平台ModelArts

模型适配 - AI开发平台ModelArts

创建训练作业 - AI开发平台ModelArts

执行训练任务 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

使用ModelArts Standard一键完成商超商品识别模型部署 - AI开发平台ModelArts

ModelArts中提示OBS路径错误 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

训练作业使用MoXing复制数据较慢，重复打印日志 - AI开发平台ModelArts

批量服务输入/输出obs目录不存在或者权限不足 - AI开发平台ModelArts

Lite Server资源开通 - AI开发平台ModelArts

使用基础镜像 - AI开发平台ModelArts

（可选）Session鉴权 - AI开发平台ModelArts

查看ModelArts模型详情 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线