搜索_华为云

推理性能测试 - AI开发平台ModelArts

--benchmark-csv：结果保存文件，如benchmark_parallel.csv。 --served-model-name：选择性添加，在接口中使用的模型名；如果没有配置，则默认为tokenizer。脚本运行完成后，测试结果保存在benchmark_parallel

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.907）
剪枝 - AI开发平台ModelArts
剪枝 - AI开发平台ModelArts

剪枝是一种大模型压缩技术的关键技术，旨在保持推理精度的基础上，减少模型的复杂度和计算需求，以便大模型推理加速。剪枝的一般步骤是：1、对原始模型调用不同算法进行剪枝，并保存剪枝后的模型；2、使用剪枝后的模型进行推理部署。常用的剪枝技术包括：结构化稀疏剪枝、半结构化稀疏剪枝、非结构化稀疏剪枝。 FASP剪枝

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用
发布数据 - AI开发平台ModelArts
发布数据 - AI开发平台ModelArts

副标题。编辑完成之后单击“保存”。封面图和二级标题内容自动同步，您可以直接在资产详情页查看修改结果。图3 修改封面图和二级标题编辑许可证类型在发布的资产详情页面，单击右侧的“编辑”。在许可证类型右侧的下拉框中选择需要更新的许可证，单击“保存”完成修改。单击许可证类型后面的感叹号可以了解许可证详情。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（旧版） > 发布分享
使用SmoothQuant量化 - AI开发平台ModelArts

jsonl.zst。 --scale-output：量化系数保存路径。 --scale-input：量化系数输入路径，如果之前已生成过量化系数，则可指定该参数，跳过生成scale的过程。 --model-output：量化模型权重保存路径。 --smooth-strength：平滑系数，推荐先指定为0

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911） > 推理模型量化
自定义脚本代码示例 - AI开发平台ModelArts

') 保存模型（tf接口） 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 # 导出模型 # 模型需要采用saved_model接口保存 print('Exporting

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型规范参考
ModelArts Standard资源监控概述 - AI开发平台ModelArts

调用次数统计，具体参见查看推理服务详情章节。方式二：通过AOM查看所有监控指标 ModelArts Standard上报的所有监控指标都保存在AOM中，当ModelArts控制台可以查看的指标不满足诉求时，用户可以通过AOM服务提供的指标消费和使用的能力来查看指标。设置指标阈值

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源监控
常见问题 - AI开发平台ModelArts
常见问题 - AI开发平台ModelArts

1：表示dump图全量内容。 2：表示不dump权重数据的基础图。 3：表示只dump节点关系的精简图。 export DUMP_GRAPH_LEVEL=2 # 1：表示dump图所有图。 2：表示dump除子图外的所有图。 3：表示只dump最后一张图。问题分析。配置以上的环境

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导
查询所有Notebook实例列表 - AI开发平台ModelArts

INIT：初始化。 CREATING：镜像保存中，此时Notebook不可用。 CREATE_FAILED：镜像保存失败。 ERROR：错误。 DELETED：已删除。 ACTIVE：镜像保存成功，保存的镜像可以在SWR控制台查看，同时可以基于保存的镜像创建Notebook实例。 status_message

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
查询Notebook实例列表 - AI开发平台ModelArts

INIT：初始化。 CREATING：镜像保存中，此时Notebook不可用。 CREATE_FAILED：镜像保存失败。 ERROR：错误。 DELETED：已删除。 ACTIVE：镜像保存成功，保存的镜像可以在SWR控制台查看，同时可以基于保存的镜像创建Notebook实例。 status_message

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
执行训练任务【旧】 - AI开发平台ModelArts

已适配断点续训练。图2 开启故障重启断点续训练是通过checkpoint机制实现。checkpoint机制是在模型训练的过程中，不断地保存训练结果（包括但不限于EPOCH、模型权重、优化器状态、调度器状态）。即便模型训练中断，也可以基于checkpoint接续训练。当训练作

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.912） > 执行训练任务
（可选）Session鉴权 - AI开发平台ModelArts

认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全； # 本示例以password保存在环境变量中来实现身份验证为例，运行本示例前请先在本地环境中设置环境变量HUAWEICLOUD_SDK_PASSWORD。 __PASSWORD

帮助中心 > AI开发平台ModelArts > SDK参考 > Session鉴权
使用SmoothQuant量化 - AI开发平台ModelArts

jsonl.zst。 --scale-output：量化系数保存路径。 --scale-input：量化系数输入路径，若之前已生成过量化系数，则可指定该参数，跳过生成scale的过程。 --model-output：量化模型权重保存路径。 --smooth-strength：平滑系数，推荐先指定为0

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
使用SmoothQuant量化 - AI开发平台ModelArts

jsonl.zst。 --scale-output：量化系数保存路径。 --scale-input：量化系数输入路径，如果之前已生成过量化系数，则可指定该参数，跳过生成scale的过程。 --model-output：量化模型权重保存路径。 --smooth-strength：平滑系数，推荐先指定为0

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910） > 推理模型量化
查询开发环境实例列表 - AI开发平台ModelArts

启动后设置的自动停止时间，单位为秒。 store_time Integer 该规格实例处于非活跃状态，在数据库最长保存的时长。单位为小时。默认为“-1”, 表示可以无限制保存。 billing_flavor String 计费规格。当该字段为空时，使用规格名称计费。 billing_params

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 开发环境（旧版）
训练的数据集预处理说明 - AI开发平台ModelArts

process_data.sh 中的具体参数如下： --input：原始数据集的存放路径。 --output-prefix：处理后的数据集保存路径+数据集名称（例如：moss-003-sft-data）。 --tokenizer-type：tokenizer的类型，可选项有['B

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU训练指导（6.3.905） > 训练脚本说明
推理精度测试 - AI开发平台ModelArts

ss下面data目录。 model_name：评测模型名称，不需要与启动服务时的模型参数保持一致。 benchmark_type：作为一个保存log结果中的一个变量名，默认选eval。参考命令： vllm_path=vllm service_port=8080 max_out_len=16

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.907）
使用自动分组智能标注作业 - AI开发平台ModelArts

“分组数”：填写2~200之间的整数，指将图片分为多少组。 “结果处理方式”：“更新属性到当前样本中”，或者“保存到对象存储服务（OBS）”。 “属性名称”：当选择“更新属性到当前样本中”时，需输入一个属性名称。 “结果存储目录”：当选择“保存到对象存储服务（OBS）”时，需指定一个用于存储的OBS路径。 “高级特征

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 标注ModelArts数据集中的数据 > 通过智能标注方式标注数据
SDXL基于Standard适配PyTorch NPU的LoRA训练指导（6.3.908） - AI开发平台ModelArts

成。图7 训练启动成功 Step8 断点续训查看训练日志，在训练任务启动后，当训练超过500步后开始保存checkpoint文件，保存成功后，手动终止训练任务。图8 保存checkpoint文件然后单击重建后提交。图9 重建训练作业提交新的任务时，注意将预下载到本地目录勾上。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理
推理性能测试 - AI开发平台ModelArts

--benchmark-csv：结果保存文件，如benchmark_parallel.csv。 --served-model-name：选择性添加，在接口中使用的模型名；如果没有配置，则默认为tokenizer。脚本运行完成后，测试结果保存在benchmark_parallel

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.908）
推理精度测试 - AI开发平台ModelArts

ss下面data目录。 model_name：评测模型名称，不需要与启动服务时的模型参数保持一致。 benchmark_type：作为一个保存log结果中的一个变量名，默认选eval。参考命令： vllm_path=vllm service_port=8080 max_out_len=16

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907）

总条数： 742

上一页
1
...
11
12
13
...
38
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

推理性能测试 - AI开发平台ModelArts

剪枝 - AI开发平台ModelArts

发布数据 - AI开发平台ModelArts

使用SmoothQuant量化 - AI开发平台ModelArts

自定义脚本代码示例 - AI开发平台ModelArts

ModelArts Standard资源监控概述 - AI开发平台ModelArts

常见问题 - AI开发平台ModelArts

查询所有Notebook实例列表 - AI开发平台ModelArts

查询Notebook实例列表 - AI开发平台ModelArts

执行训练任务【旧】 - AI开发平台ModelArts

（可选）Session鉴权 - AI开发平台ModelArts

使用SmoothQuant量化 - AI开发平台ModelArts

使用SmoothQuant量化 - AI开发平台ModelArts

查询开发环境实例列表 - AI开发平台ModelArts

训练的数据集预处理说明 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

使用自动分组智能标注作业 - AI开发平台ModelArts

SDXL基于Standard适配PyTorch NPU的LoRA训练指导（6.3.908） - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线