搜索_华为云

训练中的权重转换说明 - AI开发平台ModelArts

--target-tensor-parallel-size：任务不同调整参数target-tensor-parallel-size，默认为1。 --target-pipeline-parallel-size ：任务不同调整参数target-pipeline-parallel-size，默认为1。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU训练指导（6.3.905） > 训练脚本说明
训练的权重转换说明 - AI开发平台ModelArts

--target-tensor-parallel-size：任务不同调整参数target-tensor-parallel-size，默认为1。 --target-pipeline-parallel-size ：任务不同调整参数target-pipeline-parallel-size，默认为1。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.905） > 训练脚本说明
分析ModelArts数据集中的数据特征 - AI开发平台ModelArts

分析。只有发布后的数据集支持数据特征分析。发布后的Default格式数据集版本支持数据特征分析。数据特征分析的数据范围，不同类型的数据集，选取范围不同：对于标注任务类型为“物体检测”的数据集版本，当已标注样本数为0时，发布版本后，数据特征页签版本置灰不可选，无法显示数据特征。否则，显示已标注的图片的数据特征。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理
使用AWQ量化 - AI开发平台ModelArts

使用AWQ量化 AWQ(W4A16/W8A16)量化方案能显著降低模型显存以及需要部署的卡数。降低小batch下的增量推理时延。支持AWQ量化的模型列表请参见表3。本章节介绍如何使用AWQ量化工具实现推理量化。量化方法：W4A16 per-group/per-channel,

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.908） > 推理模型量化
日志提示"write line error" - AI开发平台ModelArts

size”，默认是10G，云上统一改为50G。 “/cache”目录满了，一般是3.5T存储空间满了，具体规格的空间大小可参见训练环境中不同规格资源“/cache”目录的大小。处理方法如果在训练作业的工作目录下有core文件生成，可以在启动脚本最前面加上如下代码，来关闭core文件产生。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 硬盘限制故障
Function Calling介绍 - AI开发平台ModelArts

Calling可以调用外部工具或服务，例如实时数据检索、文件处理、数据库查询等，从而扩展其能力。实时数据访问由于大模型通常基于静态数据集训练，不具备实时信息。Function Calling允许模型访问最新的数据，提供更准确、更及时的回答。提高准确性在需要精确计算或特定领域知识时，大模型

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio） > 通过Function Calling扩展大语言模型交互能力
使用AWQ量化工具转换权重 - AI开发平台ModelArts

使用AWQ量化工具转换权重 AWQ(W4A16/W8A16)量化方案能显著降低模型显存以及需要部署的卡数。降低小batch下的增量推理时延。支持AWQ量化的模型列表请参见支持的模型列表和权重文件。本章节介绍如何在Notebook使用AWQ量化工具实现推理量化。量化方法：W4A16

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910） > 推理模型量化
查询服务详情 - AI开发平台ModelArts

error_msg String 错误信息，当status为failed时，返回注明部署失败原因。 config 不同infer_type的config结构数组不同infer_type的config结构数组服务配置（如果是共享过来的服务，只返回model_id ，model_name，model_version）

帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
训练中的权重转换说明 - AI开发平台ModelArts

--target-tensor-parallel-size：任务不同调整参数target-tensor-parallel-size，默认为1。 --target-pipeline-parallel-size ：任务不同调整参数target-pipeline-parallel-size，默认为1。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.910） > 训练脚本说明
训练中的权重转换说明 - AI开发平台ModelArts

--target-tensor-parallel-size：任务不同调整参数target-tensor-parallel-size，默认为1。 --target-pipeline-parallel-size ：任务不同调整参数target-pipeline-parallel-size，默认为1。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.911） > 训练脚本说明
配置Workflow参数 - AI开发平台ModelArts

参数默认值，数据类型需要与placeholder_type一致。否 Any placeholder_format 支持的format格式数据，当前支持obs、flavor、train_flavor、swr、pacific。否 str delay 参数是否运行时输入，默认为“False”，在工

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考
训练中的权重转换说明 - AI开发平台ModelArts

--target-tensor-parallel-size：任务不同调整参数target-tensor-parallel-size，默认为1。 --target-pipeline-parallel-size ：任务不同调整参数target-pipeline-parallel-size，默认为1。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.909） > 训练脚本说明
增量模型训练 - AI开发平台ModelArts

能力，而不需要从头开始。增量训练不需要一次性存储所有的训练数据，缓解了存储资源有限的问题；另一方面，增量训练节约了重新训练中需要消耗大量算力、时间以及经济成本。增量训练特别适用于以下情况：数据流更新：在实际应用中，数据可能会持续更新，增量训练允许模型适应新的数据而不必重新训练。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型
SD3 Diffusers框架基于Lite Server适配PyTorch NPU推理指导（6.3.907） - AI开发平台ModelArts

驱动23.0.6 从SWR拉取不同软件版本对应的基础镜像地址不同，请严格按照软件版本和镜像配套关系获取基础镜像。 Step1 检查环境请参考Lite Server资源开通，购买Lite Server资源，并确保机器已开通，密码已获取，能通过SSH登录，不同机器之间网络互通。购买Lite

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理
查询服务列表 - AI开发平台ModelArts

service_name 否 String 服务名称，默认不过滤服务名。 infer_type 否 String 推理方式，取值为：real-time/batch/edge，默认不过滤推理方式。 offset 否 Integer 分页列表的起始页，默认为：“0”。 limit 否 Integer

帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
自动化脚本快速部署推理服务（推荐） - AI开发平台ModelArts

根据实际值更新rank_table_file.json 启动容器进入容器启动服务前提条件已经完成资源购买。请确保多机之间能够正常通信。请确保每台机器都能访问到西南-贵阳一SWR镜像仓库。约束限制脚本中的镜像是在西南-贵阳一区域，建议在西南-贵阳一区域上部署推理服务。脚本默认只支持在标准的欧拉或HCE

帮助中心 > AI开发平台ModelArts > 最佳实践 > DeepSeek系列模型推理 > DeepSeek模型基于ModelArts Lite Server适配MindIE推理部署指导 > 部署推理服务
在ModelArts中1个节点的专属资源池，能否部署多个服务？ - AI开发平台ModelArts

规格”时选择“自定义规格”，设置小一些或者选择小规格的服务节点规格，当资源池节点可以容纳多个服务节点规格时，就可以部署多个服务。如果使用此方式进行部署推理，选择的规格务必满足模型的要求，当设置的规格过小，无法满足模型的最小推理要求时，则会出现部署失败或预测失败的情况。图1 设置自定义规格

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard专属资源池
华为云CCE集群纳管GPU裸金属服务器由于CloudInit导致纳管失败的解决方案 - AI开发平台ModelArts

断已经执行过一次，进而不会再执行user-data里面的脚本。而使用该镜像的服务器B和C，由于实例ID信息和镜像中残留的服务器A实例ID不同，就会执行user-data，所以CCE能纳管成功。处理方法制作镜像前，清理“/var/lib/cloud/”目录下的所有信息，请参考

 帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
如何减小本地或ECS构建镜像的目的镜像的大小？ - AI开发平台ModelArts

此外下面举出几种常见的减少镜像大小的方式。减少目的镜像层数举例：假设需要安装两个pip包six，numpy，将安装放到同一层，而不是放到不同层：正确方式： RUN pip install six &&\ pip install numpy 不宜方式： RUN pip install

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard镜像相关
创建训练任务 - AI开发平台ModelArts

训练作业创建完成后，后台将自动完成容器镜像下载、代码目录下载、执行启动命令等动作。训练作业一般需要运行一段时间，根据您的训练业务逻辑和选择的资源不同，训练时长将持续几十分钟到几小时不等。训练作业执行成功后，日志信息如下所示。父主题：单机多卡

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 单机多卡

总条数： 1170

上一页
1
...
50
51
52
...
59
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

训练中的权重转换说明 - AI开发平台ModelArts

训练的权重转换说明 - AI开发平台ModelArts

分析ModelArts数据集中的数据特征 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

日志提示"write line error" - AI开发平台ModelArts

Function Calling介绍 - AI开发平台ModelArts

使用AWQ量化工具转换权重 - AI开发平台ModelArts

查询服务详情 - AI开发平台ModelArts

训练中的权重转换说明 - AI开发平台ModelArts

训练中的权重转换说明 - AI开发平台ModelArts

配置Workflow参数 - AI开发平台ModelArts

训练中的权重转换说明 - AI开发平台ModelArts

增量模型训练 - AI开发平台ModelArts

SD3 Diffusers框架基于Lite Server适配PyTorch NPU推理指导（6.3.907） - AI开发平台ModelArts

查询服务列表 - AI开发平台ModelArts

自动化脚本快速部署推理服务（推荐） - AI开发平台ModelArts

在ModelArts中1个节点的专属资源池，能否部署多个服务？ - AI开发平台ModelArts

华为云CCE集群纳管GPU裸金属服务器由于CloudInit导致纳管失败的解决方案 - AI开发平台ModelArts

如何减小本地或ECS构建镜像的目的镜像的大小？ - AI开发平台ModelArts

创建训练任务 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线