搜索_华为云

裸金属服务器Euler OS升级NetworkManager-config-server导致SSH链接故障解决方案 - AI开发平台ModelArts

致ip获取不到，从而使得SSH连接失败。处理方法在Euler2.8操作系统，NetworkManagre-config-server是一个无用的软件包，无需安装。执行以下命令卸载NetworkManagre-config-server，并重启NetworkManager服务

 帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
使用AWQ量化工具转换权重 - AI开发平台ModelArts

可以在Huggingface开源社区获取AWQ量化后的模型权重；或者获取FP16/BF16的模型权重之后，通过autoAWQ工具进行量化。方式一：从开源社区下载发布的AWQ量化模型。 https://huggingface.co/models?sort=trending&search=QWEN+AWQ

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906） > 推理模型量化
训练性能测试 - AI开发平台ModelArts

8192-lora、full-8k：8192-full】 --master_addr <master_addr>：主master节点IP，一般选rank0为主master。 --num_nodes <nodes>：训练节点总个数 --rank <rank>：节点ID 训练完成后，

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.911） > 训练benchmark工具
推理场景介绍 - AI开发平台ModelArts

本文档适配昇腾云ModelArts 6.3.911版本，请参考软件配套版本获取配套版本的软件包，请严格遵照版本配套关系使用本文档。资源规格推荐使用“西南-贵阳一”Region上的Lite k8s Cluster和昇腾Snt9B资源。本文档中的CCE集群版本选择v1.27~1.28。版本使用的容器引擎为Containerd。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911）
查询数据集导出任务的状态 - AI开发平台ModelArts

Array of SearchLabel objects 标签搜索条件列表。 op String 如要搜索多个标签，则op需要有值；如果只搜索一个标签，则无需指定op的值。可选值如下： OR：或操作 AND：与操作表6 SearchLabel 参数参数类型描述 name String

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
查询训练作业版本列表 - AI开发平台ModelArts

job_id 是 Long 训练作业的ID。表2 Query参数参数是否必选参数类型说明 per_page 否 Integer 指定每一页展示作业参数的总量，默认为10，“per_page”可选的范围为[1，1000]。 page 否 Integer 指定要查询页的索引。如

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
更新算法 - AI开发平台ModelArts
更新算法 - AI开发平台ModelArts

算法的代码目录。如：“/usr/app/”。应与boot_file一同出现。 boot_file 否 String 算法的代码启动文件，需要在代码目录下。如：“/usr/app/boot.py”。应与code_dir一同出现。 command 否 String 自定义镜像算法的容器启动命令。

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
分布式训练功能介绍 - AI开发平台ModelArts

不同的AI框架之间，整体流程是完全相同的，只需要修改个别的参数即可。 DataParallel进行单机多卡训练的优缺点代码简单：仅需修改一行代码。通信瓶颈：负责reducer的GPU更新模型参数后分发到不同的GPU，因此有较大的通信开销。 GPU负载不均衡：负责reduce

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 分布式模型训练
查询工作空间配额 - AI开发平台ModelArts

Integer 最后修改时间，UTC。如用户未修改过该资源配额,则该值默认为该工作空间的创建时间。 resource String 资源的唯一标识。 quota Integer 当前配额值。配额值为-1代表不限制配额。 min_quota Integer 配额允许设置的最小值。 name_cn

帮助中心 > AI开发平台ModelArts > API参考 > 工作空间管理
SFT全参微调训练 - AI开发平台ModelArts

选择用户自己的专属资源池，以及规格与节点数。本次qwenvl模型选用 8* ascend-snt9b。图5 选择资源池规格在OBS中新建一个log目录，作业日志选择OBS中的该路径，训练作业的日志信息则保存该路径下。最后，提交训练作业，训练完成后，请参考查看日志和性能章节查看

 帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.912）
查询所有团队的标注成员列表 - AI开发平台ModelArts

用户项目ID。获取方法请参见获取项目ID和名称。表2 Query参数参数是否必选参数类型描述 limit 否 Integer 指定每一页返回的最大条目数，取值范围[1,100]，默认为10。 offset 否 Integer 分页列表的起始页，默认为0。 order 否 String

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
LoRA微调训练 - AI开发平台ModelArts

选择用户自己的专属资源池，以及规格与节点数。本次qwenvl模型选用 8* ascend-snt9b。图5 选择资源池规格在OBS中新建一个log目录，作业日志选择OBS中的该路径，训练作业的日志信息则保存该路径下。最后，提交训练作业，训练完成后，请参考查看日志和性能章节查看

 帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.912）
昇腾云服务6.3.909版本说明 - AI开发平台ModelArts

和支持的特性能力。当前版本仅适用于华为公有云。配套的基础镜像芯片镜像地址获取方式镜像软件说明配套关系 Snt9B 西南-贵阳一 PyTorch： swr.cn-southwest-2.myhuaweicloud.com/atelier/pytorch_2_1_ascend:pytorch_2

帮助中心 > AI开发平台ModelArts > 服务公告 > 产品发布说明
准备镜像环境 - AI开发平台ModelArts

diffusers-train:0.0.1 bash 参数说明： --name ${container_name}：容器名称，进入容器时会用到，此处可以自己定义一个容器名称。 --device=/dev/davinci0，...， --device=/dev/davinci7：挂载NPU设备，fine

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理 > SD1.5&SDXL Diffusers框架基于DevServer适配PyTorch NPU训练指导（6.3.908）
推理场景介绍 - AI开发平台ModelArts

本文档适配昇腾云ModelArts 6.3.908版本，请参考软件配套版本获取配套版本的软件包，请严格遵照版本配套关系使用本文档。资源规格推荐使用“西南-贵阳一”Region上的Server和昇腾Snt9B资源。推理部署使用的服务框架是vLLM。vLLM支持v0.5.0版本。支持FP16和BF16数据类型推理。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.908）
自动学习/Workflow计费项 - AI开发平台ModelArts

综上，运行自动学习作业的费用 = 标准存储费用示例：使用公共资源池运行Workflow工作流。计费项：计算资源费用和标准存储费用假设用户于2023年4月1日创建了一个Workflow实例，并在10:00:00运行实例进行模型训练，在11:00:00进行服务部署，并在11:30:00停止运行。同时，使用公共资源池运行实例，资源池规格为CPU:

帮助中心 > AI开发平台ModelArts > 计费说明 > 计费项
实时同步用户所有DevServer实例状态 - AI开发平台ModelArts

排序的字段，多个字段使用(“,”)逗号分割。 offset 否 Integer 分页记录的起始位置偏移量。 limit 否 Integer 每一页的数量。请求参数无响应参数状态码：200 表3 响应Body参数参数参数类型描述 current Integer 当前页数。

帮助中心 > AI开发平台ModelArts > API参考 > DevServer管理
查询用户所有DevServer实例列表 - AI开发平台ModelArts

String 排序字段，枚举值如下： createTime：默认值，创建时间。 updateTime：更新时间。 limit 否 Integer 每一页的数量。 offset 否 Integer 分页记录的起始位置偏移量。请求参数无响应参数状态码：200 表3 响应Body参数参数

 帮助中心 > AI开发平台ModelArts > API参考 > DevServer管理
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

本案例仅支持在专属资源池上运行，确保专属资源池可以访问公网。文档更新内容 6.3.912版本相对于6.3.911版本新增如下内容：代码结构发生变化，统一了modellink和llama-factory的启动方式。继承911版本启动方式以外增加新的启动方式： ascendfactory-cli

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.912）
LLaVA-NeXT基于Lite Server适配PyTorch NPU训练微调指导（6.3.912） - AI开发平台ModelArts

912版本，请参考获取配套版本的软件包和镜像，请严格遵照版本配套关系使用本文档。确保容器可以访问公网。资源规格要求推荐使用“西南-贵阳一”Region上的Server资源和Ascend Snt9B。获取软件和镜像表1 获取软件和镜像分类名称获取路径插件代码包 AscendCloud-6

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理

总条数： 1453

上一页
1
...
66
67
68
...
73
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

裸金属服务器Euler OS升级NetworkManager-config-server导致SSH链接故障解决方案 - AI开发平台ModelArts

使用AWQ量化工具转换权重 - AI开发平台ModelArts

训练性能测试 - AI开发平台ModelArts

推理场景介绍 - AI开发平台ModelArts

查询数据集导出任务的状态 - AI开发平台ModelArts

查询训练作业版本列表 - AI开发平台ModelArts

更新算法 - AI开发平台ModelArts

分布式训练功能介绍 - AI开发平台ModelArts

查询工作空间配额 - AI开发平台ModelArts

SFT全参微调训练 - AI开发平台ModelArts

查询所有团队的标注成员列表 - AI开发平台ModelArts

LoRA微调训练 - AI开发平台ModelArts

昇腾云服务6.3.909版本说明 - AI开发平台ModelArts

准备镜像环境 - AI开发平台ModelArts

推理场景介绍 - AI开发平台ModelArts

自动学习/Workflow计费项 - AI开发平台ModelArts

实时同步用户所有DevServer实例状态 - AI开发平台ModelArts

查询用户所有DevServer实例列表 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

LLaVA-NeXT基于Lite Server适配PyTorch NPU训练微调指导（6.3.912） - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线