搜索_华为云

场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

co/meta-llama/Meta-Llama-3.1-70B-Instruct 说明：当前版本中yi-34b、qwen1.5-32b模型暂不支持单卡启动。操作流程图1 操作流程图表2 操作任务流程说明阶段任务说明准备工作准备资源本教程案例是基于ModelArts

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907）
推理性能测试 - AI开发平台ModelArts

py # 执行静态、动态性能评测脚本 ├── requirements.txt # 第三方依赖目前性能测试还不支持投机推理能力。静态benchmark验证本章节介绍如何进行静态benchmark验证。已经上传benchmark验证脚本到推理容器中。如果在Step5

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.906）
使用MaaS压缩模型 - AI开发平台ModelArts

大并发量的场景 AWQ-W4A16 小并发量的低时延场景更少推理卡数部署的场景约束限制表2列举了支持模型压缩的模型，不在表格里的模型不支持使用MaaS压缩模型。表2 支持模型压缩的模型模型名称 SmoothQuant-W8A8 AWQ-W4A16 Llama2-13B √

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
终止训练作业 - AI开发平台ModelArts

FlavorInfoResponse 参数参数类型描述 max_num Integer 可以选择的最大节点数量（max_num，为1代表不支持分布式）。 cpu Cpu object cpu规格信息。 gpu Gpu object gpu规格信息。 npu Npu object Ascend规格信息。

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

llava-hf/llava-v1.6-34b-hf at main (huggingface.co) 说明：当前版本中yi-34b、qwen1.5-32b模型暂不支持单卡启动，glm4-9b模型仅支持单卡启动。操作流程图1 操作流程图表2 操作任务流程说明阶段任务说明准备工作准备资源本教程案例是基于ModelArts

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908）
Lite Cluster资源开通 - AI开发平台ModelArts

码后的脚本，转码后的字符数不能超过2048。脚本将在Kubernetes软件安装后执行，不影响Kubernetes软件安装。说明：暂不支持资源池中的存量节点池修改名称。请不要在安装后执行脚本中使用reboot命令立即重启，如果需要重启，可以使用“shutdown -r 1”命令延迟1分钟重启。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster）
创建ModelArts数据校验任务 - AI开发平台ModelArts

ModelArts的数据校验通过MetaValidation算子实现。当前ModelArts支持jpg、jpeg、bmp、png四种图片格式。物体检测场景支持xml标注格式，不支持“非矩形框”标注。针对您提供的数据集，MetaValidation算子支持对图片和xml文件进行数据校验：表1 图片类数据校验异常情况

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 处理ModelArts数据集中的数据
查询训练作业详情 - AI开发平台ModelArts

FlavorInfoResponse 参数参数类型描述 max_num Integer 可以选择的最大节点数量（max_num，为1代表不支持分布式）。 cpu Cpu object cpu规格信息。 gpu Gpu object gpu规格信息。 npu Npu object Ascend规格信息。

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
查询数据集导出任务的状态 - AI开发平台ModelArts

parent_sample_id String 父样本ID。 sample_dir String 根据样本所在目录搜索（目录需要以/结尾），只搜索指定目录下的样本，不支持目录递归搜索。 sample_name String 根据样本名称搜索（含后缀名）。 sample_time String 样本加入到数据

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
推理性能测试 - AI开发平台ModelArts

py # 执行静态、动态性能评测脚本 ├── requirements.txt # 第三方依赖目前性能测试还不支持投机推理能力。静态benchmark验证本章节介绍如何进行静态benchmark验证。已经上传benchmark验证脚本到推理容器中。如果在Step4

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.907）
训练迁移快速入门案例 - AI开发平台ModelArts

但并不是所有行为和GPU上是一一对应的。例如在torch_npu下，当PyTorch版本低于2.1.0时，一个进程只能操作一张昇腾卡，不支持一个进程操作多卡的能力；在PyTorch2.1.0及以上版本中torch_npu才支持一个进程中使用多张昇腾卡。基于PyTorch上的第

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导
发布免费模型 - AI开发平台ModelArts

“仅自己可见”：表示只有当前账号可以查看并使用该资产。公开权限只支持权限的扩大，权限从小到大为“仅自己可见<指定用户<公开”。所以如果一开始创建的是公开模型，将不支持修改“谁可以看”。 “时长限制”（ModelArts模型）或“路数限制”（HiLens技能）可以选择“不启用”或“启用”。当启用时，可以设

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（旧版） > 发布分享
查询训练作业详情 - AI开发平台ModelArts

计费卡数。表36 flavor_info 参数参数类型描述 max_num Integer 可以选择的最大节点数量（max_num，为1代表不支持分布式）。 cpu cpu object cpu规格信息。 gpu gpu object gpu规格信息。 npu npu object Ascend规格信息。

帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业
终止训练作业 - AI开发平台ModelArts

计费卡数。表36 flavor_info 参数参数类型描述 max_num Integer 可以选择的最大节点数量（max_num，为1代表不支持分布式）。 cpu cpu object cpu规格信息。 gpu gpu object gpu规格信息。 npu npu object Ascend规格信息。

帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业
创建数据集 - AI开发平台ModelArts

数据集输入位置，用于将此目录及子目录下的源数据(如图片/文件/音频等)同步到数据集。对于表格数据集，该参数为导入目录。表格数据集的工作目录不支持为KMS加密桶下的OBS路径。 work_path 是表6 数据集输出位置，用于存放输出的标注信息等文件。 labels 否 List of

帮助中心 > AI开发平台ModelArts > SDK参考 > 数据管理 > 数据集管理
LoRA微调训练 - AI开发平台ModelArts

手动修改训练参数和tokenizer文件，具体请参见训练tokenizer文件说明。由于模型中LoRA微调训练存在已知的精度问题，因此不支持TP(tensor model parallel size)张量模型并行策略，推荐使用PP(pipeline model parallel

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.907）
查询训练作业列表 - AI开发平台ModelArts

FlavorInfoResponse 参数参数类型描述 max_num Integer 可以选择的最大节点数量（max_num，为1代表不支持分布式）。 cpu Cpu object cpu规格信息。 gpu Gpu object gpu规格信息。 npu Npu object Ascend规格信息。

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
使用Gallery CLI配置工具下载文件 - AI开发平台ModelArts

repo_id”为“ur5468675/test_cli_model1”。图1 复制完整资产名称如果资产详情页没有按钮，则表示该资产不支持使用Gallery CLI配置工具下载文件。获取待下载的文件名在AI Gallery页面的资产详情页，如果是模型资产，则选择“模型文件

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > Gallery CLI配置工具指南
基于MaaS DeepSeek API和Dify快速构建网站智能客服 - AI开发平台ModelArts

ruct-1128、Qwen2_5-72B-32K-1128可以配置Function calling为“Tool Call”，其余服务暂不支持。步骤三：在Dify中创建客服机器人如果想让智能客服能够基于企业内部的知识文档进行问答，可以在Dify中创建一个知识库。Dify能够协助进行数据的分段和清理工作。

帮助中心 > AI开发平台ModelArts > 最佳实践 > DeepSeek系列模型推理
性能调优 - AI开发平台ModelArts
性能调优 - AI开发平台ModelArts

其在CPU和Ascend上的实现方法存在差异（硬件结构不同），后者在运算此类算子时涉及到数组的重排，性能较差；模型的部分算子在昇腾上不支持，或者存在Transpose操作，会导致模型切分为多个子图，整体的推理耗时随着子图数量的增多而增长；模型没有真正的调用昇腾后端，而是自动

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导

总条数： 1333

上一页
1
...
15
16
17
...
67
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

场景介绍 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

使用MaaS压缩模型 - AI开发平台ModelArts

终止训练作业 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

Lite Cluster资源开通 - AI开发平台ModelArts

创建ModelArts数据校验任务 - AI开发平台ModelArts

查询训练作业详情 - AI开发平台ModelArts

查询数据集导出任务的状态 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

训练迁移快速入门案例 - AI开发平台ModelArts

发布免费模型 - AI开发平台ModelArts

查询训练作业详情 - AI开发平台ModelArts

终止训练作业 - AI开发平台ModelArts

创建数据集 - AI开发平台ModelArts

LoRA微调训练 - AI开发平台ModelArts

查询训练作业列表 - AI开发平台ModelArts

使用Gallery CLI配置工具下载文件 - AI开发平台ModelArts

基于MaaS DeepSeek API和Dify快速构建网站智能客服 - AI开发平台ModelArts

性能调优 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线