搜索_华为云

查询团队标注任务详情 - AI开发平台ModelArts

在分发待标注文件，owner/manager/labeler/reviewer可见任务列表，但任务未分配完成，无法同时再启动任务。 1：运行中。labeler/reviewer进行标注和审核工作，owner验收，如新增、同步智能标注、导入未标注文件需再次分发新增文件。 2：验收中

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
查询资源实时利用率 - AI开发平台ModelArts

表6 Capacity 参数参数类型描述 value Value object 资源量。 maxValue Value object 最大弹性资源量。 timestamp String UTC时间，格式yyyy-MM-dd'T'HH:mm:ss'Z'。 window String

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
数据管理权限 - AI开发平台ModelArts

/{label_name} modelarts:dataset:updateDataset - √ √ 按标签名称删除标签及仅包含此标签的文件 DELETE /v2/{project_id}/datasets/{dataset_id}/data-annotations/labels/{label_name}

帮助中心 > AI开发平台ModelArts > API参考 > 权限策略和授权项
预训练任务 - AI开发平台ModelArts

ta/pretrain/alpaca_text_document 必填。训练时指定的输入数据路径。一般为数据地址/处理后的数据前缀名，不加文件类型后缀。请根据实际规划修改。 TOKENIZER_PATH /home/ma-user/ws/tokenizers/GLM3-6B 必

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > GLM3-6B模型基于DevServer适配PyTorch NPU训练指导（6.3.904） > 预训练
查询节点池列表 - AI开发平台ModelArts

资源规格名称，比如：modelarts.vm.gpu.t4u8。 count Integer 规格保障使用量。 maxCount Integer 资源规格的弹性使用量，物理池该值和count相同。 azs Array of PoolNodeAz objects 资源池中节点的AZ信息。 nodePool

帮助中心 > AI开发平台ModelArts > API参考 > 节点池管理
查询训练作业参数列表 - AI开发平台ModelArts

/home/work/run_train.sh python /home/work/user-job-dir/app/train.py {python_file_parameter}”。请求示例 GET https://endpoint/v1/{project_id}/training-job-configs

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业参数配置
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

baichuan2-13b 训练支持的模型列表本方案支持以下模型的训练，如表1所示。表1 支持的模型列表序号支持模型支持模型参数量权重文件获取地址 1 llama2 llama2-7b https://huggingface.co/meta-llama/Llama-2-7b-chat-hf

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.911）
推理性能测试 - AI开发平台ModelArts

多个，如 128 2048 128 2048，数量需和--prompt-tokens的数量对应。 --benchmark-csv：结果保存文件，如benchmark_parallel.csv。脚本运行完成后，测试结果保存在benchmark_parallel.csv中，示例如下图所示。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.906）
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

baichuan2-13b 训练支持的模型列表本方案支持以下模型的训练，如表1所示。表1 支持的模型列表序号支持模型支持模型参数量权重文件获取地址 1 llama2 llama2-7b https://huggingface.co/meta-llama/Llama-2-7b-chat-hf

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.911）
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

sft（指令微调） √ √ 训练支持的模型列表本方案支持以下模型的训练，如表1所示。表1 支持的模型列表序号支持模型支持模型参数量权重文件获取地址 1 llama2 llama2-7b https://huggingface.co/meta-llama/Llama-2-7b-chat-hf

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.912）
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

sft（指令微调） √ √ 训练支持的模型列表本方案支持以下模型的训练，如表1所示。表1 支持的模型列表序号支持模型支持模型参数量权重文件获取地址 1 llama2 llama2-7b https://huggingface.co/meta-llama/Llama-2-7b-chat-hf

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.912）
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

peft版本升级到0.12.0 训练支持的模型列表本方案支持以下模型的训练，如表1所示。表1 支持的模型列表序号支持模型支持模型参数量权重文件获取地址 1 llama2 llama2-7b https://huggingface.co/meta-llama/Llama-2-7b-chat-hf

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.910）
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

peft版本升级到0.12.0 训练支持的模型列表本方案支持以下模型的训练，如表1所示。表1 支持的模型列表序号支持模型支持模型参数量权重文件获取地址 1 llama2 llama2-7b https://huggingface.co/meta-llama/Llama-2-7b-chat-hf

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.910）
Cluster资源池节点故障如何定位 - AI开发平台ModelArts

ECC错误。通过nvidia-smi -a查询到存在Pending Page Blacklist为Yes的记录，或多比特Register File大于0。对于Ampere架构的GPU，存在以下场景：存在不可纠正的SRAM错误。存在Remapping Failure记录。 dmsg中存在Xid

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Cluster
ModelArts统一镜像列表 - AI开发平台ModelArts

mindspore-lite 2.4.0 mindinsight 2.3.0 mindarmour 2.0.0 mindformers 1.3.0 mindx-elastic 0.0.1 seccomponent 1.1.8 moxing-framework 2.2.10 ipykernel 6.7.0 ipython

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > ModelArts支持的预置镜像列表
使用Msprobe工具分析偏差 - AI开发平台ModelArts

结束标识如下图回显Exception: msprobe: exit after iteration 0。创建如下compare.json文件。 { "npu_path": "./npu_dump/dump.json", "bench_path": "./bench_dump/dump

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > Dit模型PyTorch迁移与精度性能调优 > 精度对齐
按需计费 - AI开发平台ModelArts
按需计费 - AI开发平台ModelArts

ModelArts支持购买两种按需计费的资源池，包括公共资源池和专属资源池。假设您计划购买按需计费的专属资源池，可在ModelArts控制台“AI专属资源池 > 弹性集群Cluster > Standard资源池”中，单击“购买AI专属集群”，选择“计费模式”为“按需计费”，在页面左下角查看所需费用。费用指的是资源池根据所选配置计算的费用。

帮助中心 > AI开发平台ModelArts > 计费说明 > 计费模式
更新节点池 - AI开发平台ModelArts

资源规格名称，比如：modelarts.vm.gpu.t4u8。 count 是 Integer 规格保障使用量。 maxCount 是 Integer 资源规格的弹性使用量，物理池该值和count相同。 azs 否 Array of PoolNodeAz objects 资源池中节点的AZ信息。 nodePool

帮助中心 > AI开发平台ModelArts > API参考 > 节点池管理
预训练任务 - AI开发平台ModelArts

ta/pretrain/alpaca_text_document 必填。训练时指定的输入数据路径。一般为数据地址/处理后的数据前缀名，不加文件类型后缀。请根据实际规划修改。 TOKENIZER_PATH /home/ma-user/ws/tokenizers/Qwen-14B

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > Qwen系列模型基于Lite Server适配PyTorch NPU训练指导（6.3.904） > 预训练
部署上线失败 - AI开发平台ModelArts

部署上线失败出现此问题，一般是因为后台服务故障导致的，建议稍等片刻，然后重新部署在线服务。如果重试超过3次仍无法解决，请获取如下信息，并联系华为云技术支持协助解决故障。获取服务ID。进入“部署上线>在线服务”页面，在服务列表中找到自动学习任务中部署的在线服务，自动学习部署的

 帮助中心 > AI开发平台ModelArts > 故障排除 > 自动学习 > 部署上线

总条数： 2491

上一页
1
...
95
96
97
...
125
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

查询团队标注任务详情 - AI开发平台ModelArts

查询资源实时利用率 - AI开发平台ModelArts

数据管理权限 - AI开发平台ModelArts

预训练任务 - AI开发平台ModelArts

查询节点池列表 - AI开发平台ModelArts

查询训练作业参数列表 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

Cluster资源池节点故障如何定位 - AI开发平台ModelArts

ModelArts统一镜像列表 - AI开发平台ModelArts

使用Msprobe工具分析偏差 - AI开发平台ModelArts

按需计费 - AI开发平台ModelArts

更新节点池 - AI开发平台ModelArts

预训练任务 - AI开发平台ModelArts

部署上线失败 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线