搜索_华为云

NPU日志收集上传 - AI开发平台ModelArts

instance_ip_obj = os.popen("curl http://169.254.169.254/latest/meta-data/local-ipv4") instance_ip = instance_ip_obj.read()

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源管理
配置多分支节点数据 - AI开发平台ModelArts

title="title_info", description="description_info") # name字段必填，title, description可选填 # 定义输入的OBS对象 obs_data = wf.data.OBS

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 构建Workflow多分支运行场景
Lite Cluster资源开通 - AI开发平台ModelArts

时，资源池才能下发任务。可以将鼠标放在“创建中”字样上，查看当前创建过程详情。若单击查看详情，可跳转到“操作记录”中。可以在Lite资源池列表右上角的“操作记录”中查看资源池的任务记录。图9 操作记录图10 查看操作记录当资源池创建成功后，资源池的状态会变成“运行中”。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster）
附录：大模型推理常见问题 - AI开发平台ModelArts

eddings': 8192, 'rope_type': 'llama3'} 解决方法：升级transformers版本到4.43.1：pip install transformers --upgrade 问题5：使用SmoothQuant进行W8A8进行模型量化时，报错：AttributeError:

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.909）
附录：大模型推理常见问题 - AI开发平台ModelArts

eddings': 8192, 'rope_type': 'llama3'} 解决方法：升级transformers版本到4.43.1：pip install transformers --upgrade 问题5：使用SmoothQuant进行W8A8进行模型量化时，报错：AttributeError:

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910）
创建数据集版本 - AI开发平台ModelArts

create_version(name="V001", version_format="Default", label_task_type=0, description="version 001") 示例二：基于标注任务创建数据集 from modelarts.session import Session

帮助中心 > AI开发平台ModelArts > SDK参考 > 数据管理 > 数据集版本管理
推理场景介绍 - AI开发平台ModelArts

具体如表1所示。表1 支持的模型列表和权重获取地址序号模型名称是否支持fp16/bf16推理是否支持W4A16量化是否支持W8A8量化是否支持W8A16量化是否支持 kv-cache-int8量化开源权重获取地址 1 llama-7b √ √ √ √ √ https://huggingface

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909）
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

全参训练（Full）：这种策略主要对整个模型进行微调。这意味着在任务过程中，除了输出层外，模型的所有参数都将被调整以适应新的任务。本方案目前仅适用于部分企业客户，完成本方案的部署，需要先联系您所在企业的华为方技术支持。约束限制本文档适配昇腾云ModelArts 6.3.910版本，请参考表1获取配套版本的软件包，请严格遵照版本配套关系使用本文档。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.910）
使用AWQ量化 - AI开发平台ModelArts

com/casper-hansen/AutoAWQ.git AutoAWQ-0.2.5 cd ./AutoAWQ-0.2.5 export PYPI_BUILD=1 pip install -e . 需要编辑“examples/quantize.py”文件，针对NPU进行如下适配工作，以支持在NPU上进行量化。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.906） > 推理模型量化
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

全参训练（Full）：这种策略主要对整个模型进行微调。这意味着在任务过程中，除了输出层外，模型的所有参数都将被调整以适应新的任务。本方案目前仅适用于部分企业客户，完成本方案的部署，需要先联系您所在企业的华为方技术支持。约束限制本文档适配昇腾云ModelArts 6.3.912版本，请参考表1获取配套版本的软件包，请严格遵照版本配套关系使用本文档。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.912）
模型管理权限 - AI开发平台ModelArts

模型管理权限表1 模型管理细化权限说明权限对应API接口授权项依赖的授权项 IAM项目企业项目导入模型 POST /v1/{project_id}/models modelarts:model:create obs:bucket:ListAllMybuckets o

帮助中心 > AI开发平台ModelArts > API参考 > 权限策略和授权项
自定义引擎创建模型规范 - AI开发平台ModelArts

引擎包：从容器镜像中选择一个镜像。其他参数保持默认值。单击“立即创建”，跳转到模型列表页，查看模型状态，当状态变为“正常”，模型创建成功。图1 创建模型单击模型名称，进入模型详情页面，查看模型详情信息。部署服务并查看详情在模型详情页面，单击右上角“部署>在线服务”，进入服务部署页面，模型

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型规范参考
工作空间管理权限 - AI开发平台ModelArts

工作空间管理细化权限说明权限对应API接口授权项依赖的授权项 IAM项目企业项目创建工作空间 POST /v1/{project_id}/workspaces modelarts:workspace:create - √ √ 查询工作空间列表 GET /v1/{project_id}/workspaces

帮助中心 > AI开发平台ModelArts > API参考 > 权限策略和授权项
ModelArts导入模型时，如何编写模型配置文件中的安装包依赖参数？ - AI开发平台ModelArts

t”写在“mmcv-full”的前面。示例如下： "dependencies": [ { "installer": "pip", "packages": [ { "package_name": "Cython"

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署
在线服务预测报错MR.0105 - AI开发平台ModelArts

"Recognition failed","words_result": {}}。图1 预测报错原因分析请在“在线服务”详情页面的日志页签中查看对应的报错日志，分析报错原因。图2 报错日志从上图报错日志判断，预测失败是模型推理代码编写有问题。解决方法根据日志报错提示，app

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

全参训练（Full）：这种策略主要对整个模型进行微调。这意味着在任务过程中，除了输出层外，模型的所有参数都将被调整以适应新的任务。本方案目前仅适用于部分企业客户，完成本方案的部署，需要先联系您所在企业的华为方技术支持。约束限制本文档适配昇腾云ModelArts 6.3.911版本，请参考表1获取配套版本的软件包，请严格遵照版本配套关系使用本文档。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.911）
advisor调优总体步骤 - AI开发平台ModelArts

算资源。完成分析后，可以查看生成的html文件来进行快速的调优，html文件详情请参考查看诊断报告。下面以开发环境Notebook为例介绍一个典型的性能调优案例。 64卡训练任务，模型为GPT MOE，tensor parallel(tp)为8，pipeline paralle

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于advisor的昇腾训练性能自助调优指导
新建Workflow Execution - AI开发平台ModelArts

String 创建时间。 name 否 String 执行记录名称。 execution_id 否 String 工作流执行ID。 description 否 String 执行记录描述。 status 否 String 执行记录状态。 workspace_id 否 String 工作空间ID。

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
更新标注团队成员 - AI开发平台ModelArts

标注团队成员ID。 workforce_id 是 String 标注团队ID。请求参数表2 请求Body参数参数是否必选参数类型描述 description 否 String 标注成员描述，长度为0-256位，不能包含^!<>=&"'特殊字符。 role 否 Integer 角色。可选值如下：

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
训练作业的监控内存指标持续升高直至作业失败 - AI开发平台ModelArts

训练作业的监控内存指标持续升高直至作业失败问题现象训练作业的“状态”为“运行失败”。原因分析训练作业的监控内存指标持续升高，导致最后训练作业失败。处理步骤查询训练作业的日志和监控信息，是否存在明确的OOM报错信息。是，训练作业的日志里存在OOM报错，执行2。否，训练作业的日志里没有OOM报错，但是存在监控指标异常，执行3。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 训练作业运行失败

总条数： 1800

上一页
1
...
58
59
60
...
90
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

NPU日志收集上传 - AI开发平台ModelArts

配置多分支节点数据 - AI开发平台ModelArts

Lite Cluster资源开通 - AI开发平台ModelArts

附录：大模型推理常见问题 - AI开发平台ModelArts

附录：大模型推理常见问题 - AI开发平台ModelArts

创建数据集版本 - AI开发平台ModelArts

推理场景介绍 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

模型管理权限 - AI开发平台ModelArts

自定义引擎创建模型规范 - AI开发平台ModelArts

工作空间管理权限 - AI开发平台ModelArts

ModelArts导入模型时，如何编写模型配置文件中的安装包依赖参数？ - AI开发平台ModelArts

在线服务预测报错MR.0105 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

advisor调优总体步骤 - AI开发平台ModelArts

新建Workflow Execution - AI开发平台ModelArts

更新标注团队成员 - AI开发平台ModelArts

训练作业的监控内存指标持续升高直至作业失败 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线