搜索_华为云

Git下载代码时报错 - AI开发平台ModelArts

在执行scripts/install.sh安装命令或使用Dockerfile构建镜像时，如遇到git下载代码出现以下类似的报错信息，关闭git验证即可。报错信息： fatal: unable to access 'https://gitee.com/ascend/ModelLink

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.909） > 常见错误原因和解决方法
Git下载代码时报错 - AI开发平台ModelArts

在执行scripts/install.sh安装命令或使用Dockerfile构建镜像时，如遇到git下载代码出现以下类似的报错信息，关闭git验证即可。报错信息： fatal: unable to access 'https://gitee.com/ascend/ModelLink

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.910） > 常见错误原因和解决方法
创建ModelArts数据清洗任务 - AI开发平台ModelArts

在创建数据处理页面，填写相关算法参数。填写基本信息。基本信息包括“名称”、“版本”和“描述”。其中“版本”信息由系统自动生成，按“V0001”、“V0002”规则命名，用户无法修改。您可以根据实际情况填写“名称”和“描述”信息。图1 创建数据处理基本信息设置场景类别。场景类别当前支持“图像分类”和“物体检测”。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 处理ModelArts数据集中的数据
准备推理环境 - AI开发平台ModelArts

1 可以通过命令npu-smi info查询NPU卡为容器中的第几张卡。例如下图查询出两张卡，如果希望使用第一和第二张卡，则“export ASCEND_RT_VISIBLE_DEVICES=0,1”，注意编号不是填4、5。图1 查询结果启动推理服务的具体操作步骤请参见启动推理服务。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理服务部署
训练作业的监控内存指标持续升高直至作业失败 - AI开发平台ModelArts

训练作业的“状态”为“运行失败”。原因分析训练作业的监控内存指标持续升高，导致最后训练作业失败。处理步骤查询训练作业的日志和监控信息，是否存在明确的OOM报错信息。是，训练作业的日志里存在OOM报错，执行2。否，训练作业的日志里没有OOM报错，但是存在监控指标异常，执行3。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 训练作业运行失败
Git下载代码时报错 - AI开发平台ModelArts

在执行scripts/install.sh安装命令或使用Dockerfile构建镜像时，如遇到git下载代码出现以下类似的报错信息，关闭git验证即可。报错信息： fatal: unable to access 'https://gitee.com/ascend/ModelLink

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.908） > 常见错误原因和解决方法
资产识别与管理 - AI开发平台ModelArts

资产以及用户提供的一些个人信息。 AI资产包括但不限于文本、图形、数据、文章、照片、图像、插图、代码、AI算法、AI模型等。用户的个人信息包括：用户注册时提供的昵称、头像、邮箱。用户参加实践时提供的姓名、手机号、邮箱。用户伙伴注册时提供的企业信息。用户发布资产时提供的联系人姓名、手机号、邮箱。

帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
获取APP列表 - AI开发平台ModelArts

获取APP列表功能介绍获取APIG APP基本信息列表，用户只能获取自己创建的APP信息。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI GET /v1/{pr

帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理
创建ModelArts数据校验任务 - AI开发平台ModelArts

在创建数据处理页面，填写相关算法参数。填写基本信息。基本信息包括“名称”、“版本”和“描述”。其中“版本”信息由系统自动生成，按“V0001”、“V0002”规则命名，用户无法修改。您可以根据实际情况填写“名称”和“描述”信息。图1 创建数据处理基本信息设置场景类别。场景类别当前支持“图像分类”和“物体检测”。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 处理ModelArts数据集中的数据
获取API授权关系列表 - AI开发平台ModelArts

objects 授权信息数组。 count Integer 查询到的授权信息数量。 total_count Integer 授权信息总数量。表4 ApiAuthInfo 参数参数类型描述 app ApigAppDetailInfo object APP信息。 authed Boolean

帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理
查询预置算法 - AI开发平台ModelArts

search_content 否 String 指定要查询的文字信息，例如参数名称。默认为空。响应消息响应参数如表3所示。表3 响应参数参数参数类型说明 is_success Boolean 请求是否成功。 error_message String 调用失败时的错误信息。调用成功时无此字段。 error_code

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
查询作业引擎规格 - AI开发平台ModelArts

查询作业引擎规格功能介绍查看指定作业的引擎类型和版本。创建训练作业和预测作业需要指定引擎规格。 URI GET /v1/{project_id}/job/ai-engines 参数说明如表1所示。表1 参数说明参数是否必选参数类型说明 project_id 是 String

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 资源和引擎规格接口
更新数据集 - AI开发平台ModelArts

更新数据集功能介绍修改数据集的基本信息，如数据集名称、描述、当前版本或标签等信息。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI PUT /v2/{projec

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
多模态 - AI开发平台ModelArts
多模态 - AI开发平台ModelArts

多模态（Multimodality）是集成和处理两种或两种以上不同类型的信息或数据的方法和技术。具体来说，在机器学习和人工智能领域，多模态涉及的数据类型通常包括但不限于文本、图像、视频、音频和传感器数据。多模态的主要目标是利用来自多种模态的信息来提升任务的表现力，提供更丰富的用户体验，或是获取更全

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用
部署在线服务出现报错No CUDA runtime is found - AI开发平台ModelArts

部署在线服务出现报错No CUDA runtime is found，using CUDA_HOME='/usr/local/cuda'。原因分析从日志报错信息No CUDA runtime is found分析，是cuda runtime没有找到。处理方法建议您按以下步骤排查处理：确认部署在线服务时是否选择了GPU规格。

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
ma-cli image镜像构建支持的命令 - AI开发平台ModelArts

ma-cli image命令支持：查询用户已注册的镜像、查询/加载镜像构建模板、Dockerfile镜像构建、查询/清理镜像构建缓存、注册/取消注册镜像、调试镜像是否可以在Notebook中使用等。具体命令及功能可执行ma-cli image -h命令查看。镜像构建命令总览 $ ma-cli

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > ModelArts CLI命令参考
通过公网访问通道的方式访问在线服务 - AI开发平台ModelArts

ModelArts推理默认使用公网访问在线服务。在线服务部署成功后，将为用户提供一个可调用的API，此API为标准Restful API。您可以在服务详情页面，调用指南页签中查看API接口公网地址。图1 API接口公网地址约束限制调用API访问在线服务时，对预测请求体大小和预测时间有限制：请求体的大小不超过12MB，超过后请求会被拦截。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的访问通道
SFT全参微调训练 - AI开发平台ModelArts

导致训练失败。作业日志选择OBS中的路径，ModelArts的训练作业的日志信息则保存该路径下。最后，请参考查看日志和性能章节查看LoRA微调的日志和性能。了解更多ModelArts训练功能，可查看模型开发简介。 Step2 配置环境变量单击“增加环境变量”，在增加的环境变

 帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.912）
训练作业卡死检测 - AI开发平台ModelArts

= "INFO"，查看NCCL DEBUG信息。问题现象1 日志中还未出现NCCL DEBUG信息时已卡死。解决方案1 检查代码，检查是否有参数中未传入“master_ip”和“rank”参数等问题。问题现象2 分布式训练的日志中，发现有的节点含有GDR信息，而有的节点无GDR信息，导致卡死的原因可能为GDR。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 模型训练高可靠性
部署推理服务 - AI开发平台ModelArts

unset USE_MM_ALL_REDUCE_OP #关闭Matmul_all_reduce融合算子配置后重启服务生效。查看详细日志。查看详细耗时日志可以辅助定位性能瓶颈，但会影响推理性能。如需开启，配置以下环境变量： export DETAIL_TIME_LOG=1

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于LIte Server适配PyTorch NPU推理指导（6.3.905）

总条数： 1533

上一页
1
...
9
10
11
...
77
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Git下载代码时报错 - AI开发平台ModelArts

Git下载代码时报错 - AI开发平台ModelArts

创建ModelArts数据清洗任务 - AI开发平台ModelArts

准备推理环境 - AI开发平台ModelArts

训练作业的监控内存指标持续升高直至作业失败 - AI开发平台ModelArts

Git下载代码时报错 - AI开发平台ModelArts

资产识别与管理 - AI开发平台ModelArts

获取APP列表 - AI开发平台ModelArts

创建ModelArts数据校验任务 - AI开发平台ModelArts

获取API授权关系列表 - AI开发平台ModelArts

查询预置算法 - AI开发平台ModelArts

查询作业引擎规格 - AI开发平台ModelArts

更新数据集 - AI开发平台ModelArts

多模态 - AI开发平台ModelArts

部署在线服务出现报错No CUDA runtime is found - AI开发平台ModelArts

ma-cli image镜像构建支持的命令 - AI开发平台ModelArts

通过公网访问通道的方式访问在线服务 - AI开发平台ModelArts

SFT全参微调训练 - AI开发平台ModelArts

训练作业卡死检测 - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线