搜索_华为云

GPU A系列裸金属服务器如何更换NVIDIA和CUDA？ - AI开发平台ModelArts

GPU A系列裸金属服务器如何更换NVIDIA和CUDA？场景描述当裸金属服务器预置的NVIDIA版本和业务需求不匹配时，需要更换NVIDIA驱动和CUDA版本。本文介绍华为云A系列GPU裸金属服务器（Ubuntu20.04系统）如何从“NVIDIA 525+CUDA 12.0”更换为“NVIDIA

帮助中心 > AI开发平台ModelArts > 常见问题 > Lite Server
日志提示“cuda runtime error (10) : invalid device ordinal at xxx” - AI开发平台ModelArts

ordinal at xxx 图1 错误日志原因分析可以从以下角度排查：请检查CUDA_VISIBLE_DEVICES设置的值是否与作业规格匹配。例如您选择4卡规格的作业，实际可用的卡ID为0、1、2、3，但是您在进行cuda相关的运算时，例如"tensor.to(device="

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > GPU相关问题
查询算法详情 - AI开发平台ModelArts

mode String 搜索方向。 max指定时表示指标值越大越好； min指定时表示指标值越小越好。 regex String 指标正则表达式。表17 search_params 参数参数类型描述 name String 超参名称。 param_type String 参数类型。

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
自动学习训练作业失败 - AI开发平台ModelArts

ut.csv”。文件内容：文件保存为“csv”文件格式，文件内容以换行符（即字符“\n”，或称为LF）分隔各行，行内容以英文逗号（即字符“,”）分隔各列。文件内容不能包含中文字符，列内容不应包含英文逗号、换行符等特殊字符，不支持引号语法，建议尽量以字母及数字字符组成。训练数据

 帮助中心 > AI开发平台ModelArts > 故障排除 > 自动学习 > 模型训练
使用GPU A系列裸金属服务器有哪些注意事项？ - AI开发平台ModelArts

本号必须和nvidia-driver版本号保持一致，可参考安装nvidia-fabricmanager方法。 NCCL必须和CUDA版本相匹配，可单击此处可查看配套关系和安装方法。使用该裸金属服务器制作自定义镜像时，必须清除残留文件，请参考清理文件。父主题： Lite Server

帮助中心 > AI开发平台ModelArts > 常见问题 > Lite Server
服务预测失败，报错APIG.XXXX - AI开发平台ModelArts

测。如何获取Token请参考获取IAM用户Token。 APIG.1009 AppKey和AppSecret不匹配当服务预测使用的AppKey和AppSecret不匹配时，报错“APIG.1009”：“AppKey or AppSecret is invalid”。查询App

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
创建训练作业提示错误码ModelArts.2763 - AI开发平台ModelArts

创建训练作业时，提示ModelArts.2763 : 选择的支持实例无效，请检查请求中信息的合法性。原因分析用户选择的训练规格资源和算法不匹配。例如：算法支持的是GPU规格，创建训练作业时选择了ASCEND规格的资源类型。处理方法查看算法代码中设置的训练资源规格。检查创建

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
欠费说明 - AI开发平台ModelArts
欠费说明 - AI开发平台ModelArts

判定为账户欠费。欠费后，可能会影响云服务资源的正常运行，请及时充值。欠费原因已购买资源包，但使用量超出资源包额度或资源包属性与桶属性不匹配，进而产生按需费用，同时账户中的余额不足以抵扣产生的按需费用。请参考如何查看ModelArts中正在收费的作业？识别产生按需计费的原因，并

 帮助中心 > AI开发平台ModelArts > 计费说明
创建模型失败，如何定位和处理问题？ - AI开发平台ModelArts

目录下存在dockerfile文件。图2 构建日志：dockerfile文件目录有问题 pip软件包版本不匹配，需要修改为日志中打印的存在的版本。图3 pip版本不匹配构建日志中出现报错：“exec /usr/bin/sh: exec format error”。这种报错

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 模型管理
总览Workflow工作流 - AI开发平台ModelArts

建并使用的工作空间，以实际取值为准。 search_type 否 String 过滤方式。可选值如下： equal表示精确匹配。 contain表示模糊匹配。具体过滤的字段，由各个接口额外定义参数。例如Workflow支持按照名称（name）进行过滤，则相应的过滤字段为name

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
查询模型列表 - AI开发平台ModelArts

print(model_list) 参数说明表1 查询检索参数说明参数是否必选参数类型说明 model_name 否 String 模型名称，可支持模糊匹配。 model_version 否 String 模型版本。 model_status 否 String 模型状态，可根据模型的“publ

帮助中心 > AI开发平台ModelArts > SDK参考 > 模型管理
在JupyterLab中创建定时任务 - AI开发平台ModelArts

在JupyterLab中创建定时任务 ModelArts Notebook支持创建定时任务。本文档介绍了如何创建定时任务、一键运行Notebook文件，从而提高工作效率。功能亮点一键运行：允许用户一键运行Notebook文件，无需逐个执行Cell。定时任务调度：允许用户设置

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过JupyterLab在线使用Notebook实例进行AI开发
常见问题 - AI开发平台ModelArts
常见问题 - AI开发平台ModelArts

ra.py”把lora模型合入unet和text-encoder模型。数据类型不匹配问题如何处理？报错“data type not equal”时，按照堆栈信息，将对应的行数的数据类型修改为匹配的类型。图1 报错信息处理该问题时，pipeline_onnx_stable_

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导
查询模型对象列表 - AI开发平台ModelArts

当前支持最大获取150个模型对象。表1 查询检索参数说明参数是否必选参数类型说明 model_name 否 String 模型名称，可支持模糊匹配。 model_version 否 String 模型版本。 model_status 否 String 模型状态，可根据模型的“publ

帮助中心 > AI开发平台ModelArts > SDK参考 > 模型管理
查询AI应用列表 - AI开发平台ModelArts

Query参数参数是否必选参数类型描述 model_name 否 String 模型名称，可支持模糊匹配。 exact_match 否 Boolean 是否根据模型名称进行精准匹配。 model_version 否 String 模型版本。格式需为“数值：数值：数值”，其中数值为

 帮助中心 > AI开发平台ModelArts > API参考 > AI应用管理
创建数据集 - AI开发平台ModelArts

0：OBS桶（默认值） 5：AI Gallery下载数据集 path 是 String 数据源所在路径。字符限制：不允许出现的特殊字符有换行符(\n)、回车符(\r)、制表符(\t)。 content_info 否表3 从AI Gallery下载数据集时数据集资产的信息。 annotation_config

帮助中心 > AI开发平台ModelArts > SDK参考 > 数据管理 > 数据集管理
MoXing常用操作的样例代码 - AI开发平台ModelArts

obs_file.txt', 'r') as f: file_str = f.read() 从文件中读取一行，返回string，以换行符结尾。同样可以打开OBS的文件对象。 1 2 3 import moxing as mox with mox.file.File('obs

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 在Notebook中使用Moxing命令
查看批量服务详情 - AI开发平台ModelArts

不支持带有分词符的字符串搜索（当前默认分词符有 ,'";=()[]{}@&<>/:\n\t\r）。支持关键词精确搜索。关键词指相邻两个分词符之间的单词。支持关键词模糊匹配搜索，例如输入“error”或“er?or”或“rro*”或“er*r”。支持短语精确搜索。例如输入“Start to refresh”。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理批量推理作业
构建条件节点控制分支执行 - AI开发平台ModelArts

构建条件节点控制分支执行功能介绍主要用于执行流程的条件分支选择，可以简单的进行数值比较来控制执行流程，也可以根据节点输出的metric相关信息决定后续的执行流程。主要应用场景如下：可以用于需要根据不同的输入值来决定后续执行流程的场景。例如：需要根据训练节点输出的精度信息来决

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 构建Workflow多分支运行场景
镜像方案说明 - AI开发平台ModelArts

部署训练环境。方案的区别如下：直接使用基础镜像方案：用户可在训练作业中直接选择基础镜像作为运行环境。但基础镜像中pip依赖包缺少或版本不匹配，因此每次创建训练作业时，训练作业的启动命令中都需要执行install.sh文件，来安装依赖以及下载完整代码。 ECS中构建新镜像方案：在

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.908） > 准备工作 > 准备镜像

总条数： 207

上一页
1
2
3
4
5
...
11
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

GPU A系列裸金属服务器如何更换NVIDIA和CUDA？ - AI开发平台ModelArts

日志提示“cuda runtime error (10) : invalid device ordinal at xxx” - AI开发平台ModelArts

查询算法详情 - AI开发平台ModelArts

自动学习训练作业失败 - AI开发平台ModelArts

使用GPU A系列裸金属服务器有哪些注意事项？ - AI开发平台ModelArts

服务预测失败，报错APIG.XXXX - AI开发平台ModelArts

创建训练作业提示错误码ModelArts.2763 - AI开发平台ModelArts

欠费说明 - AI开发平台ModelArts

创建模型失败，如何定位和处理问题？ - AI开发平台ModelArts

总览Workflow工作流 - AI开发平台ModelArts

查询模型列表 - AI开发平台ModelArts

在JupyterLab中创建定时任务 - AI开发平台ModelArts

常见问题 - AI开发平台ModelArts

查询模型对象列表 - AI开发平台ModelArts

查询AI应用列表 - AI开发平台ModelArts

创建数据集 - AI开发平台ModelArts

MoXing常用操作的样例代码 - AI开发平台ModelArts

查看批量服务详情 - AI开发平台ModelArts

构建条件节点控制分支执行 - AI开发平台ModelArts

镜像方案说明 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线