搜索_华为云

GPU A系列裸金属服务器使用CUDA cudaGetDeviceCount()提示CUDA initializat失败 - AI开发平台ModelArts

dpkg -l | grep nvidia-fabricmanager 卸载并重新安装正确版本的nvidia-fabricmanager，验证CUDA成功。处理方法查看nvidia-fabricmanager的版本，如果nvidia-fabricmanager版本与当前NVI

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
给子账号配置训练作业基本使用权限 - AI开发平台ModelArts

在ModelArts服务页面的左侧导航选择“权限管理 ”，单击“添加授权”。授权对象选择子账号，在已有委托中选择新建的委托，然后单击“创建”。验证权限是否配置成功。登录子用户账号，如果用户能在控制台上成功创建使用自定义镜像创建训练作业（如单机单卡场景下创建训练作业），则表示权限配置成功。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践
错误码 - AI开发平台ModelArts
错误码 - AI开发平台ModelArts

5025 Incorrect verification code 验证码错误请重新填写验证码。 400 ModelArts.5026 Verification code expired 验证码过期请重新获取验证码。 400 ModelArts.5027 The verification

帮助中心 > AI开发平台ModelArts > API参考 > 公共参数
服务启动失败 - AI开发平台ModelArts

健康检查端口是否可以正常工作自定义镜像中配置了健康检查，需要在测试镜像时，同步测试健康检查接口是否可以正常工作，具体参考从0-1制作自定义镜像并创建AI应用中的本地验证镜像方法。创建模型界面上配置的健康检查地址与实际配置的是否一致如果使用的是ModelArts提供的基础镜像创建模型，健康检查URL默认必须为/health。

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
从OBS目录导入数据规范说明 - AI开发平台ModelArts

1.txt 2.jpg 2.txt 单标签的标签文件示例，如1.txt文件内容如下所示： Cat 多标签的标签文件示例，如2.txt文件内容如下所示： Cat Dog 只支持JPG、JPEG、PNG、BMP格式的图片。单张图片大小

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 导入数据到ModelArts数据集 > 从OBS导入数据到ModelArts数据集
使用AI Gallery SDK构建自定义模型 - AI开发平台ModelArts

_prune_heads(self, heads_to_prune): for layer, heads in heads_to_prune.items(): self.encoder.layer[layer].attention.prune_heads(heads)

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery模型 > 构建模型
标注任务管理 - AI开发平台ModelArts

标注任务管理创建标注任务查询数据集的标注任务列表查询标注任务详情父主题：数据管理

 帮助中心 > AI开发平台ModelArts > SDK参考 > 数据管理
获取训练作业支持的AI预置框架 - AI开发平台ModelArts

String 引擎规格的ID。如“caffe-1.0.0-python2.7”。 engine_name String 引擎规格的名称。如“Caffe”。 engine_version String 引擎规格的版本。对一个引擎名称，有多个版本的引擎，如使用python2.7的"Caffe-1

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
查询训练作业列表 - AI开发平台ModelArts

String 引擎规格的ID。如“caffe-1.0.0-python2.7”。 engine_name String 引擎规格的名称。如“Caffe”。 engine_version String 引擎规格的版本。对一个引擎名称，有多个版本的引擎，如使用python2.7的"Caffe-1

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
构造请求 - AI开发平台ModelArts
构造请求 - AI开发平台ModelArts

表1 请求URI 参数说明 URI-scheme 传输请求的协议，当前所有API均采用HTTPS协议。 Endpoint 承载REST服务端点的服务器域名或IP，不同服务在不同区域时，对应Endpoint不同，可以从终端节点中获取。例如IAM服务在“华北-北京一”区域的Endpoint为“iam

帮助中心 > AI开发平台ModelArts > API参考 > 如何调用API
分离部署推理服务 - AI开发平台ModelArts

实例、增量推理实例启动的端口号进行排序，端口之间用`,`分隔开作为该环境变量的输入。当前端口9000是对外服务端口，而8088、8089则为scheduler调度推理服务端口。 USE_OPENAI：仅在服务入口实例生效，用于配置api-server服务是否使用openai服务，

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911） > 部署推理服务
分离部署推理服务 - AI开发平台ModelArts

实例、增量推理实例启动的端口号进行排序，端口之间用`,`分隔开作为该环境变量的输入。当前端口9000是对外服务端口，而8088、8089则为scheduler调度推理服务端口。 USE_OPENAI：仅在服务入口实例生效，用于配置api-server服务是否使用openai服务，

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.909） > 部署推理服务
创建数据集标注版本 - AI开发平台ModelArts

false：发布时不清除数据集已有的usage信息 train_evaluate_sample_ratio 否 String 发布版本时切分训练验证比例，默认为1.00，即全部分为训练集。 version_format 否 String 数据集版本格式。可选值如下： Default：默认格式

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
修改批量服务配置 - AI开发平台ModelArts

支持，创建模型的自定义镜像需要满足创建模型的自定义镜像规范。从OBS中选择元模型不支持不支持方式一：通过服务管理页面修改服务信息登录ModelArts管理控制台，在左侧菜单栏中选择“模型部署”，进入目标服务类型管理页面。在服务列表中，单击目标服务操作列的“修改”，修改服务基本信息，然后根据提示提交修改任务。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理批量推理作业
分离部署推理服务 - AI开发平台ModelArts

实例、增量推理实例启动的端口号进行排序，端口之间用`,`分隔开作为该环境变量的输入。当前端口9000是对外服务端口，而8088、8089则为scheduler调度推理服务端口。 USE_OPENAI：仅在服务入口实例生效，用于配置api-server服务是否使用openai服务，

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.910） > 部署推理服务
训练预测分析模型 - AI开发平台ModelArts

图1 模型评估报告同一个自动学习项目可以训练多次，每次训练会注册一个新的模型一个版本。如第一次训练版本号为“0.0.1”，下一个版本为“0.0.2”。基于训练版本可以对训练模型进行管理。当训练的模型达到目标后，再执行模型部署的操作。评估结果说明根据训练数据类的不同评估结果会包含不同的指标。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用自动学习实现预测分析
数据集版本发布失败 - AI开发平台ModelArts

检查当前账号具备OBS桶的读写权限（桶ACLs）进入OBS管理控制台，选择当前自动学习项目使用的OBS桶，单击桶名称进入概览页。在左侧菜单栏选择“访问权限控制>桶ACL”，检查当前账号是否具备读写权限，如果没有权限，请联系桶的拥有者配置权限。确保此OBS桶是非加密桶进入OBS管理控制台，选择当前自动学习项

 帮助中心 > AI开发平台ModelArts > 故障排除 > 自动学习 > 准备数据
查询训练作业列表 - AI开发平台ModelArts

String 训练作业的代码目录。如：“/usr/app/”。应与boot_file一同出现，如果填入id或subscription_id+item_version_id则无需填写。 boot_file String 训练作业的代码启动文件，需要在代码目录下。如：“/usr/app/boot

帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业
身份认证与访问控制 - AI开发平台ModelArts

的权限才可以完成操作（无论界面操作还是API调用）。管理员新创建的用户在没有配置细粒度授权策略时，默认具有ModelArts所有权限。如果需要控制用户的详细权限，管理员可以通过IAM为用户组配置细粒度授权策略，使用户获得策略定义的权限，操作对应云服务的资源。基于策略授权时，管理员可以按ModelArts的

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
MiniCPM-V2.0推理及LoRA微调基于Lite Server适配PyTorch NPU指导（6.3.910） - AI开发平台ModelArts

在每个实例节点上运行此命令可以看到总卡数如出现错误，可能是机器上的NPU设备没有正常安装，或者NPU镜像被其他容器挂载。请先正常安装固件和驱动，或释放被挂载的NPU。检查docker是否安装。 docker -v #检查docker是否安装如尚未安装，运行以下命令安装docker。

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理

总条数： 1177

上一页
1
...
11
12
13
...
59
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

GPU A系列裸金属服务器使用CUDA cudaGetDeviceCount()提示CUDA initializat失败 - AI开发平台ModelArts

给子账号配置训练作业基本使用权限 - AI开发平台ModelArts

错误码 - AI开发平台ModelArts

服务启动失败 - AI开发平台ModelArts

从OBS目录导入数据规范说明 - AI开发平台ModelArts

使用AI Gallery SDK构建自定义模型 - AI开发平台ModelArts

标注任务管理 - AI开发平台ModelArts

获取训练作业支持的AI预置框架 - AI开发平台ModelArts

查询训练作业列表 - AI开发平台ModelArts

构造请求 - AI开发平台ModelArts

分离部署推理服务 - AI开发平台ModelArts

分离部署推理服务 - AI开发平台ModelArts

创建数据集标注版本 - AI开发平台ModelArts

修改批量服务配置 - AI开发平台ModelArts

分离部署推理服务 - AI开发平台ModelArts

训练预测分析模型 - AI开发平台ModelArts

数据集版本发布失败 - AI开发平台ModelArts

查询训练作业列表 - AI开发平台ModelArts

身份认证与访问控制 - AI开发平台ModelArts

MiniCPM-V2.0推理及LoRA微调基于Lite Server适配PyTorch NPU指导（6.3.910） - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线