搜索_华为云

第三方推理框架迁移到ModelArts Standard推理自定义引擎 - AI开发平台ModelArts

ing框架、Triton框架为例，介绍如何迁移到推理自定义引擎。 TensorFlow Serving是一个灵活、高性能的机器学习模型部署系统，提供模型版本管理、服务回滚等能力。通过配置模型路径、模型端口、模型名称等参数，原生TFServing镜像可以快速启动提供服务，并支持gRPC和HTTP

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
在ModelArts控制台界面上单击VS Code接入并在新界面单击打开，VS Code打开后未进行远程连接 - AI开发平台ModelArts

在ModelArts控制台界面上单击VS Code接入并在新界面单击打开，VS Code打开后未进行远程连接若本地为Linux系统，见原因分析二。原因分析一自动安装VS Code插件ModelArts-HuaweiCloud失败。解决方法一方法一：检查VS Code网络是否正常。在VS

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
使用边缘节点部署边缘服务能否使用http接口协议？ - AI开发平台ModelArts

使用边缘节点部署边缘服务能否使用http接口协议？系统默认使用https。如果您想使用http，可以采取以下两种方式：方式一：在部署边缘服务时添加如下环境变量： MODELARTS_SSL_ENABLED = false 图1 添加环境变量方式二：在使用自定义镜像导入模型时

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署 > 部署上线 > 边缘服务
（可选）本地安装ma-cli - AI开发平台ModelArts

（可选）本地安装ma-cli 使用场景本文以Windows系统为例，介绍如何在Windows环境中安装ma-cli。 Step1：安装ModelArts SDK 参考本地安装ModelArts SDK完成SDK的安装。 Step2：下载ma-cli 下载ma-cli软件包。完成软件包签名校验。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > ModelArts CLI命令参考
GPU A系列裸金属服务器如何更换NVIDIA和CUDA？ - AI开发平台ModelArts

当裸金属服务器预置的NVIDIA版本和业务需求不匹配时，需要更换NVIDIA驱动和CUDA版本。本文介绍华为云A系列GPU裸金属服务器（Ubuntu20.04系统）如何从“NVIDIA 525+CUDA 12.0”更换为“NVIDIA 515+CUDA 11.7”。操作步骤卸载原有版本的NVIDIA和CUDA。

帮助中心 > AI开发平台ModelArts > 常见问题 > Lite Server
在ModelArts Standard上运行GPU单机单卡训练任务 - AI开发平台ModelArts

执行刷新操作后可查看到对应的镜像信息。为什么使用客户端上传镜像失败？上传数据和算法到OBS 已经在OBS上创建好并行文件系统，请参见创建并行文件系统。已经安装和配置obsutil，请参见安装和配置OBS命令行工具。 OBS和训练容器间的数据传输原理可以参考在ModelArts

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练任务
自定义镜像导入配置运行时依赖无效 - AI开发平台ModelArts

通过API接口选择自定义镜像导入创建AI应用，配置了运行时依赖，没有正常安装pip依赖包。原因分析自定义镜像导入不支持配置运行时依赖，系统不会自动安装所需要的pip依赖包。处理方法重新构建镜像。在构建镜像的dockerfile文件中安装pip依赖包，例如安装Flask依赖包。

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > AI应用管理
配置授权 - AI开发平台ModelArts
配置授权 - AI开发平台ModelArts

境、数据管理、在线服务等功能将不能正常使用。该API支持管理员给IAM子用户设置委托，支持设置当前用户的访问密钥。调用该API需要在IAM系统里配置Security Administrator权限。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API E

帮助中心 > AI开发平台ModelArts > API参考 > 授权管理
GPU A系列裸金属服务器无法获取显卡如何解决 - AI开发平台ModelArts

Error 802原因为缺少fabricmanager，可能由于以下原因导致nvidia-fabricmanager.servcie不工作：可能系统资源不足、如内存不足、内存泄露。硬件故障、如IB网络或者GPU互联设备故障等。没安装nvidia-fabricmanager组件或被误卸载。

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
运行训练代码，出现dead kernel，并导致实例崩溃 - AI开发平台ModelArts

在Notebook实例中运行训练代码，如果数据量太大或者训练层数太多，亦或者其他原因，导致出现“内存不够”问题，最终导致该容器实例崩溃。出现此问题后，系统将自动重启Notebook，来修复实例崩溃的问题。此时只是解决了崩溃问题，如果重新运行训练代码仍将失败。如果您需要解决“内存不够”的问题，

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > 代码运行常见错误
自动学习和订阅算法有什么区别？ - AI开发平台ModelArts

自动学习和订阅算法有什么区别？针对不同目标群体，ModelArts提供不同的AI开发方式。如果您是新手，推荐您使用自动学习实现零代码模型开发。当您使用自动学习，系统会自动选择适合的算法和适合的参数进行模型训练。如果您是AI开发进阶者，通过订阅算法进行模型训练有更多算法上的选择，并且您可以自定义训练所需的参数。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard自动学习 > 功能咨询
导入AI应用后部署服务，提示磁盘不足 - AI开发平台ModelArts

on device”。原因分析 ModelArts部署使用的是容器化部署，容器运行时有空间大小限制，当用户的模型文件或者其他自定义文件，系统文件超过Docker size大小时，会提示镜像内空间不足。处理方法公共资源池容器Docker size的大小最大支持50G，专属资源池Docker

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > AI应用管理
报错“Permissions for 'x:/xxx.pem' are too open”如何解决？ - AI开发平台ModelArts

open”如何解决？问题现象原因分析原因分析一：密钥文件未放在指定路径，详情请参考安全限制或VS Code文档。请参考解决方法一处理。原因分析二：当操作系统为macOS/Linux时，可能是密钥文件或放置密钥的文件夹权限问题，请参考解决方法二处理。解决方法解决方法一：请将密钥放在如下路径或其子路径下：

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
从0制作自定义镜像用于创建训练作业（Tensorflow+GPU） - AI开发平台ModelArts

ensorflow，训练使用的资源是GPU。本实践教程仅适用于新版训练作业。场景描述本示例使用Linux x86_64架构的主机，操作系统ubuntu-18.04，通过编写Dockerfile文件制作自定义镜像。目标：构建安装如下软件的容器镜像，并在ModelArts平台上使用GPU规格资源运行训练任务。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于训练模型
模型训练存储加速 - AI开发平台ModelArts

Turbo”，在“文件系统”中选择SFS Turbo实例名称，并指定“存储位置”和“云上挂载路径”。系统会在训练作业启动前，自动将存储位置中的文件目录挂载到训练容器中指定路径。图2 设置训练“SFS Turbo” 当前训练作业支持挂载多个弹性文件服务SFS Turbo，相同的文件系统只能挂载一次

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型
运行训练代码，出现dead kernel，并导致实例崩溃 - AI开发平台ModelArts

在Notebook实例中运行训练代码，如果数据量太大或者训练层数太多，亦或者其他原因，导致出现“内存不够”问题，最终导致该容器实例崩溃。出现此问题后，系统将自动重启Notebook，来修复实例崩溃的问题。此时只是解决了崩溃问题，如果重新运行训练代码仍将失败。如果您需要解决“内存不够”的问题，

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 代码运行故障
GPU A系列裸金属服务器使用CUDA cudaGetDeviceCount()提示CUDA initializat失败 - AI开发平台ModelArts

A系列裸金属服务器使用CUDA cudaGetDeviceCount()提示CUDA initializat失败问题现象在A系列GPU裸金属服务器上，系统环境是ubuntu20.04+nvidia515+cuda11.7，使用Pytorch2.0时出现如下错误： CUDA initialization:

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
训练模型时引用依赖包，如何创建训练作业？ - AI开发平台ModelArts

ModelArts支持训练模型过程中安装第三方依赖包。在训练代码目录下放置“pip-requirements.txt”文件后，在训练启动文件被执行前系统会执行如下命令，以安装用户指定的Python Packages。 pip install -r pip-requirements.txt

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard训练作业 > 编写训练代码
AIGC工具tailor使用指导 - AI开发平台ModelArts

2/use/downloads.html 需要下载的安装包与操作系统有关，请根据需要选择合适的安装包。如果操作系统为Linux aarch64，则下载：mindspore-lite-2.2.10-linux-aarch64.tar.gz。如果操作系统为Linux x86_64，则下载：mindspore-lite-2

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
训练作业失败，返回错误码139 - AI开发平台ModelArts

容的情况，例如transformers包，导致import的时候出现了错误。用户代码问题，出现了内存越界、非法访问内存空间的情况。未知系统问题导致，建议先尝试重建作业，重建后仍然失败，建议提工单定位。处理方法如果存在之前能跑通，什么都没修改，过了一阵跑不通的情况，先去排查

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题

总条数： 575

上一页
1
...
9
10
11
...
29
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

第三方推理框架迁移到ModelArts Standard推理自定义引擎 - AI开发平台ModelArts

在ModelArts控制台界面上单击VS Code接入并在新界面单击打开，VS Code打开后未进行远程连接 - AI开发平台ModelArts

使用边缘节点部署边缘服务能否使用http接口协议？ - AI开发平台ModelArts

（可选）本地安装ma-cli - AI开发平台ModelArts

GPU A系列裸金属服务器如何更换NVIDIA和CUDA？ - AI开发平台ModelArts

在ModelArts Standard上运行GPU单机单卡训练任务 - AI开发平台ModelArts

自定义镜像导入配置运行时依赖无效 - AI开发平台ModelArts

配置授权 - AI开发平台ModelArts

GPU A系列裸金属服务器无法获取显卡如何解决 - AI开发平台ModelArts

运行训练代码，出现dead kernel，并导致实例崩溃 - AI开发平台ModelArts

自动学习和订阅算法有什么区别？ - AI开发平台ModelArts

导入AI应用后部署服务，提示磁盘不足 - AI开发平台ModelArts

报错“Permissions for 'x:/xxx.pem' are too open”如何解决？ - AI开发平台ModelArts

从0制作自定义镜像用于创建训练作业（Tensorflow+GPU） - AI开发平台ModelArts

模型训练存储加速 - AI开发平台ModelArts

运行训练代码，出现dead kernel，并导致实例崩溃 - AI开发平台ModelArts

GPU A系列裸金属服务器使用CUDA cudaGetDeviceCount()提示CUDA initializat失败 - AI开发平台ModelArts

训练模型时引用依赖包，如何创建训练作业？ - AI开发平台ModelArts

AIGC工具tailor使用指导 - AI开发平台ModelArts

训练作业失败，返回错误码139 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线