搜索_华为云

用户结束kernelgateway进程后报错Server Connection Error，如何恢复？ - AI开发平台ModelArts

以及选不到Kernel。图1 报错Server Connection Error截图图2 选不到Kernel 原因分析用户误操作引起的。解决方案打开Terminal窗口，执行以下命令启动kernelgateway服务。 API_TYPE=kernel_gateway.jupyter_websocket

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 环境配置故障
如何在Notebook中安装外部库？ - AI开发平台ModelArts

w-1.8”的环境中使用pip安装Shapely。打开一个Notebook实例，进入到Launcher界面。在“Other”区域下，选择“Terminal”，新建一个terminal文件。在代码输入栏输入以下命令，获取当前环境的kernel，并激活需要安装依赖的python环境。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
专属资源池关联SFS Turbo显示异常 - AI开发平台ModelArts

同时该网络的解除关联SFS Turbo按钮置灰不可操作。图3 关联SFS Turbo状态原因分析 ModelArts缺少SFS Turbo委托权限导致关联或解除关联失败。处理方法需要您给ModelArts配置SFS Turbo委托权限，配置步骤请参考最佳实践的“委托授权ModelArts云服务使用SFS

帮助中心 > AI开发平台ModelArts > 故障排除 > 资源池
权限配置 - AI开发平台ModelArts
权限配置 - AI开发平台ModelArts

服务授权列表待授权的服务适用场景 ModelArts 授予子用户使用ModelArts服务的权限。 ModelArts CommonOperations没有任何专属资源池的创建、更新、删除权限，只有使用权限。推荐给子用户配置此权限。如果需要给子用户开通专属资源池的创建、更新、删除权限，此处要勾选ModelArts

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 基本配置
自动学习训练作业失败 - AI开发平台ModelArts

体检测等类型，可在自动学习的数据标注页面，单击“同步数据源”，将OBS中的数据重新同步至ModelArts中。检查OBS的访问权限如果OBS桶的访问权限设置无法满足训练要求时，将会出现训练失败。请排查如下几个OBS的权限设置。当前账号具备OBS桶的读写权限（桶ACLs）进

 帮助中心 > AI开发平台ModelArts > 故障排除 > 自动学习 > 模型训练
Lite Cluster资源管理介绍 - AI开发平台ModelArts

后，由于用户AI开发业务的变化，对于资源池资源量的需求可能会产生变化，面对这种场景，ModelArts提供了扩缩容功能，用户可以根据自己的需求动态调整。升级Lite Cluster资源池驱动：当资源池中的节点含有GPU/Ascend资源时，用户基于自己的业务，可能会有自定义GP

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理
使用MoXing复制数据报错 - AI开发平台ModelArts

进入ModelArts管理控制台，查看其所在区域。然后再进入OBS管理控制台，查看您使用的OBS桶所在的区域。查看是否在同一区域。是，请执行3。否，请在ModelArts同一区域的OBS中新建桶和文件夹，并将所需的数据上传至此OBS桶中。检查OBS的路径是否正确，是否写为了“obs://xxx”。可使用如下方式判断OBS路径是否存在。

帮助中心 > AI开发平台ModelArts > 故障排除 > MoXing
在Workflow中使用大数据能力（DLI/MRS） - AI开发平台ModelArts

用于数据批量处理、模型训练等场景。应用场景需要使用MRS Spark组件进行大量数据的计算时，可以根据已有数据使用该节点进行训练计算。使用案例在华为云MRS服务下查看自己账号下可用的MRS集群，如果没有，则需要创建，当前需要集群有Spark组件，安装时，注意勾选上。您可

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > Workflow高阶能力
内存不足如何处理？ - AI开发平台ModelArts

运行中服务出现告警时，需要分析是您的代码是否出现漏洞导致内存溢出、是否因为业务使用量太大需要更多的内存。如果因业务原因需要更多内存，请升级在线服务选择更大内存规格的计算节点。父主题：服务部署

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
开启训练故障自动重启功能 - AI开发平台ModelArts

int机制是在模型训练的过程中，不断地保存训练结果（包括但不限于EPOCH、模型权重、优化器状态、调度器状态）。即便模型训练中断，也可以基于checkpoint接续训练。当训练作业发生故障中断本次作业时，代码可自动从训练中断的位置接续训练，加载中断生成的checkpoint，中

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.906）
变更计费模式 - AI开发平台ModelArts

”，在Standard资源池列表中选中目标专属资源池。在资源池详情页的右上角选择“更多 > 转包周期”。在弹出的“转包周期”页面，确认无误后单击“确定”。图1 转包周期选择弹性集群的购买时长，判断是否勾选“自动续费”，确认预计到期时间和配置费用后单击“去支付”。进入支付页面，选择支付方式

 帮助中心 > AI开发平台ModelArts > 计费说明
使用Gallery CLI配置工具上传文件 - AI开发平台ModelArts

获取“repo_id”和待上传的文件名。获取“repo_id” 在AI Gallery页面的资产详情页，单击复制完整的资产名称，如图1所示，获取到的信息即为“repo_id”。例如，复制出的信息为“ur5468675/test_cli_model1”，则该资产的“repo_id”为

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > Gallery CLI配置工具指南
VS Code连接开发环境失败故障处理 - AI开发平台ModelArts

使用VSCode-huawei，报错：卸载了‘ms-vscode-remote.remot-sdh’，它被报告存在问题使用VS Code连接实例时，发现VS Code端的实例目录和云上目录不匹配 VSCode远程连接时卡顿，或Python调试插件无法使用如何处理？父主题：开发环境

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境
已有镜像迁移至ModelArts用于训练模型 - AI开发平台ModelArts

训练代码文件会在训练作业启动的时候被系统自动下载到训练容器的“${MA_JOB_DIR}/demo-code”目录中，“demo-code”为存放代码目录的最后一级OBS目录。例如，“代码目录”选择的是“/test/code”，则训练代码文件会被下载到训练容器的“${MA_JOB_DIR}/code”目录中。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于训练模型
文生图模型训练推理 - AI开发平台ModelArts

SDXL基于Standard适配PyTorch NPU的Finetune训练指导（6.3.905） SDXL基于Lite Server适配PyTorch NPU的Finetune训练指导（6.3.905） SDXL基于Lite Server适配PyTorch NPU的LoRA训练指导（6.3.905）

帮助中心 > AI开发平台ModelArts > 最佳实践
训练数据集预处理说明 - AI开发平台ModelArts

tokenizer的存放路径，与HF权重存放在一个文件夹下。 --handler-name：生成数据集的用途，这里是生成的文本数据集，用于预训练。 GeneralPretrainHandler：默认。用于预训练时的数据预处理过程中，将数据集根据key值进行简单的过滤。 --seq-length：要处理的最大seq

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.907） > 训练脚本说明
使用AI市场物体检测YOLOv3 - AI开发平台ModelArts

'feat_2:0', 'feat_3': 'feat_3:0'} 不做数据集切分操作。如果选择未切分的数据集，算法将做纯训练场景；父主题：服务部署

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
Notebook中快速使用MoXing - AI开发平台ModelArts

运行中”时，单击“操作”列中的“打开”，进入“JupyterLab Notebook”开发页面。在JupyterLab的“Launcher”页签下，以TensorFlow为例，您可以单击TensorFlow，创建一个用于编码的文件。图1 选择不同的AI引擎文件创建完成后，系

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 在Notebook中使用Moxing命令
配置ModelArts基本使用权限 - AI开发平台ModelArts

配置ModelArts基本使用权限场景描述 Step1 创建用户组并加入用户 Step2 为用户配置云服务使用权限 Step3 为用户配置ModelArts的委托访问授权 Step4 测试用户权限父主题：典型场景配置实践

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践
用户创建模型时构建镜像或导入文件失败 - AI开发平台ModelArts

用户授予OBS的系统权限。子用户的IAM权限是由其主用户设置的，如果主用户没有赋予OBS的putObjectAcl权限即会导致创建模型构建失败。处理方法了解ModelArts依赖的OBS权限自定义策略，请参见ModelArts依赖的OBS权限自定义策略样例。在统一身份认证服

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 模型管理

总条数： 1820

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

用户结束kernelgateway进程后报错Server Connection Error，如何恢复？ - AI开发平台ModelArts

如何在Notebook中安装外部库？ - AI开发平台ModelArts

专属资源池关联SFS Turbo显示异常 - AI开发平台ModelArts

权限配置 - AI开发平台ModelArts

自动学习训练作业失败 - AI开发平台ModelArts

Lite Cluster资源管理介绍 - AI开发平台ModelArts

使用MoXing复制数据报错 - AI开发平台ModelArts

在Workflow中使用大数据能力（DLI/MRS） - AI开发平台ModelArts

内存不足如何处理？ - AI开发平台ModelArts

开启训练故障自动重启功能 - AI开发平台ModelArts

变更计费模式 - AI开发平台ModelArts

使用Gallery CLI配置工具上传文件 - AI开发平台ModelArts

VS Code连接开发环境失败故障处理 - AI开发平台ModelArts

已有镜像迁移至ModelArts用于训练模型 - AI开发平台ModelArts

文生图模型训练推理 - AI开发平台ModelArts

训练数据集预处理说明 - AI开发平台ModelArts

使用AI市场物体检测YOLOv3 - AI开发平台ModelArts

Notebook中快速使用MoXing - AI开发平台ModelArts

配置ModelArts基本使用权限 - AI开发平台ModelArts

用户创建模型时构建镜像或导入文件失败 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线