搜索_华为云

用户结束kernelgateway进程后报错Server Connection Error，如何恢复？ - AI开发平台ModelArts

以及选不到Kernel。图1 报错Server Connection Error截图图2 选不到Kernel 原因分析用户误操作引起的。解决方案打开Terminal窗口，执行以下命令启动kernelgateway服务。 API_TYPE=kernel_gateway.jupyter_websocket

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 环境配置故障
服务部署失败，报错No Module named XXX - AI开发平台ModelArts

Module named XXX，表示模型中没有导入对应依赖模块。处理方法依赖模块没有导入，需要您在模型推理代码中导入缺失依赖模块。例如您的模型是Pytorch框架，部署为在线服务时出现告警：ModuleNotFoundError: No module named ‘model_service

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
在线服务预测报错DL.0105 - AI开发平台ModelArts

not subscriptable”。原因分析根据报错日志分析，是因为一个float数据被当做对象下标访问了。处理方法将模型推理代码中的x[0][i]修改为x[i]，重新部署服务进行预测。父主题：服务预测

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
ModelArts SDK下载文件目标路径设置为文件名，部署服务时报错 - AI开发平台ModelArts

IsADirectoryError(21, 'Is a directory'). update products failed! 原因分析用户代码中设置的目标路径（local_path）有误。处理方法需要将local_path路径设置为文件夹且后缀必须以“/”结尾。父主题： API/SDK

帮助中心 > AI开发平台ModelArts > 故障排除 > API/SDK
部署在线服务时，自定义预测脚本python依赖包出现冲突，导致运行出错 - AI开发平台ModelArts

部署在线服务时，自定义预测脚本python依赖包出现冲突，导致运行出错导入模型时，需同时将对应的推理代码及配置文件放置在模型文件夹下。使用Python编码过程中，推荐采用相对导入方式（Python import）导入自定义包。如果ModelArts推理框架代码内部存在同名包，

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署 > 部署上线 > 在线服务
报错“Bad owner or permissions on C:\Users\Administrator/.ssh/config”如何解决？ - AI开发平台ModelArts

ssh文件夹，选择“属性”。然后单击“安全”页签。单击“高级”，在弹出的高级安全设置界面单击“禁用继承”，在弹出的“阻止继承”窗口单击“从此对象中删除所有继承的权限”。此时所有用户都将被删除。添加所有者：在同一窗口中，单击“添加”，在弹出的新窗口中，单击“主体”后面的“选择主体”，弹出“选择用

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
安装VS Code软件 - AI开发平台ModelArts

Code下载方式：下载地址: https://code.visualstudio.com/updates/v1_85 图1 VS Code的下载位置 VS Code版本要求：建议用户使用VS Code 1.85.2版本进行远程连接。 VS Code安装指导如下：图2 Windows系统下VS

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过VS Code远程使用Notebook实例
示例：创建DDP分布式训练（PyTorch+GPU） - AI开发平台ModelArts

launch命令启动训练作业。创建训练作业的关键参数如表2所示。表2 创建训练作业（自定义镜像+torch.distributed.launch命令）参数名称说明创建方式选择“自定义算法”。启动方式选择“自定义”。镜像选择用于训练的PyTorch镜像。代码目录选择

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 分布式模型训练
获取Workflow工作流节点度量信息 - AI开发平台ModelArts

用户项目ID。获取方法请参见获取项目ID和名称。 workflow_id 是 String 工作流的ID。 execution_id 是 String 工作流执行ID。 step_execution_id 是 String 工作流的一次执行中一个节点的执行ID。请求参数无响应参数状态码： 200 表2 响应Body参数

 帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
查询消息订阅Subscription详情 - AI开发平台ModelArts

订阅ID，唯一性标识。创建订阅时，后台自动生成。 topic_urns Array of strings 订阅的主题。 entity String 订阅的主体。 events Array of strings 订阅的事件。请求示例查询订阅信息 GET https://{endpoint}/v2/{p

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
模型调试 - AI开发平台ModelArts
模型调试 - AI开发平台ModelArts

来源训练作业的版本，模型是从训练作业产生的可填写，用于溯源；如模型是从第三方元模型导入，则为空，默认值为空。 source_type 否 String 模型来源的类型，当前仅可取值auto，用于区分通过自动学习部署过来的模型（不提供模型下载功能）；用户通过训练作业部署的模型不设置此值。默认值为空。

帮助中心 > AI开发平台ModelArts > SDK参考 > 模型管理
NPU_Flash_Attn融合算子约束 - AI开发平台ModelArts

只支持布尔（bool）数据类型，或者为None。 query的shape仅支持 [B, N1, S1, D]，其中N1≤ 2048，D≤ 512并且dim== 4。对于GQA，key的shape是 [B, N2, S2, D]，其中 N2 ≤ 2048，并且N1是N2的正整数倍。不满足以上场景，则不能实现NPU_Flash_Attn功能。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.910） > 训练脚本说明
NPU_Flash_Attn融合算子约束 - AI开发平台ModelArts

只支持布尔（bool）数据类型，或者为None。 query的shape仅支持 [B, N1, S1, D]，其中N1≤ 2048，D≤ 512并且dim== 4。对于GQA，key的shape是 [B, N2, S2, D]，其中 N2 ≤ 2048，并且N1是N2的正整数倍。不满足以上场景，则不能实现NPU_Flash_Attn功能。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.909） > 训练脚本说明
删除资源标签 - AI开发平台ModelArts

TmsTagForDelete objects 要删除的标签列表。表3 TmsTagForDelete 参数是否必选参数类型描述 key 是 String TMS标签的key。 value 否 String TMS标签的value，非必填。响应参数状态码： 400 表4

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
NPU_Flash_Attn融合算子约束 - AI开发平台ModelArts

只支持布尔（bool）数据类型，或者为None。 query的shape仅支持 [B, N1, S1, D]，其中N1≤ 2048，D≤ 512并且dim== 4。对于GQA，key的shape是 [B, N2, S2, D]，其中 N2 ≤ 2048，并且N1是N2的正整数倍。不满足以上场景，则不能实现NPU_Flash_Attn功能。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.908） > 训练脚本说明
训练精度测试 - AI开发平台ModelArts

客户使用工具自带精度基线Yaml则需使用accuracy_cfgs.yaml文件中默认配置，权重使用表1 模型权重中指定的Huggingface地址，数据指定data.tgz里面提供的gsm8k数据。查看精度结果任务完成之后会在test-benchmark目录下生成excel表格：精度结果

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.910） > 训练benchmark工具
删除消息订阅Subscription - AI开发平台ModelArts

String 用户项目ID。获取方法请参见获取项目ID和名称。 workflow_id 是 String 工作流的ID。 subscription_id 是 String 工作流的消息订阅ID。请求参数无响应参数无请求示例删除消息订阅 DELETE https://{end

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
更新消息订阅Subscription - AI开发平台ModelArts

订阅ID，唯一性标识。创建订阅时，后台自动生成。 topic_urns 是 Array of strings 订阅的主题。 entity 否 String 订阅的主体。 events 否 Array of strings 订阅的事件。响应参数状态码： 200 表3 响应Body参数参数参数类型描述 created_at

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
GPU裸金属服务器更换NVIDIA驱动后执行nvidia-smi提示Failed to initialize NVML - AI开发平台ModelArts

NVML 问题现象华为云裸金属服务器，NVIDIA驱动卸载后重新安装。（1）已卸载原有版本NVIDIA驱动和CUDA版本，且已安装新版本的NVIDIA驱动和CUDA版本（2）执行nvidia-smi失败，提示Failed to initialize NVML: Driver/library

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
通过patch操作对服务进行更新 - AI开发平台ModelArts

String 操作路径，符合标准的Json PATCH格式，代表以服务详情的Json返回体为基准，想要执行替换的值的目标路径（Json PATH）。当前支持且仅支持对模型相关所有参数的替换更新，因此前缀固定为“/config/”。例如，当期望更新第一个模型中的实例数量，则路径为“/co

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理

总条数： 2159

上一页
1
...
93
94
95
...
108
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

用户结束kernelgateway进程后报错Server Connection Error，如何恢复？ - AI开发平台ModelArts

服务部署失败，报错No Module named XXX - AI开发平台ModelArts

在线服务预测报错DL.0105 - AI开发平台ModelArts

ModelArts SDK下载文件目标路径设置为文件名，部署服务时报错 - AI开发平台ModelArts

部署在线服务时，自定义预测脚本python依赖包出现冲突，导致运行出错 - AI开发平台ModelArts

报错“Bad owner or permissions on C:\Users\Administrator/.ssh/config”如何解决？ - AI开发平台ModelArts

安装VS Code软件 - AI开发平台ModelArts

示例：创建DDP分布式训练（PyTorch+GPU） - AI开发平台ModelArts

获取Workflow工作流节点度量信息 - AI开发平台ModelArts

查询消息订阅Subscription详情 - AI开发平台ModelArts

模型调试 - AI开发平台ModelArts

NPU_Flash_Attn融合算子约束 - AI开发平台ModelArts

NPU_Flash_Attn融合算子约束 - AI开发平台ModelArts

删除资源标签 - AI开发平台ModelArts

NPU_Flash_Attn融合算子约束 - AI开发平台ModelArts

训练精度测试 - AI开发平台ModelArts

删除消息订阅Subscription - AI开发平台ModelArts

更新消息订阅Subscription - AI开发平台ModelArts

GPU裸金属服务器更换NVIDIA驱动后执行nvidia-smi提示Failed to initialize NVML - AI开发平台ModelArts

通过patch操作对服务进行更新 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线