搜索_华为云

日志提示“Unexpected keyword argument passed to optimizer” - AI开发平台ModelArts

开发环境调试训练代码，避免代码迁移过程中的错误。直接使用线上notebook环境调试请参考使用JupyterLab开发模型。配置本地IDE（Pycharm或者VSCode）联接云上环境调试请参考使用本地IDE开发模型。父主题：业务代码问题

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
不同机型的对应的软件配套版本 - AI开发平台ModelArts

0.5.220-23.0.3 无约束 NPU 用于升级、回滚npu驱动。 gpuDriver gpu-driver 515.65.01（推荐） 510.47.03 470.182.03 470.57.02 无约束 GPU 用于升级、回滚gpu驱动，插件依赖gpu-beta版本。 ccePlugin

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster使用前必读
obsutil安装和配置 - AI开发平台ModelArts

夹、删除文件/文件夹等。 obsutil安装和配置的具体操作指导请参见obsutils快速入门。操作命令中的AK/SK要换成用户实际获取的AK/SK，Endpoint可以参考终端节点（Endpoint）和访问域名获取。父主题：基本配置

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 基本配置
管理Lite Cluster节点 - AI开发平台ModelArts

导出全部数据到XLSX”或者“导出 > 导出部分数据到XLSX”，在浏览器的下载记录中查看导出的Excel表格。驱动升级支持升级Lite资源池内单个节点驱动版本，或批量升级多个节点的驱动版本。详情请参见升级Lite Cluster资源池单个节点驱动章节。查找搜索节点在节点管理页面的搜索栏中，支持

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理
上传镜像 - AI开发平台ModelArts
上传镜像 - AI开发平台ModelArts

录指令。此处生成的登录指令有效期为24小时，如果需要长期有效的登录指令，请参见获取长期有效登录指令。获取了长期有效的登录指令后，在有效期内的临时登录指令仍然可以使用。登录指令末尾的域名为镜像仓库地址，请记录该地址，后面会使用到。在安装容器引擎的机器中执行上一步复制的登录指令。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 单机单卡
创建数据集版本 - AI开发平台ModelArts

为数据集创建新的版本。 dataset.create_version(name=None, version_format=None, label_task_type=None, label_task_id=None, **kwargs) 示例代码示例一：为数据集创建新的版本 from

帮助中心 > AI开发平台ModelArts > SDK参考 > 数据管理 > 数据集版本管理
产品变更公告 - AI开发平台ModelArts

产品变更公告网络调整公告预测API的域名停用公告

 帮助中心 > AI开发平台ModelArts > 服务公告
导出ModelArts数据集中的数据到AI Gallery - AI开发平台ModelArts

选择需要发布的数据集。许可证类型根据业务需求和数据集类型选择合适的许可证类型。单击许可证类型后面的感叹号可以查看许可证详情。说明：部分许可证网站说明地址是海外网站，用户可能会因网络限制无法访问。谁可以看设置此数据集的公开权限。可选值有： “公开”：表示所有使用AI Gallery的用户都可以查看且使用该资产。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 导出ModelArts数据集中的数据
哪里可以了解Atlas800训练服务器硬件相关内容 - AI开发平台ModelArts

LLDP信息等。 Atlas 800训练服务器备件查询助手备件查询助手可以帮助您查询服务器的所有部件、规格描述，数量等详细信息。打开网站后请输入SN编码“2102313LNR10P5100077”，若失效可以提工单至华为云ModelArts查询。 Atlas 800训练服务器的网卡配置问题

 帮助中心 > AI开发平台ModelArts > 常见问题 > Lite Server
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

ModelArts中注册镜像镜像上传后，可在SWR中查看已上传的镜像。但在ModelArts中还需要完成镜像注册后，才能在后续的Notebook中使用。登录ModelArts管理控制台，在左侧导航栏选择“资产管理 > 镜像管理”，然后在“镜像管理”页面右上角单击“注册镜像”。在“

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.906） > 准备工作
自定义镜像训练作业失败定位思路 - AI开发平台ModelArts

脚本名称是否正常、脚本路径是否正常。具体请参见示例：从 0 到 1 制作自定义镜像并用于训练（MindSpore+Ascend）。驱动版本与底层驱动不兼容当对自定义镜像的驱动进行升级时，请确定底层驱动是否兼容。当前支持哪种驱动版本，请从基础镜像中获取。文件权限不足该问题可

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 训练作业运行失败
查询服务详情 - AI开发平台ModelArts

必须大于0，不配置默认值为1。当小于1时，代表滚动升级时增加的实例数的百分比；当大于1时，代表滚动升级时最大扩容的实例数。 max_unavailable Float 必须大于0，不配置默认值为0。当小于1时，代表滚动升级时允许缩容的实例数的百分比；当大于1时，代表滚动升级时允许缩容的实例数。 ter

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
【下线公告】华为云ModelArts服务旧版训练管理下线公告 - AI开发平台ModelArts

响？正在使用的训练作业不受影响，但是用户无法使用旧版训练创建新的作业。旧版训练管理是否停止新购？是的，旧版训练管理将于2023年6月30日 00:00(北京时间)正式退市。旧版训练管理如何升级到新版训练？请参考新版训练指导文档（模型训练）来体验新版训练。旧版训练迁移至新版训练需要注意哪些问题？

帮助中心 > AI开发平台ModelArts > 服务公告 > 下线公告
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

ModelArts中注册镜像镜像上传后，可在SWR中查看已上传的镜像。但在ModelArts中还需要完成镜像注册后，才能在后续的Notebook中使用。登录ModelArts管理控制台，在左侧导航栏选择“资产管理 > 镜像管理”，然后在“镜像管理”页面右上角单击“注册镜像”。在“

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.905） > 准备工作
模型的自定义镜像制作流程 - AI开发平台ModelArts

gevent”。不同服务框架参数设置有区别，请以实际情况为准。（可选）处理SIGTERM信号，容器优雅退出如果需要支持滚动升级的过程中不中断业务，那么需要在容器中捕获SIGTERM信号，并且在收到SIGTERM信号之后等待60秒再优雅退出容器。提前优雅退出容器可能会导致在滚动升级的过程中业务概率中断

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于推理
常见问题 - AI开发平台ModelArts
常见问题 - AI开发平台ModelArts

常见问题模型转换失败怎么办？常见的模型转换失败原因可以通过查询转换失败错误码来确认具体导失败的原因。Stable Diffusion新推出的模型在转换中可能会遇到算子不支持的问题，您可以到华为云管理页面上提交工单来寻求帮助。图片大Shape性能劣化严重怎么办？在昇腾设备上

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导
在ModelArts中调整模型后，部署新版本模型能否保持原API接口不变？ - AI开发平台ModelArts

在ModelArts中调整模型后，部署新版本模型能否保持原API接口不变？ ModelArts提供多版本支持和灵活的流量策略，您可以通过使用灰度发布，实现模型版本的平滑过渡升级。修改服务部署新版本模型或者切换模型版本时，原服务预测API不会变化。调整模型版本的操作可以参考如下的步骤。前提条件已存在部署完成的服务。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署
Lite Cluster资源管理介绍 - AI开发平台ModelArts

功能，用户可以根据自己的需求动态调整。升级Lite Cluster资源池驱动：当资源池中的节点含有GPU/Ascend资源时，用户基于自己的业务，可能会有自定义GPU/Ascend驱动的需求，ModelArts面向此类客户提供了自助升级专属资源池GPU/Ascend驱动的能力。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理
ModelArts在线服务的API接口组成规则是什么？ - AI开发平台ModelArts

ModelArts在线服务的API接口组成规则是什么？模型部署成在线服务后，用户可以获取API接口用于访问推理。 API接口组成规则如下： https://域名/版本/infer/服务ID 示例如下： https://6ac81cdfac4f4a30be95xxxbb682.apig.xxx.xxx

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署
DockerFile构建镜像（可选） - AI开发平台ModelArts

封装使用，过程中需要连接互联网git clone，请确保环境可以访问公网，详解操作如下：进入代码包Dockerfile文件同级目录： cd /home/ma-user/ws/llm_train/AscendFactory 构建新镜像： docker build -t <镜像名称>:<版本名称>

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.912） > 准备工作

总条数： 1574

上一页
1
2
3
4
5
...
79
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

日志提示“Unexpected keyword argument passed to optimizer” - AI开发平台ModelArts

不同机型的对应的软件配套版本 - AI开发平台ModelArts

obsutil安装和配置 - AI开发平台ModelArts

管理Lite Cluster节点 - AI开发平台ModelArts

上传镜像 - AI开发平台ModelArts

创建数据集版本 - AI开发平台ModelArts

产品变更公告 - AI开发平台ModelArts

导出ModelArts数据集中的数据到AI Gallery - AI开发平台ModelArts

哪里可以了解Atlas800训练服务器硬件相关内容 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

自定义镜像训练作业失败定位思路 - AI开发平台ModelArts

查询服务详情 - AI开发平台ModelArts

【下线公告】华为云ModelArts服务旧版训练管理下线公告 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

模型的自定义镜像制作流程 - AI开发平台ModelArts

常见问题 - AI开发平台ModelArts

在ModelArts中调整模型后，部署新版本模型能否保持原API接口不变？ - AI开发平台ModelArts

Lite Cluster资源管理介绍 - AI开发平台ModelArts

ModelArts在线服务的API接口组成规则是什么？ - AI开发平台ModelArts

DockerFile构建镜像（可选） - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线