搜索_华为云

Lite Cluster资源管理介绍 - AI开发平台ModelArts

Lite Cluster资源管理介绍在ModelArts控制台，您可以对已创建的资源进行管理。通过单击资源池名称，可以进入到资源池详情页，您可以在详情页进行下述操作。管理Lite Cluster资源池：ModelArts支持对资源池进行管理，包括续费、开通/修改自动续费、扩容、升级驱动等操作。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理
使用AWQ量化工具转换权重 - AI开发平台ModelArts

权重进行打包，在线转换会增加启动时间，可以提前对权重进行转换以减少启动时间，转换步骤如下：进入llm_tools/AutoAWQ代码目录下执行以下脚本：执行时间预计10分钟。执行完成后会将权重路径下的原始权重替换成转换后的权重。如需保留之前权重格式，请在转换前备份。 python

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911） > 推理模型量化
API概览 - AI开发平台ModelArts
API概览 - AI开发平台ModelArts

通过运行的实例保存成容器镜像运行的实例可以保存成容器镜像，保存的镜像中，安装的依赖包（pip包）不丢失，VSCode远程开发场景下，在Server端安装的插件不丢失。查询支持的有效规格列表查询支持的有效规格列表。查询支持可切换规格列表查询Notebook实例可切换的规格列表。查询运行中的开发环境可用时长

 帮助中心 > AI开发平台ModelArts > API参考
Jupyter可以安装插件吗？ - AI开发平台ModelArts

Jupyter可以安装插件吗？ Jupyter可以安装插件。目前jupyter插件多数采用wheel包的形式发布，一次性完成前后端插件的安装，安装时注意使用jupyter服务依赖的环境“/modelarts/authoring/notebook-conda/bin/pip”进行

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > CodeLab
使用AWQ量化工具转换权重 - AI开发平台ModelArts

权重进行打包，在线转换会增加启动时间，可以提前对权重进行转换以减少启动时间，转换步骤如下：进入llm_tools/AutoAWQ代码目录下执行以下脚本：执行时间预计10分钟。执行完成后会将权重路径下的原始权重替换成转换后的权重。如需保留之前权重格式，请在转换前备份。 python

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910） > 推理模型量化
推理业务迁移评估表 - AI开发平台ModelArts

P16。BertLarge使用FP32。 - 模型变更频率模型变更场景如下：数据增量，模型算子未变更。数据增量，模型算子变化，例如：网络结构变化。 AI框架版本升级，使用了新版本算子。例如：每半年对模型进行一次变更，变更的内容包含模型结构，并升级AI框架。 - 是否使用华为MDC产品

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
Step2 为用户配置云服务使用权限 - AI开发平台ModelArts

elArts服务。请谨慎配置。（可选）配置CES云监控和SMN消息通知使用权限。ModelArts推理部署的在线服务详情页面内有调用次数详情，单击可查看该在线服务的调用次数随时间详细分布的情况。如果想进一步通过CES云监控查看ModelArts的在线服务和对应模型负载运行状态

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践 > 配置ModelArts基本使用权限
常见问题 - AI开发平台ModelArts
常见问题 - AI开发平台ModelArts

常见问题模型转换失败怎么办？常见的模型转换失败原因可以通过查询转换失败错误码来确认具体导失败的原因，Stable Diffusion新推出的模型在转换中可能会遇到算子不支持的问题，可以到华为云管理页面上提交工单来寻求帮助。图片大Shape性能劣化严重怎么办？在昇腾设备上，

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导
使用AWQ量化工具转换权重 - AI开发平台ModelArts

权重进行打包，在线转换会增加启动时间，可以提前对权重进行转换以减少启动时间，转换步骤如下：进入llm_tools/AutoAWQ代码目录下执行以下脚本：执行时间预计10分钟。执行完成后会将权重路径下的原始权重替换成转换后的权重。如需保留之前权重格式，请在转换前备份。 python

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
按标签名称删除标签及仅包含此标签的文件 - AI开发平台ModelArts

按标签名称删除标签及仅包含此标签的文件功能介绍按标签名称删除标签及仅包含此标签的文件。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI DELETE /v2/{p

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
迁移评估 - AI开发平台ModelArts
迁移评估 - AI开发平台ModelArts

P16。BertLarge使用FP32。 - 模型变更频率模型变更场景如下：数据增量，模型算子未变更。数据增量，模型算子变化，例如：网络结构变化。 AI框架版本升级，使用了新版本算子。例如：每半年对模型进行一次变更，变更的内容包含模型结构，并升级AI框架。 - 是否使用华为MDC产品

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
Lite Cluster高危操作一览表 - AI开发平台ModelArts

可能影响ModelArts侧基本功能，包括但不限于资源池管理、节点管理、扩缩容、驱动升级等。高不可恢复。节点退订、移除、关机、污点管理、切换/重装操作系统等。可能影响ModelArts侧基本功能，包括但不限于节点管理、扩缩容、驱动升级、带本地盘机型的本地盘数据丢失等。高不可恢复。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster使用前必读
VS Code一键连接Notebook - AI开发平台ModelArts

VS Code一键连接Notebook 视频介绍前提条件已经创建Notebook实例，实例已经开启SSH连接，实例状态为运行中。请参考创建Notebook实例。实例的密钥文件已经下载至本地的如下目录或其子目录中： Windows：C:\Users\{{user}} Mac/Linux:

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过VS Code远程使用Notebook实例
JupyterLab常用功能介绍 - AI开发平台ModelArts

ab的右上角会显示当前实例停止的剩余时长，在计时结束前可以单击剩余时间进行续期。图11 自动停止图12 续期 JupyterLab常用快捷键和插件栏图13 JupyterLab常用快捷键和插件栏表1 快捷键说明快捷键说明快速打开Notebook、Terminal。或

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过JupyterLab在线使用Notebook实例进行AI开发
使用AWQ量化工具转换权重 - AI开发平台ModelArts

权重进行打包，在线转换会增加启动时间，可以提前对权重进行转换以减少启动时间，转换步骤如下：进入llm_tools/AutoAWQ代码目录下执行以下脚本：执行时间预计10分钟。执行完成后会将权重路径下的原始权重替换成转换后的权重。如需保留之前权重格式，请在转换前备份。 python

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908） > 推理模型量化
使用AWQ量化工具转换权重 - AI开发平台ModelArts

包。昇腾上使用int8对权重进行打包，需要进行权重转换。进入llm_tools/AutoAWQ代码目录下执行以下脚本：执行时间预计10分钟。执行完成后会将权重路径下的原始权重替换成转换后的权重。如需保留之前权重格式，请在转换前备份。 python convert_awq_to_npu

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907） > 推理模型量化
基于MindSpore Lite的模型转换 - AI开发平台ModelArts

precision_mode= preferred_fp32 模型转换在ModelArts开发环境中，通过对应的转换预置镜像，直接执行对应的转换过程，对应的转换和评估工具都已经预置了最新版本，详细介绍请见使用说明。inputShape查看方法请见转换关键参数准备。 !converter_lite

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导 > 模型适配
使用AWQ量化工具转换权重 - AI开发平台ModelArts

进行打包。昇腾上使用int8对权重进行打包，需要进行权重转换。进入llm_tools代码目录下执行以下脚本：执行时间预计10分钟。执行完成后会将权重路径下的原始权重替换成转换后的权重。如需保留之前权重格式，请在转换前备份。 python awq/convert_awq_to_npu

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906） > 推理模型量化
推理部署使用场景 - AI开发平台ModelArts

AI模型开发完成后，在ModelArts服务中可以将AI模型创建为模型，将模型快速部署为推理服务，您可以通过调用API的方式把AI推理能力集成到自己的IT平台，或者批量生成推理结果。图1 推理简介训练模型：可以在ModelArts服务中进行，也可以在您的本地开发环境进行，本地开发的模型需要上传到华为云OBS服务。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测
Standard资源管理 - AI开发平台ModelArts

AI Native的资源、任务等能力，用户可以直接操作资源池中的节点和k8s集群。请参见弹性集群k8s Cluster。弹性裸金属：弹性裸金属提供不同型号的xPU裸金属服务器，您可以通过弹性公网IP进行访问，在给定的操作系统镜像上可以自行安装GPU&NPU相关的驱动和其他软件，

帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍 > Standard功能介绍

总条数： 1678

上一页
1
2
3
4
5
...
84
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Lite Cluster资源管理介绍 - AI开发平台ModelArts

使用AWQ量化工具转换权重 - AI开发平台ModelArts

API概览 - AI开发平台ModelArts

Jupyter可以安装插件吗？ - AI开发平台ModelArts

使用AWQ量化工具转换权重 - AI开发平台ModelArts

推理业务迁移评估表 - AI开发平台ModelArts

Step2 为用户配置云服务使用权限 - AI开发平台ModelArts

常见问题 - AI开发平台ModelArts

使用AWQ量化工具转换权重 - AI开发平台ModelArts

按标签名称删除标签及仅包含此标签的文件 - AI开发平台ModelArts

迁移评估 - AI开发平台ModelArts

Lite Cluster高危操作一览表 - AI开发平台ModelArts

VS Code一键连接Notebook - AI开发平台ModelArts

JupyterLab常用功能介绍 - AI开发平台ModelArts

使用AWQ量化工具转换权重 - AI开发平台ModelArts

使用AWQ量化工具转换权重 - AI开发平台ModelArts

基于MindSpore Lite的模型转换 - AI开发平台ModelArts

使用AWQ量化工具转换权重 - AI开发平台ModelArts

推理部署使用场景 - AI开发平台ModelArts

Standard资源管理 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线