搜索_华为云

使用AWQ量化工具转换权重 - AI开发平台ModelArts

显著降低模型显存以及需要部署的卡数。降低小batch下的增量推理时延。支持AWQ量化的模型列表请参见支持的模型列表和权重文件。本章节介绍如何在Notebook使用AWQ量化工具实现推理量化。量化方法：W4A16 per-group/per-channel, W8A16 per-channel

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910） > 推理模型量化
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

通过容器名称进入容器中。启动容器时默认用户为ma-user用户。 docker exec -it ${container_name} bash 上传代码和数据到宿主机时使用的是root用户，此处需要执行如下命令统一文件属主为ma-user用户。 #统一文件属主为ma-user用户 sudo chown

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.908） > 准备工作
创建网络资源 - AI开发平台ModelArts

defaultGateWay Boolean 默认路由开关。 phase String 网络的连接状态。可选值如下： Connecting：网络连接中 Active：网络连接正常 Abnormal：网络连接不正常表18 sfsTurboStatus 参数参数类型描述 sfsId String

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
资源超分对在ModelArts的Notebook实例有什么影响？ - AI开发平台ModelArts

67个Notebook实例。这里的0.6就是超分比率。即启动该Notebook实例最少需要1.2U的CPU，运行Notebook时最大使用到2U的资源；内存同理，最少需要4.8G的内存，运行时最大使用到8U的内存。超分情况下会存在实例终止的风险。如1个8U的节点上同时启动了6个2U的实例，如果

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
订阅免费模型 - AI开发平台ModelArts

根据实际使用情况收取硬件资源的费用。前提条件注册并登录华为云，且创建好OBS桶用于存储数据和模型。如果是订阅使用HiLens技能，则需要获取相关服务权限，详细操作请参见准备工作（华为HiLens）。订阅免费模型登录“AI Gallery”。选择“资产集市 > 模型”，

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（旧版） > 订阅使用
查询镜像详情 - AI开发平台ModelArts

镜像支持的服务。枚举值如下： NOTEBOOK：镜像支持通过https协议访问Notebook。 SSH：镜像支持本地IDE通过SSH协议远程连接Notebook。 id String 待创建Notebook实例的镜像，需要指定镜像ID，ID格式为通用唯一识别码（Universally

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
查询服务详情 - AI开发平台ModelArts

字段，取值为：auto。 status String 模型实例运行状态，取值为： ready：已就绪（所有实例已启动） concerning：部分就绪（部分实例已启动、部分实例未启动） notReady：未就绪（所有实例都没启动） weight Integer 权重，分配到此模型的流量权重。

帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
推理精度测试 - AI开发平台ModelArts

推理精度测试本章节介绍如何进行推理精度测试，请在Notebook的JupyterLab中另起一个Terminal，进行推理精度测试。 Step1 配置精度测试环境获取精度测试代码。精度测试代码存放在代码包AscendCloud-LLM的llm_tools/llm_evaluation目录中，代码目录结构如下。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906）
业务代码问题 - AI开发平台ModelArts

ices_out_cuda_frame failed with error code 0” 训练作业失败，返回错误码139 训练作业失败，如何使用开发环境调试训练代码？日志提示“ '(slice(0, 13184, None), slice(None, None, None))'

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业
使用AWQ量化工具转换权重 - AI开发平台ModelArts

显著降低模型显存以及需要部署的卡数。降低小batch下的增量推理时延。支持AWQ量化的模型列表请参见支持的模型列表和权重文件。本章节介绍如何在Notebook使用AWQ量化工具实现推理量化。量化方法：W4A16 per-group/per-channel, W8A16 per-channel

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
使用AWQ量化 - AI开发平台ModelArts

AWQ(W4A16/W8A16)量化方案能显著降低模型显存以及需要部署的卡数。降低小batch下的增量推理时延。支持AWQ量化的模型列表请参见表3。本章节介绍如何使用AWQ量化工具实现推理量化。量化方法：W4A16 per-group/per-channel，W8A16 per-channel 步骤一

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.910） > 推理模型量化
修改工作空间 - AI开发平台ModelArts

授权类型。可选值有PUBLIC、PRIVATE、INTERNAL。默认值为PUBLIC。 PUBLIC：租户内部公开访问。 PRIVATE：仅创建者和主账号可访问。 INTERNAL：创建者、主账号、指定IAM子账号可访问，需要与grants参数配合使用。 name 否 String 工作空间名称。长度限制为

 帮助中心 > AI开发平台ModelArts > API参考 > 工作空间管理
订阅Workflow - AI开发平台ModelArts

如果消耗了硬件资源进行部署，管理控制台将根据实际使用情况收取硬件资源的费用。前提条件注册并登录华为云，且创建好OBS桶用于存储算法和Workflow。订阅免费Workflow 登录“AI Gallery”。选择“资产集市 > MLOps > Workflow”，进入Wor

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（旧版） > 订阅使用
使用AI Gallery在线推理服务部署模型 - AI开发平台ModelArts

使用AI Gallery在线推理服务部署模型 AI Gallery支持将训练的模型或创建的模型资产部署为在线推理服务，可供用户直接调用API完成推理业务。约束限制如果模型的“任务类型”是“文本问答”或“文本生成”，则支持在线推理。如果模型的“任务类型”是除“文本问答”和“文本

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版）
使用AWQ量化 - AI开发平台ModelArts

AWQ(W4A16/W8A16)量化方案能显著降低模型显存以及需要部署的卡数。降低小batch下的增量推理时延。支持AWQ量化的模型列表请参见表3。本章节介绍如何使用AWQ量化工具实现推理量化。量化方法：W4A16 per-group/per-channel, W8A16 per-channel Step1

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.908） > 推理模型量化
使用AWQ量化 - AI开发平台ModelArts

AWQ(W4A16/W8A16)量化方案能显著降低模型显存以及需要部署的卡数。降低小batch下的增量推理时延。支持AWQ量化的模型列表请参见表3。本章节介绍如何使用AWQ量化工具实现推理量化。量化方法：W4A16 per-group/per-channel，W8A16 per-channel 步骤一

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
使用ModelArts Standard自动学习实现口罩检测 - AI开发平台ModelArts

注册华为账号并开通华为云进行实名认证配置委托访问授权 ModelArts使用过程中涉及到OBS等服务交互，首次使用ModelArts需要用户配置委托授权，允许访问这些依赖服务。具体配置操作请参见配置ModelArts Standard访问授权。步骤二：创建训练数据集单击口罩检测

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard自动学习
查询网络资源列表 - AI开发平台ModelArts

defaultGateWay Boolean 默认路由开关。 phase String 网络的连接状态。可选值如下： Connecting：网络连接中 Active：网络连接正常 Abnormal：网络连接不正常表15 sfsTurboStatus 参数参数类型描述 sfsId String

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
释放Lite Server资源 - AI开发平台ModelArts

再次单击“退订”，完成包年/包月资源的退订操作。在费用中心退订单个实例资源登录ModelArts管理控制台。在左侧导航栏中，选择“资源管理 > AI专属资源池 > 弹性节点Server”，进入“节点”列表页面。鼠标移动至节点名称上，复制需要退订的实例ID。图3 复制实例ID Server购买订单里绑定的资源ID为Server

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源管理
在ModelArts的Notebook中安装远端插件时不稳定要怎么办？ - AI开发平台ModelArts

按照在ModelArts的Notebook中如何设置VS Code远端默认安装的插件？配置，即会在连接远端时自动安装，减少等待时间。方法三：VS Code官网排查方式https://code.visualstudio.com/docs/remote/troubleshooting 小技巧（按需调整远端连接的相关参数）：

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook

总条数： 2206

上一页
1
...
39
40
41
...
111
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用AWQ量化工具转换权重 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

创建网络资源 - AI开发平台ModelArts

资源超分对在ModelArts的Notebook实例有什么影响？ - AI开发平台ModelArts

订阅免费模型 - AI开发平台ModelArts

查询镜像详情 - AI开发平台ModelArts

查询服务详情 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

业务代码问题 - AI开发平台ModelArts

使用AWQ量化工具转换权重 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

修改工作空间 - AI开发平台ModelArts

订阅Workflow - AI开发平台ModelArts

使用AI Gallery在线推理服务部署模型 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

使用ModelArts Standard自动学习实现口罩检测 - AI开发平台ModelArts

查询网络资源列表 - AI开发平台ModelArts

释放Lite Server资源 - AI开发平台ModelArts

在ModelArts的Notebook中安装远端插件时不稳定要怎么办？ - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线