搜索_华为云

使用AWQ量化工具转换权重 - AI开发平台ModelArts

使用AWQ量化工具转换权重 AWQ(W4A16/W8A16)量化方案能显著降低模型显存以及需要部署的卡数。降低小batch下的增量推理时延。支持AWQ量化的模型列表请参见支持的模型列表和权重文件。本章节介绍如何在Notebook使用AWQ量化工具实现推理量化。量化方法：W4A16 per-group/per-channel

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
推理场景介绍 - AI开发平台ModelArts

6。适配的CANN版本是cann_8.0.rc3。资源规格要求本文档中的模型运行环境是ModelArts Lite的Lite k8s Cluster。推荐使用“西南-贵阳一”Region上的资源和Ascend Snt9B。支持的模型列表和权重文件本方案支持vLLM的v0.6

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911）
推理性能测试 - AI开发平台ModelArts

静态性能测试：评估在固定输入、固定输出和固定并发下，模型的吞吐与首token延迟。该方式实现简单，能比较清楚的看出模型的性能和输入输出长度、以及并发的关系。动态性能测试：评估在请求并发在一定范围内波动，且输入输出长度也在一定范围内变化时，模型的延迟和吞吐。该场景能模拟实际业务下动态的发送不同长度请求，能评估推理框架在实际业务中能支持的并发数。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）
删除模型 - AI开发平台ModelArts
删除模型 - AI开发平台ModelArts

示例代码在ModelArts notebook平台，Session鉴权无需输入鉴权参数。其它平台的Session鉴权请参见Session鉴权。方式1：根据导入模型或模型调试生成的模型对象进行模型对象删除 1 2 3 4 5 6 from modelarts.session import

帮助中心 > AI开发平台ModelArts > SDK参考 > 模型管理
用户AK-SK认证模式 - AI开发平台ModelArts

登录管理控制台，可单击控制台右上角的账户名，在菜单栏中单击“我的凭证”，进入“我的凭证”页面。在“我的凭证 > 访问密钥”中，单击“新增访问密钥”。在“新增访问密钥”弹窗中，填写该密钥的描述说明，单击“确定”。根据提示单击“立即下载”，下载密钥。密钥文件会直接保存到浏览器默认的下载文件夹中，文件名为“credentials

帮助中心 > AI开发平台ModelArts > SDK参考 > Session鉴权
TensorFlow在OBS写入TensorBoard到达5GB时停止 - AI开发平台ModelArts

每次触发flush时将该summary文件覆盖OBS上的原文件。当超过5GB后，由于达到了OBS单次导入文件大小的上限，导致无法继续写入。处理方法如果在运行训练作业的过程中出现该问题，建议处理方法如下：推荐使用本地缓存的方式来解决，使用如下方法： import moxing

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > OBS操作相关故障
使用预置算法训练时，训练失败，报“bndbox”错误 - AI开发平台ModelArts

KeyError: 'bndbox' 原因分析用于训练的数据集中，使用了“非矩形框”标注。而预置使用算法不支持“非矩形框”标注的数据集。处理方法此问题有两种解决方法：方法1：使用常用框架自行编码开发模型，支持“多边形”标注的数据集。方法2：修改数据集，使用矩形标注。然后再启动训练作业。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
服务启动失败 - AI开发平台ModelArts

镜像中配置的端口错误模型可以正常启动，但是因为镜像中启用的端口非8080，或者镜像启用的端口与创建模型时配置的端口不一致，导致部署服务时register-agent无法与模型通信，超过一定时间后（最长20分钟）认为模型启动失败。需要检查两个地方：自定义镜像中的代码开放的端口和创

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
使用AWQ量化 - AI开发平台ModelArts

使用AWQ量化 AWQ(W4A16)量化方案能显著降低模型显存以及需要部署的卡数。降低小batch下的增量推理时延。支持AWQ量化的模型列表请参见支持的模型列表和权重文件。本章节介绍如何使用AWQ量化工具实现推理量化。量化方法：W4A16 per-group/per-channel，W8A16

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910） > 推理模型量化
管理员和开发者权限分离 - AI开发平台ModelArts

rts专属资源池的完全控制权限，以及Notebook所有实例的访问和操作权限。普通开发者使用开发环境，只需关注对自己Notebook实例的操作权限，包括对自己实例的创建、启动、停止、删除等权限以及周边依赖服务的权限。普通开发者不需要ModelArts专属资源池的操作权限，也不需要查看其他用户的Notebook实例。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践
日志提示“RuntimeError: Cannot re-initialize CUDA in forked subprocess” - AI开发平台ModelArts

subprocess” 问题现象在使用pytorch启动多进程的时候，出现如下报错： RuntimeError: Cannot re-initialize CUDA in forked subprocess 原因分析出现该问题的可能原因如下： multiprocessing启动方式有误。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > GPU相关问题
训练作业训练失败报错：TypeError: unhashable type: ‘list’ - AI开发平台ModelArts

or: unhashable type: ‘list’。原因分析可能由于使用了多标签分类导致（即一个图片用了1个以上的标签）。处理方法使用单标签分类的数据集进行训练。父主题：数据集问题导致训练失败

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 训练作业运行失败
在ModelArts中使用Moxing复制数据时如何定义路径变量？ - AI开发平台ModelArts

age,'obs://dyyolov8/yolov5_test/yolov5-7.0/datasets'), mox这个函数怎么定义以变量的形式填写OBS路径？解决方案变量定义参考如下示例： input_storage = './test.py' import moxing as

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard模型训练
创建导出任务 - AI开发平台ModelArts

创建导出任务将当前数据集的样本导出到指定的OBS路径下。仅支持图像分类、物体检测、图像分割和自由格式数据集。 dataset.export_data(path) 示例代码导出数据集到OBS目录 from modelarts.session import Session from

帮助中心 > AI开发平台ModelArts > SDK参考 > 数据管理 > 导出任务管理
从AI Gallery订阅模型 - AI开发平台ModelArts

在“订阅模型”列表，单击“版本数量”，在右侧展开版本列表，当订阅模型的版本列表的状态显示为“就绪”时表示模型可以使用。图1 进入“我的订阅” 在展开的版本列表中，单击“部署 > 在线服务”跳转至部署页面。图2 部署模型如果您选择部署的是商用模型，则选择服务类型后会弹出“修改配额”窗口，根

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型
管理批量服务生命周期 - AI开发平台ModelArts

止”状态的服务进行启动操作，“部署中”状态的服务无法启动。启动服务，当服务处于“运行中”状态后，ModelArts将开始计费。您可以通过如下方式启动服务：登录ModelArts管理控制台，在左侧菜单栏中选择“模型部署”，进入目标服务类型管理页面。您可以单击“操作”列的“启动”，启动服务。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理批量推理作业
上传本地文件至JupyterLab - AI开发平台ModelArts

zip压缩包所在路径直接解压解压命令的更多使用说明可以在主流搜索引擎中查找Linux解压命令操作。上传本地超大文件（50GB以上）至JupyterLab 不支持在Notebook的JupyterLab中直接上传大小超过50GB的文件。 50GB以上的文件需要先从本地上传到OBS中，

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过JupyterLab在线使用Notebook实例进行AI开发 > 上传文件至JupyterLab
在ModelArts上训练模型如何配置输入输出数据？ - AI开发平台ModelArts

_url”代替算法中数据来源和数据输出所需的路径。在使用预置框架创建算法时，根据1中的代码参数设置定义的输入输出参数。训练数据是算法开发中必不可少的输入。“输入”参数建议设置为“data_url”，表示数据输入来源，也支持用户根据1的算法代码自定义代码参数。模型训练结束后，

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard模型训练
资源池推理服务一直初始化中如何解决 - AI开发平台ModelArts

初始化。原因分析专属池网段和推理微服务dispatcher网段冲突，导致专属池上的VPCEP终端节点无法创建，该region无法使用此网段创建包含推理服务的资源池。处理方法选择其他网段的ModelArts网络重建资源池即可解决网段冲突问题。父主题：资源池

 帮助中心 > AI开发平台ModelArts > 故障排除 > 资源池
配置SWR组织权限 - AI开发平台ModelArts

使IAM用户对组织内所有镜像享有读取/编辑/管理的权限。只有具备“管理”权限的账号和IAM用户才能添加授权。登录容器镜像服务控制台。在左侧菜单栏选择“组织管理”，单击组织名称。在“用户”页签下单击“添加授权”，在弹出的窗口中为IAM用户选择权限，然后单击“确定”。 SWR授权管理详情可参考授权管理。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 基本配置 > 权限配置

总条数： 2309

上一页
1
...
90
91
92
...
116
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用AWQ量化工具转换权重 - AI开发平台ModelArts

推理场景介绍 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

删除模型 - AI开发平台ModelArts

用户AK-SK认证模式 - AI开发平台ModelArts

TensorFlow在OBS写入TensorBoard到达5GB时停止 - AI开发平台ModelArts

使用预置算法训练时，训练失败，报“bndbox”错误 - AI开发平台ModelArts

服务启动失败 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

管理员和开发者权限分离 - AI开发平台ModelArts

日志提示“RuntimeError: Cannot re-initialize CUDA in forked subprocess” - AI开发平台ModelArts

训练作业训练失败报错：TypeError: unhashable type: ‘list’ - AI开发平台ModelArts

在ModelArts中使用Moxing复制数据时如何定义路径变量？ - AI开发平台ModelArts

创建导出任务 - AI开发平台ModelArts

从AI Gallery订阅模型 - AI开发平台ModelArts

管理批量服务生命周期 - AI开发平台ModelArts

上传本地文件至JupyterLab - AI开发平台ModelArts

在ModelArts上训练模型如何配置输入输出数据？ - AI开发平台ModelArts

资源池推理服务一直初始化中如何解决 - AI开发平台ModelArts

配置SWR组织权限 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线