搜索_华为云

W8A8量化 - AI开发平台ModelArts
W8A8量化 - AI开发平台ModelArts

W8A8量化什么是W8A8量化 W8A8量化方案能降低模型显存以及需要部署的卡数。也能同时降低首token时延和增量推理时延。约束限制支持SmoothQuant（W8A8）量化的模型列表请参见支持的模型列表。激活量化支持动态per-token和静态per-tensor，支持非对称量化。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用 > 量化
准备Notebook - AI开发平台ModelArts

准备Notebook ModelArts Notebook云上云下，无缝协同，更多关于ModelArts Notebook的详细资料请查看开发环境介绍。本案例中的训练作业需要通过SFS Turbo挂载盘的形式创建，因此需要将上述数据集、代码、权重文件从OBS桶上传至SFS Turbo中。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.906） > 准备工作
用户创建模型时构建镜像或导入文件失败 - AI开发平台ModelArts

图5 进入用户组详情在授权记录页签下，单击“授权”，选择您刚才创建的自定义策略及授权方案。由于OBS服务是全局级服务，无法指定区域项目进行授权，如果需要根据项目进行权限管理，请在选择授权方案选择“指定企业项目资源”。成功授权后，您可在“企业项目视图”中，看到权限及对应的授权范围。

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 模型管理
在ModelArts数据集中添加图片对图片大小有限制吗？ - AI开发平台ModelArts

JPEG、PNG和BMP四种格式的图片。请注意，针对自动学习功能中的添加图片，其图片大小限制不同，要求上传的图片大小不超过5MB。解决方案：方法1：使用导入功能。将图片上传至OBS任意目录，通过“从OBS目录导入”方式导入到已有数据集。方法2：使用同步数据源功能。将图片上

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard数据准备
准备资源 - AI开发平台ModelArts
准备资源 - AI开发平台ModelArts

andard-llama2-13b。并在该桶下创建文件夹目录用于后续存储代码使用，例如：training_data。创建VPC 虚拟私有云（Virtual Private Cloud）可以为您构建隔离的、用户自主配置和管理的虚拟网络环境，操作指导请参考创建虚拟私有云和子网。创建SFS

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.907） > 准备工作
SDXL&SD1.5 ComfyUI基于Lite Cluster适配NPU推理指导（6.3.906） - AI开发平台ModelArts

fyUI，使用NPU卡进行推理。方案概览本方案介绍了在ModelArts的Lite Cluster上使用昇腾计算资源部署ComfyUI用于推理的详细过程。完成本方案的部署，需要先联系您所在企业的华为方技术支持购买Cluster资源。本方案目前仅适用于企业客户，并且需要用户具备k8s集群相关技能。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理
MindStudio-Insight性能可视化工具使用指导 - AI开发平台ModelArts

性能文件分析，并且能够支持大模型场景下的性能调优，相比于Chrometrace、tensorboard等工具提供了更优的功能和性能。更多详细信息，请参见昇腾MindStudio-Insight用户指南。父主题： PyTorch迁移性能调优

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导 > PyTorch迁移性能调优
精度问题概述 - AI开发平台ModelArts

规的现象，并非错误。为了更好地了解这种计算差异，并且能够正确区分正常计算差异和引起模型精度问题的异常差异，本指南提供了算子问题定位工具集详细的使用场景和使用步骤，方便用户自行或在支持下排查可能的数值计算精度问题。当用户将大语言模型或者其他类型深度神经网络的训练从GPU迁移到昇

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导 > PyTorch迁移精度调优
ModelArts导入模型时，如何编写模型配置文件中的安装包依赖参数？ - AI开发平台ModelArts

表示配置模型推理代码需要的依赖包，需要提供依赖包名、安装方式和版本约束的信息，详细参数见模型配置文件编写说明。导入模型时，模型配置文件中的安装包依赖参数“dependencies”如何编写？解决方案安装包存在前后依赖关系。例如您在安装“mmcv-full”之前，需要完成“Cy

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署
重置节点后无法正常使用？ - AI开发平台ModelArts

处理方法（推荐）解决方案一（按需使用volcano调度器）： CCE页面上修改默认调度器为kube-scheduler。删除maos-node-agent的pod（重启pod）。 CCE页面上删除节点上的污点A200008。 ModelArts页面上重置节点。该方案的缺点：用户新建

 帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Cluster
迁移评估 - AI开发平台ModelArts
迁移评估 - AI开发平台ModelArts

移过程，可以先按照本文档的指导进行操作并熟悉迁移流程。如果您有实际的项目需要迁移，建议填写下方的推理业务迁移评估表，并将该调研表提供给华为云技术支持人员进行迁移评估，以确保迁移项目能顺利实施。通用的推理业务及LLM推理可提供下表进行业务迁移评估：表1 通用的推理业务及LLM推理业务迁移评估表

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
应用迁移 - AI开发平台ModelArts
应用迁移 - AI开发平台ModelArts

应用迁移模型适配 pipeline代码适配父主题：基于AIGC模型的GPU推理业务迁移至昇腾指导

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导
创建Notebook实例后无法打开页面，如何处理？ - AI开发平台ModelArts

如果是IAM用户在创建实例时出现此错误，表示此IAM用户不具备对应存储位置（OBS桶）的操作权限。解决方法：使用账号登录OBS，并将对应OBS桶的访问权限授予该IAM用户。详细操作指导请参见：被授权用户。 IAM用户获得权限后，登录ModelArts管理控制台，删除该实例，然后重新使用此OBS路径创建Notebook实例。

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 实例故障
Lite Server - AI开发平台ModelArts
Lite Server - AI开发平台ModelArts

使用SFS盘出现报错rpc_check_timeout:939 callbacks suppressed 华为云CCE集群纳管GPU裸金属服务器由于CloudInit导致纳管失败的解决方案 GPU A系列裸金属服务器使用CUDA cudaGetDeviceCount()提示CUDA initializat失败

 帮助中心 > AI开发平台ModelArts > 故障排除
MA-Advisor性能调优建议工具使用指导 - AI开发平台ModelArts

环境和msprof-analyze的分析能力，ModelArts Standard 场景下对外提供一种插件化的 advisor 分析能力，详细的操作方式请参见基于advisor的昇腾训练性能自助调优指导。对于GPU和NPU性能比对、NPU多次训练之间性能比对的场景，昇腾提供了性

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导 > PyTorch迁移性能调优
查询数据集版本详情 - AI开发平台ModelArts

查询数据集版本详情根据版本ID查询数据集指定版本的详细信息。 dataset.get_version_info(version_id) 示例代码查询数据集指定版本的详细信息 from modelarts.session import Session from modelarts

帮助中心 > AI开发平台ModelArts > SDK参考 > 数据管理 > 数据集版本管理
查询单个样本详情 - AI开发平台ModelArts

查询单个样本详情根据样本ID查询数据集中指定样本的详细信息。 dataset.get_sample_info(sample_id) 示例代码根据ID查询数据集中样本的详细信息 from modelarts.session import Session from modelarts

帮助中心 > AI开发平台ModelArts > SDK参考 > 数据管理 > 样本管理
迁移效果校验 - AI开发平台ModelArts

迁移效果校验在pipeline适配完成后，需要验证适配后的效果是否满足要求，通过对比原始onnx pipeline的最终输出结果确认迁移效果。如果精度和性能都没有问题，则代表迁移完成。对比图片生成效果在CPU上推理onnx，将原始onnx和适配完成的MindSpore Lite

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导
查询标注任务详情 - AI开发平台ModelArts

查询标注任务详情查询标注任务的详细信息。 datset.get_label_task_info(task_id=None) 示例代码查询标注任务的详情。 task_info = dataset.get_label_task_info(task_id="xs9ZKzLluKzccQfsyi2")

帮助中心 > AI开发平台ModelArts > SDK参考 > 数据管理 > 标注任务管理
迁移环境准备 - AI开发平台ModelArts

迁移环境准备迁移环境准备有以下两种方式：表1 方式说明序号名称说明方式一 ModelArts Notebook 该环境为在线调试环境，主要面向演示、体验和快速原型调试场景。优点：可快速、低成本地搭建环境，使用标准化容器镜像，官方Notebook示例可直接运行。缺点

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导

总条数： 1414

上一页
1
...
10
11
12
...
71
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

W8A8量化 - AI开发平台ModelArts

准备Notebook - AI开发平台ModelArts

用户创建模型时构建镜像或导入文件失败 - AI开发平台ModelArts

在ModelArts数据集中添加图片对图片大小有限制吗？ - AI开发平台ModelArts

准备资源 - AI开发平台ModelArts

SDXL&SD1.5 ComfyUI基于Lite Cluster适配NPU推理指导（6.3.906） - AI开发平台ModelArts

MindStudio-Insight性能可视化工具使用指导 - AI开发平台ModelArts

精度问题概述 - AI开发平台ModelArts

ModelArts导入模型时，如何编写模型配置文件中的安装包依赖参数？ - AI开发平台ModelArts

重置节点后无法正常使用？ - AI开发平台ModelArts

迁移评估 - AI开发平台ModelArts

应用迁移 - AI开发平台ModelArts

创建Notebook实例后无法打开页面，如何处理？ - AI开发平台ModelArts

Lite Server - AI开发平台ModelArts

MA-Advisor性能调优建议工具使用指导 - AI开发平台ModelArts

查询数据集版本详情 - AI开发平台ModelArts

查询单个样本详情 - AI开发平台ModelArts

迁移效果校验 - AI开发平台ModelArts

查询标注任务详情 - AI开发平台ModelArts

迁移环境准备 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线