搜索_华为云

AI开发基本概念 - AI开发平台ModelArts

聚类是把一组数据按照相似性和差异性分为几个类别，其目的是使得属于同一类别的数据间的相似性尽可能大，不同类别中的数据间的相似性尽可能小。它可以应用到客户群体的分类、客户背景分析、客户购买趋势预测、市场的细分等。与分类不同，聚类分析数据对象，而不考虑已知的类标号（一般训练数据中不提供类

 帮助中心 > AI开发平台ModelArts > 产品介绍 > AI开发基础知识
故障恢复 - AI开发平台ModelArts
故障恢复 - AI开发平台ModelArts

您可以设计和操作在可用区之间无中断地自动实现故障转移的应用程序和数据库。与传统的单个或多个数据中心基础设施相比，可用区具有更高的可用性、容错性和可扩展性。 ModelArts通过对DB的数据进行备份，保证在原数据被破坏或损坏的情况下可以恢复业务。开发环境故障恢复针对用户创建

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
查看训练作业资源占用情况 - AI开发平台ModelArts

tch_YLLsize过大导致内存溢出。提升数据读取的效率：如果读取一个batch数据的时间要长于GPU/NPU计算一个batch的时间，就有可能出现GPU/NPU利用率上下浮动的情况。建议优化数据读取和数据增强的性能，例如将数据读取并行化，或者使用NVIDIA Data Loading

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
训练场景和方案介绍 - AI开发平台ModelArts

名称获取路径插件代码包 AscendCloud-6.3.908软件包中的AscendCloud-AIGC-6.3.908-xxx.zip 文件名中的xxx表示具体的时间戳，以包名发布的实际时间为准。获取路径：Support-E 说明：如果上述软件获取路径打开后未显示相应的软件

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理 > SD1.5&SDXL Koyha框架基于DevServer适配PyTorch NPU训练指导（6.3.908）
日志提示“CUDNN_STATUS_NOT_SUPPORTED. ” - AI开发平台ModelArts

input. 原因分析出现该问题的可能原因如下：数据输入不连续，cuDNN不支持的类型。处理方法禁用cuDNN，在训练前加入如下代码。 torch.backends.cudnn.enabled = False 将输入数据转换成contiguous。 images = images

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
训练场景和方案介绍 - AI开发平台ModelArts

名称获取路径插件代码包 AscendCloud-6.3.908软件包中的AscendCloud-AIGC-6.3.908-xxx.zip 文件名中的xxx表示具体的时间戳，以包名发布的实际时间为准。获取路径：Support-E 说明：如果上述软件获取路径打开后未显示相应的软件

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理 > SD1.5&SDXL Diffusers框架基于DevServer适配PyTorch NPU训练指导（6.3.908）
查询可视化作业详情 - AI开发平台ModelArts

可视化作业的运行时长，单位为毫秒。 create_time Long 可视化作业的创建时间，时间戳格式。 train_url String 可视化作业输出文件OBS路径。 status Int 可视化作业的运行状态，详细作业状态列表请参见作业状态参考。请求示例如下以查询作业ID为10的可视化作业为例。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 可视化作业
推理场景介绍 - AI开发平台ModelArts

28。版本使用的容器引擎为Containerd。推理部署使用的服务框架是vLLM。vLLM支持v0.6.3版本。支持FP16和BF16数据类型推理。 Lite k8s Cluster驱动版本推荐为23.0.6。适配的CANN版本是cann_8.0.rc3。资源规格要求本

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911）
重建、停止或删除训练作业 - AI开发平台ModelArts

在“训练作业”页面，删除运行结束的训练作业。您可以单击“操作”列的“删除”，在弹出的提示框中单击“确认”，删除对应的训练作业。进入OBS，删除本训练作业使用的OBS桶及文件。查找训练作业当用户使用IAM账号登录时，训练作业列表会显示IAM账号下所有训练作业。ModelArts提供查找训练作业功能帮助用户快速查找训练作业。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
附录：大模型推理常见问题 - AI开发平台ModelArts

max_model_len is greater than the drived max_model_len。解决方法：修改config.json文件中的"seq_length"的值，"seq_length"需要大于等于 --max-model-len的值。config.json存在模型

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.910）
MindSpore日志提示“ retCode=0x91, [the model stream execute failed]” - AI开发平台ModelArts

failed] 原因分析出现该问题的可能原因如下：数据读入的速度跟不上模型迭代的速度。处理方法减少预处理shuffle操作。 dataset = dataset.shuffle(buffer_size=x) 关闭数据预处理开关，可能会影响性能。 NPURunConfig(

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
切换Lite Server服务器操作系统 - AI开发平台ModelArts

v1/region" ) func main() { // 认证用的ak和sk硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全； // 本示例以ak和sk保存在环境变量中来实现身份验证为例，运行本示例前请先在本地环境中

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源管理
资源池监控 - AI开发平台ModelArts

minimun：最小值统计 sum：求和统计 average：平均值统计 sampleCount：采样统计 period 否 String 监控数据粒度，单位为秒。可选值如下： 60：粒度为1分钟，默认值 300：粒度为5分钟 900：粒度为15分钟 3600：粒度为1小时请求参数无

 帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
使用AI市场物体检测YOLOv3 - AI开发平台ModelArts

'feat_2': 'feat_2:0', 'feat_3': 'feat_3:0'} 不做数据集切分操作。如果选择未切分的数据集，算法将做纯训练场景；父主题：服务部署

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

本的软件包，请严格遵照版本配套关系使用本文档。推理部署使用的服务框架是vLLM。vLLM支持v0.4.2版本。仅支持FP16和BF16数据类型推理。本案例仅支持在专属资源池上运行。支持的模型列表本方案支持的模型列表、对应的开源权重获取地址如表1所示。表1 支持的模型列表和权重获取地址

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906）
昇腾能力应用地图 - AI开发平台ModelArts

推理 PyTorch Open-Sora-Plan1.0基于DevServer适配PyTorch NPU训练推理指导（6.3.907）表9 内容审核模型模型名称应用场景软件技术栈指导文档 Bert 推理 MindSpore Lite Bert基于DevServer适配MindSpore

帮助中心 > AI开发平台ModelArts > 最佳实践
运行训练作业时提示URL连接超时 - AI开发平台ModelArts

timed out> 原因分析由于安全性问题在ModelArts上不能联网下载。处理方法如果在运行训练作业时提示连接超时，请您将需要联网下载的数据提前下载至本地，并上传至OBS中。父主题：外网访问限制

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 外网访问限制
在线服务预测报错DL.0105 - AI开发平台ModelArts

0105，报错日志：“TypeError:‘float’object is not subscriptable”。原因分析根据报错日志分析，是因为一个float数据被当做对象下标访问了。处理方法将模型推理代码中的x[0][i]修改为x[i]，重新部署服务进行预测。父主题：服务预测

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
开发Workflow的核心概念介绍 - AI开发平台ModelArts

flow节点。 Data 数据对象用于节点的输入，主要可分为以下三种类型：真实的数据对象，在工作流构建时直接指定： Dataset：用于定义已有的数据集，常用于数据标注，模型训练等场景 LabelTask: 用于定义已有的标注任务，常用于数据标注，数据集版本发布等场景 OBSP

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考
NPU_Flash_Attn融合算子约束 - AI开发平台ModelArts

`disable_gradient_checkpointing: true` 关闭，但显存占用会直线上升。 attn_mask只支持布尔（bool）数据类型，或者为None。 query的shape仅支持 [B, N1, S1, D]，其中N1≤ 2048，D≤ 512并且dim== 4。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.911） > 训练脚本说明

总条数： 1877

上一页
1
...
82
83
84
...
94
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

AI开发基本概念 - AI开发平台ModelArts

故障恢复 - AI开发平台ModelArts

查看训练作业资源占用情况 - AI开发平台ModelArts

训练场景和方案介绍 - AI开发平台ModelArts

日志提示“CUDNN_STATUS_NOT_SUPPORTED. ” - AI开发平台ModelArts

训练场景和方案介绍 - AI开发平台ModelArts

查询可视化作业详情 - AI开发平台ModelArts

推理场景介绍 - AI开发平台ModelArts

重建、停止或删除训练作业 - AI开发平台ModelArts

附录：大模型推理常见问题 - AI开发平台ModelArts

MindSpore日志提示“ retCode=0x91, [the model stream execute failed]” - AI开发平台ModelArts

切换Lite Server服务器操作系统 - AI开发平台ModelArts

资源池监控 - AI开发平台ModelArts

使用AI市场物体检测YOLOv3 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

昇腾能力应用地图 - AI开发平台ModelArts

运行训练作业时提示URL连接超时 - AI开发平台ModelArts

在线服务预测报错DL.0105 - AI开发平台ModelArts

开发Workflow的核心概念介绍 - AI开发平台ModelArts

NPU_Flash_Attn融合算子约束 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线