搜索_华为云

创建网络 - AI开发平台ModelArts
创建网络 - AI开发平台ModelArts

创建网络登录ModelArts管理控制台，在左侧导航栏中选择“AI专属资源池 > 弹性集群 Cluster”，进入“弹性集群 Cluster”页面。切换到“网络”页签，单击“创建”，弹出“创建网络”页面。图1 网络列表在“创建网络”弹窗中填写网络信息。网络名称：创建网络时默认生成网络名称，也可自行修改。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 基本配置
推理精度测试 - AI开发平台ModelArts

（可选，如果选择使用humaneval数据集） pip install -e . # 可选，如果选择使用humaneval数据集 pip install huggingface-hub==0.25.1 （可选）如果需要在humaneval数据集上评估模型代码能力，请执行此步骤，否

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.909）
预训练任务 - AI开发平台ModelArts

Step1 上传训练权重文件和数据集如果在准备代码和数据阶段已经上传权重文件和数据集到容器中，可以忽略此步骤。如果未上传训练权重文件和数据集到容器中，具体参考上传代码和权重文件到工作环境和上传数据到指定目录章节完成。训练脚本中会自动执行训练前的权重转换操作和数据处理操作。如果想详细

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.907）
LoRA微调训练 - AI开发平台ModelArts

Step1 上传训练权重文件和数据集如果在准备代码和数据阶段已经上传权重文件和数据集到容器中，可以忽略此步骤。如果未上传训练权重文件和数据集到容器中，具体参考上传代码和权重文件到工作环境和上传数据到指定目录章节完成。训练脚本中会自动执行训练前的权重转换操作和数据处理操作。如果想详细

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.907）
开发第一条Workflow - AI开发平台ModelArts

版本列表。准备数据集进入AI Gallery，搜索8类常见生活垃圾图片数据集。单击“下载”，选择云服务区域“华北-北京四”，单击“确定”进入下载详情页。填写如下参数：下载方式：ModelArts数据集。目标区域：华北-北京四。数据类型：图片。数据集输出位置：用来存

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发
LLaVA模型基于DevServer适配PyTorch NPU预训练指导（6.3.906） - AI开发平台ModelArts

v1.5 · Hugging Face 图1 下载vicuna-13b-v1.5模型 Step4 下载数据集请用户自行下载GQA数据集，下载地址：images。将GQA数据集放于${container_work_dir}/multimodal_algorithm/LLAVA/

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
发布技术文章（AI说） - AI开发平台ModelArts

发布技术文章（AI说） AI Gallery中的“AI说”，是一个AI开发人员的交流园地。在这里可以阅读其他用户分享的技术文章，并参与评论。也可以发布分享个人技术文章。前提条件已入驻AI Gallery。发布技术文章进入AI Gallery首页，单击“AI说”，在下拉框中单击“AI说

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（旧版） > 参加活动
服务预测请求体大小限制是多少？ - AI开发平台ModelArts

服务预测请求体大小限制是多少？服务部署完成且服务处于运行中后，可以往该服务发送推理的请求，请求的内容根据模型的不同可以是文本，图片，语音，视频等内容。当使用调用指南页签中显示的调用地址（华为云APIG网关服务的地址）预测时，对请求体的大小限制是12MB，超过12MB时，请求会被拦截。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署 > 部署上线 > 功能咨询
如何使用soft NMS方法降低目标框堆叠度 - AI开发平台ModelArts

如何使用soft NMS方法降低目标框堆叠度目前华为云AI市场订阅的算法YOLOv3-Ascend（物体检测/TensorFlow）中可以使用soft NMS，YOLOv5算法文档中没有看到相关支持的信息，需要自定义算法进行使用。父主题：功能咨询

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard训练作业 > 功能咨询
训练作业的“/cache”目录是否安全？ - AI开发平台ModelArts

训练作业的“/cache”目录是否安全？ ModelArts训练作业的程序运行在容器中，容器挂载的目录地址是唯一的，只有运行时的容器能访问到。因此训练作业的“/cache”是安全的。父主题：创建训练作业

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard训练作业 > 创建训练作业
使用pip install提示Read timed out - AI开发平台ModelArts

使用pip install提示Read timed out 问题现象在Notebook实例中，使用pip install时，提示“ReadTimeoutError...”或者“Read timed out...”的错误。解决办法建议先尝试使用pip install --upgrade

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > Notebook实例常见错误
服务启动后，状态断断续续处于“告警中” - AI开发平台ModelArts

服务启动后，状态断断续续处于“告警中” 问题现象预测流量不大但频繁出现以下报错 Backend service internal error. Backend service read timed out Send the request from gateway to the

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
Cluster资源池节点故障如何定位 - AI开发平台ModelArts

Cluster资源池节点故障如何定位故障说明和处理建议图1 Lite池故障处理流程对于ModelArts Lite资源池，每个节点会以DaemonSet方式部署node-agent组件，该组件会检测节点状态，并将检测结果写到K8S NodeCondtition中。同时，节点

 帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Cluster
日志提示“UnboundLocalError: local variable 'epoch'” - AI开发平台ModelArts

日志提示“UnboundLocalError: local variable 'epoch'” 问题现象使用YOLOv5算法增量训练时出现如下报错：UnboundLocalError: local variable 'epoch' referenced before assignment。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 预置算法运行故障
查询作业资源规格 - AI开发平台ModelArts

查询作业资源规格功能介绍查看指定作业类型的资源规格。创建训练作业和预测作业需要指定资源规格。 URI GET /v1/{project_id}/job/resource-specs 参数说明如表1所示。表1 参数说明参数是否必选参数类型说明 project_id 是

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 资源和引擎规格接口
MA-Advisor自动诊断工具使用指导 - AI开发平台ModelArts

MA-Advisor自动诊断工具使用指导自动诊断工具MA-Advisor简介 MA-Advisor使用指导昇腾迁移融合算子API替换样例 AI CPU算子替换样例父主题： GPU业务迁移至昇腾训练推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理
配置IAM权限 - AI开发平台ModelArts

选择授权范围方案为“所有资源”，单击“确定”。精细化授权管理如果您需要进行精细的权限管理，可参考《ModelArts API参考》中的权限策略和授权项。数据管理权限开发环境权限训练作业权限模型管理权限服务管理权限工作空间管理权限精细化授权案例可参考管理员和开发者权限分离。父主题：

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 基本配置 > 权限配置
创建单机多卡的分布式训练（DataParallel） - AI开发平台ModelArts

el）本章节介绍基于PyTorch引擎的单机多卡数据并行训练。 MindSpore引擎的分布式训练参见MindSpore官网。训练流程简述单机多卡数据并行训练流程介绍如下：将模型复制到多个GPU上将一个Batch的数据均分到每一个GPU上各GPU上的模型进行前向传播，得到输出

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 分布式模型训练
使用SDK调测单机训练作业 - AI开发平台ModelArts

is_local_source=True) 参数解释： is_local_source：可选参数，默认为False，指定训练数据的保存位置。 False：训练数据保存在参数obs_path指定的位置中； True：训练数据保存在notebook中，由local_path指定。 obs_path：obs地址。根据i

帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业 > 训练作业调测
管理Lite Cluster节点 - AI开发平台ModelArts

节点资源标签。图4 添加/编辑/删除资源标签导出节点数据支持导出Lite资源池的节点信息到Excel表格中，方便查阅。勾选节点名称，在节点列表上方单击“导出 > 导出全部数据到XLSX”或者“导出 > 导出部分数据到XLSX”，在浏览器的下载记录中查看导出的Excel表格。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理

总条数： 2647

上一页
1
...
60
61
62
...
133
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建网络 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

预训练任务 - AI开发平台ModelArts

LoRA微调训练 - AI开发平台ModelArts

开发第一条Workflow - AI开发平台ModelArts

LLaVA模型基于DevServer适配PyTorch NPU预训练指导（6.3.906） - AI开发平台ModelArts

发布技术文章（AI说） - AI开发平台ModelArts

服务预测请求体大小限制是多少？ - AI开发平台ModelArts

如何使用soft NMS方法降低目标框堆叠度 - AI开发平台ModelArts

训练作业的“/cache”目录是否安全？ - AI开发平台ModelArts

使用pip install提示Read timed out - AI开发平台ModelArts

服务启动后，状态断断续续处于“告警中” - AI开发平台ModelArts

Cluster资源池节点故障如何定位 - AI开发平台ModelArts

日志提示“UnboundLocalError: local variable 'epoch'” - AI开发平台ModelArts

查询作业资源规格 - AI开发平台ModelArts

MA-Advisor自动诊断工具使用指导 - AI开发平台ModelArts

配置IAM权限 - AI开发平台ModelArts

创建单机多卡的分布式训练（DataParallel） - AI开发平台ModelArts

使用SDK调测单机训练作业 - AI开发平台ModelArts

管理Lite Cluster节点 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线