搜索_华为云

重试/停止/运行Workflow节点 - AI开发平台ModelArts

序执行部分运行节点。部分运行Workflow节点，首先在新开发Workflow时，需要预先定义好部分运行场景。具体流程如下：通过SDK创建工作流时，预先定义好部分运行场景，具体可参考在Workflow中指定仅运行部分节点。在配置工作流时，打开“部分运行”开关，选择需要执行的

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 管理Workflow
查询服务列表 - AI开发平台ModelArts

service_id String 服务ID。 service_name String 服务名称。 description String 服务描述。 tenant String 服务归属租户。 project String 服务归属项目。 owner String 服务归属用户。 publish_at

帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
查询服务对象列表 - AI开发平台ModelArts

service_id String 服务ID。 service_name String 服务名称。 description String 服务描述。 tenant String 服务归属租户。 project String 服务归属项目。 owner String 服务归属用户。 publish_at

帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
升级模型服务 - AI开发平台ModelArts

Studio”进入ModelArts Studio大模型即服务平台。在ModelArts Studio左侧导航栏中，选择“模型部署”进入服务列表。选择“我的服务”页签。选择模型服务，单击操作列的“更多 > 服务升级”。在服务升级页面，配置升级参数。 “模型设置”：单击“更换”，选择原模型下的其他模型版本。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio） > 管理我的服务
Standard支持的AI框架 - AI开发平台ModelArts

0-ubuntu18.04 CPU运筹优化求解器开发基础镜像，预置cylp，cbcpy，ortools及cplex CPU 是是训练作业创建训练作业时，训练支持的AI引擎及对应版本如下所示。预置引擎命名格式如下： <训练引擎名称_版本号>-[cpu | <cuda_版本号 |

帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍 > Standard功能介绍
管理AI Gallery数据集 - AI开发平台ModelArts

添加新用户。登录AI Gallery，单击右上角“我的Gallery”进入我的Gallery页面。选择“我的资产 > 数据集”，在“我创建的数据集”页面找到待修改的数据集，单击数据集页签进入详情页。在数据集详情页，选择“设置”。在“可用申请”处输入账号名、账号ID或用户昵

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery数据集
增量模型训练 - AI开发平台ModelArts

reload ckpt的代码，使能读取前一次训练保存的预训练模型。在ModelArts训练中实现增量训练，建议使用“训练输出”功能。在创建训练作业时，设置训练“输出”参数为“train_url”，在指定的训练输出的数据存储位置中保存Checkpoint，且“预下载至本地目录”

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

\n\n4.个人防护装备：确保您和您的同事穿戴正确的个人防护装备，如安全鞋、透明眼镜或面罩、手套等。\n\n5.创建一个安全文化：鼓励个人对安全的责任感和意识，并创建一个安全文化，使人们始终关注他们自己和他人的安全。\n\n6.持续监测和改进：持续监测和改进安全准则和程序，以确保

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.912） > 准备工作
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

\n\n4.个人防护装备：确保您和您的同事穿戴正确的个人防护装备，如安全鞋、透明眼镜或面罩、手套等。\n\n5.创建一个安全文化：鼓励个人对安全的责任感和意识，并创建一个安全文化，使人们始终关注他们自己和他人的安全。\n\n6.持续监测和改进：持续监测和改进安全准则和程序，以确保

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.911） > 准备工作
查询算法详情 - AI开发平台ModelArts

advanced_config object 算法高级策略： auto_search 表3 metadata 参数参数类型描述 id Integer 算法uuid，创建算法时无需填写。 name String 算法名称。限制为1-64位只含数字、字母、下划线和中划线的名称。 description String

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
无法导入模块 - AI开发平台ModelArts

包。处理方法训练作业导入模块时日志出现前两条报错信息，处理方法如下：首先保证被导入的module中有“__init__.py”存在，创建“module_dir”的“__init__.py”，如原因分析中的结构所示。由于无法知晓“project_dir”在容器中的位置，所以利用绝对路径，在“main

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
LLaMA-VID基于DevServer适配PyTorch NPU推理指导（6.3.910） - AI开发平台ModelArts

能通过SSH登录，不同机器之间网络互通。购买DevServer资源时如果无可选资源规格，需要联系华为云技术支持申请开通。当容器需要提供服务给多个用户，或者多个用户共享使用该容器时，应限制容器访问Openstack的管理地址（169.254.169.254），以防止容器获取宿主

 帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理
修改模型服务QPS - AI开发平台ModelArts

Studio大模型即服务平台。在ModelArts Studio左侧导航栏中，选择“模型部署”进入服务列表。选择“我的服务”页签。选择模型服务，单击操作列的“更多 > 设置QPS”，在弹窗中修改数值，单击“提交”启动修改任务。图1 修改QPS 在我的服务列表，单击服务名称，进入服

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio） > 管理我的服务
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

\n\n4.个人防护装备：确保您和您的同事穿戴正确的个人防护装备，如安全鞋、透明眼镜或面罩、手套等。\n\n5.创建一个安全文化：鼓励个人对安全的责任感和意识，并创建一个安全文化，使人们始终关注自己和他人的安全。\n\n6.持续监测和改进：持续监测和改进安全准则和程序，以确保它们

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.911） > 准备工作
查询数据处理任务的版本详情 - AI开发平台ModelArts

参数类型描述 add_sample_count Integer 处理后新增的图片数量。 create_time Long 数据处理任务的创建时间。 deleted_sample_count Integer 处理后删除的图片数量。 description String 数据处理任务的版本描述。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
更新算法 - AI开发平台ModelArts
更新算法 - AI开发平台ModelArts

auto_search 表3 AlgorithmMetadata 参数是否必选参数类型描述 id 否 Integer 算法uuid，创建算法时无需填写。 name 是 String 算法名称。限制为1-64位只含数字、字母、下划线和中划线的名称。 description 否

 帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
训练作业运行失败排查指导 - AI开发平台ModelArts

原因：训练作业使用的镜像CUDA版本只支持sm_37、sm_50、sm_60和sm_70的加速卡，不支持sm_80。处理建议：使用自定义镜像创建训练作业，并安装高版本的cuda以及对应的PyTorch版本。查看训练作业的“日志”，出现报错“ERROR:root:label_map

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 训练作业运行失败
msprobe梯度监控 - AI开发平台ModelArts

中的问题。使用步骤如下：通过pip安装msprobe工具。 # shell pip install mindstudio-probe 创建配置文件config.json。 { "task": "grad_probe", "dump_path": "./dump_path"

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > msprobe工具使用指导
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

将下载的原始数据存放在/home/ma-user/ws/training_data目录下。具体步骤如下：进入到/home/ma-user/ws/目录下。创建目录“training_data”，并将原始数据放置在此处。 mkdir training_data 数据存放参考目录结构如下： ${wo

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU训练指导（6.3.906） > 准备工作
查询工作流定时调度详情 - AI开发平台ModelArts

ID标记。 policies WorkflowSchedulePolicies object 调度策略。 created_at String 创建时间。表3 WorkflowSchedulePolicies 参数参数类型描述 on_failure String 定时调度策略中的标记，失败时触发。

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理

总条数： 1574

上一页
1
...
62
63
64
...
79
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

重试/停止/运行Workflow节点 - AI开发平台ModelArts

查询服务列表 - AI开发平台ModelArts

查询服务对象列表 - AI开发平台ModelArts

升级模型服务 - AI开发平台ModelArts

Standard支持的AI框架 - AI开发平台ModelArts

管理AI Gallery数据集 - AI开发平台ModelArts

增量模型训练 - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

查询算法详情 - AI开发平台ModelArts

无法导入模块 - AI开发平台ModelArts

LLaMA-VID基于DevServer适配PyTorch NPU推理指导（6.3.910） - AI开发平台ModelArts

修改模型服务QPS - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

查询数据处理任务的版本详情 - AI开发平台ModelArts

更新算法 - AI开发平台ModelArts

训练作业运行失败排查指导 - AI开发平台ModelArts

msprobe梯度监控 - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

查询工作流定时调度详情 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线