搜索_华为云

创建Workflow数据集标注节点 - AI开发平台ModelArts

Workflow数据集标注节点代码样例主要包含三种场景的用例：场景一：基于用户指定的数据集创建标注任务，并等待用户标注完成。使用场景：用户只创建了一个未标注完成的数据集，需要在工作流运行时对数据进行人工标注。可以放在数据集导入节点之后，对导入的新数据进行人工标注。数据准备：提前在Mo

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 创建Workflow节点
产品发布说明 - AI开发平台ModelArts

ModelArts版本配套关系表昇腾云服务6.3.912版本说明昇腾云服务6.3.911版本说明昇腾云服务6.3.910版本说明（推荐）昇腾云服务6.3.909版本说明昇腾云服务6.3.908版本说明昇腾云服务6.3.907版本说明昇腾云服务6.3.906版本说明昇腾云服务6.3.905版本说明

 帮助中心 > AI开发平台ModelArts > 服务公告
OBS操作相关故障 - AI开发平台ModelArts

OBS操作相关故障读取文件报错，如何正确读取文件 TensorFlow-1.8作业连接OBS时反复出现提示错误 TensorFlow在OBS写入TensorBoard到达5GB时停止保存模型时出现Unable to connect to endpoint错误 OBS复制过程中提示“BrokenPipeError:

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业
部署推理服务 - AI开发平台ModelArts

部署推理服务非分离部署推理服务分离部署推理服务父主题：主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.909）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.909）
LoRA训练 - AI开发平台ModelArts
LoRA训练 - AI开发平台ModelArts

LoRA训练本章节介绍SDXL&SD 1.5模型的LoRA训练过程。LoRA训练是指在已经训练好的模型基础上，使用新的数据集进行LoRA微调以优化模型性能的过程。启动SD1.5 LoRA训练服务使用ma-user用户执行如下命令运行训练脚本。 sh diffusers_lora_train

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理 > SD1.5&SDXL Diffusers框架基于DevServer适配PyTorch NPU训练指导（6.3.908）
在开发环境中部署本地服务进行调试 - AI开发平台ModelArts

权重百分比，分配到此模型的流量权重，部署本地服务Predictor时，取值100。 specification 是 String 部署本地服务时，取值为“local”。 instance_count 是 Integer 模型部署的实例数，当前限制最大实例数为128，部署本地服务Predictor时，取值为1。

帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
用户结束kernelgateway进程后报错Server Connection Error，如何恢复？ - AI开发平台ModelArts

选不到Kernel 原因分析用户误操作引起的。解决方案打开Terminal窗口，执行以下命令启动kernelgateway服务。 API_TYPE=kernel_gateway.jupyter_websocket LOG_DIR="/home/ma-user/log" mkdir -p ${LOG_DIR}

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 环境配置故障
查看训练作业事件 - AI开发平台ModelArts

查看训练作业事件训练作业的（从用户可看见训练作业开始）整个生命周期中，每一个关键事件点在系统后台均有记录，用户可随时在对应训练作业的详情页面进行查看。方便用户更清楚的了解训练作业运行过程，遇到任务异常时，更加准确的排查定位问题。当前支持的作业事件如下所示：训练作业创建成功训练作业创建失败报错：

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
从DLI导入数据到ModelArts数据集 - AI开发平台ModelArts

从DLI导入数据，用户需要选择DLI队列、数据库和表名称。所选择的表的schema(列名和类型)需与数据集一致，支持自动获取所选择表的schema。DLI的详细功能说明，请参考DLI用户指南。图1 DLI导入数据队列名称：系统自动将当前账号下的DLI队列展现在列表中，用户可以在下拉框中选择需要的队列。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 导入数据到ModelArts数据集
分布式训练功能介绍 - AI开发平台ModelArts

须有8张卡。本文档提供的调测代码中涉及到的OBS路径，请用户替换为自己的实际OBS路径。本文档提供的调测代码是以PyTorch为例编写的，不同的AI框架之间，整体流程是完全相同的，只需要修改个别的参数即可。 DataParallel进行单机多卡训练的优缺点代码简单：仅需修改一行代码。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 分布式模型训练
获取项目ID和名称 - AI开发平台ModelArts

注册并登录管理ModelArts控制台。在页面右上角单击用户名，然后在下拉列表中单击“我的凭证”，进入“我的凭证”页面。如果您登录的是华为云官网，而非管理控制台。在单击用户名后，选择下拉列表中的“帐号中心”，然后单击“管理我的凭证”进入“我的凭证”页面。在“API凭证”页面

 帮助中心 > AI开发平台ModelArts > API参考 > 公共参数
用户使用torch报错Unexpected error from cudaGetDeviceCount - AI开发平台ModelArts

# cuda版本 nvcc --version # nvidia-smi版本 nvidia-smi # torch版本（要确定用户用的哪个conda下的python） python -c "import torch;print(torch.__version__)" 通过pyto

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 自定义镜像故障
推理场景介绍 - AI开发平台ModelArts

本方案介绍了在ModelArts的Lite k8s Cluster上使用昇腾计算资源开展常见开源大模型Llama、Qwen、ChatGLM、Yi、Baichuan等推理部署的详细过程。本方案利用适配昇腾平台的大模型推理服务框架vLLM和华为自研昇腾Snt9B硬件，为用户提供推理部署方案，帮助用户使能大模型业务。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910）
查看Workflow工作流运行记录 - AI开发平台ModelArts

运行记录是展示某条工作流所有运行状态数据的地方。在Workflow列表页，单击某条工作流的名称，进入该工作流的详情页面。在工作流的详情页，左侧区域即为该条工作流的所有运行记录。图1 查看运行记录您可以对当前工作流的所有运行记录，进行删除、编辑以及重新运行的操作。删除：如果该条运行记

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 管理Workflow
ModelArts Standard资源监控 - AI开发平台ModelArts

Standard资源监控概述在ModelArts控制台查看监控指标在AOM控制台查看ModelArts所有监控指标使用Grafana查看AOM中的监控指标

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard）
注册伙伴 - AI开发平台ModelArts
注册伙伴 - AI开发平台ModelArts

注册伙伴仅当暂未注册伙伴的用户可以注册伙伴。在“AI Gallery”页面中，单击右上角“我的Gallery > 我的主页”进入个人中心页面。左侧菜单栏选择“解决方案”进入解决方案列表页，单击右上方“发布”进入合作伙伴申请页面。如果已经是伙伴用户，则会进入发布解决方案页面。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（旧版） > 合作伙伴
训练图像分类模型 - AI开发平台ModelArts

完成图片标注后，可进行模型的训练。模型训练的目的是得到满足需求的图像分类模型。请参考前提条件确保已标注的图片符合要求，否则数据集校验将会不通过。前提条件请确保您的数据集中的已标注的图片不低于100张。请确保您的数据集中至少存在2种以上的图片分类，且每种分类的图片不少于5张。操作步骤

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用自动学习实现图像分类
查看日志和性能 - AI开发平台ModelArts

查看日志和性能单击作业详情页面，则可查看训练过程中的详细信息。图1 查看训练作业在作业详情页的日志页签，查看最后一个节点的日志，其包含“elapsed time per iteration (ms)”数据，可换算为tokens/s/p的性能数据。吞吐量（tokens/s/p）：global

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.910）
查看日志和性能 - AI开发平台ModelArts

查看日志和性能单击作业详情页面，则可查看训练过程中的详细信息。图1 查看训练作业在作业详情页的日志页签，查看最后一个节点的日志，其包含“elapsed time per iteration (ms)”数据，可换算为tokens/s/p的性能数据。吞吐量（tokens/s/p）：global

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.908）
查看日志和性能 - AI开发平台ModelArts

查看日志和性能单击作业详情页面，则可查看训练过程中的详细信息。图1 查看训练作业在作业详情页的日志页签，查看最后一个节点的日志，其包含“elapsed time per iteration (ms)”数据，可换算为tokens/s/p的性能数据。吞吐量（tokens/s/p）：global

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.912）

总条数： 2393

上一页
1
...
77
78
79
...
120
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建Workflow数据集标注节点 - AI开发平台ModelArts

产品发布说明 - AI开发平台ModelArts

OBS操作相关故障 - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

LoRA训练 - AI开发平台ModelArts

在开发环境中部署本地服务进行调试 - AI开发平台ModelArts

用户结束kernelgateway进程后报错Server Connection Error，如何恢复？ - AI开发平台ModelArts

查看训练作业事件 - AI开发平台ModelArts

从DLI导入数据到ModelArts数据集 - AI开发平台ModelArts

分布式训练功能介绍 - AI开发平台ModelArts

获取项目ID和名称 - AI开发平台ModelArts

用户使用torch报错Unexpected error from cudaGetDeviceCount - AI开发平台ModelArts

推理场景介绍 - AI开发平台ModelArts

查看Workflow工作流运行记录 - AI开发平台ModelArts

ModelArts Standard资源监控 - AI开发平台ModelArts

注册伙伴 - AI开发平台ModelArts

训练图像分类模型 - AI开发平台ModelArts

查看日志和性能 - AI开发平台ModelArts

查看日志和性能 - AI开发平台ModelArts

查看日志和性能 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线