搜索_华为云

准备环境 - AI开发平台ModelArts
准备环境 - AI开发平台ModelArts

本步骤需要在节点机器，对kubectl进行集群访问配置。首先进入已创建的 CCE 集群控制版面中。根据图1的步骤进行操作，单击kubectl配置时，会弹出图2步骤页面。图1 配置中心根据图2，按步骤进行：判断是否安装 kubectl、下载kubectl配置文件、在机器中安装和配置kubectl。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.912） > 准备工作
配置ModelArts委托授权 - AI开发平台ModelArts

单击“添加授权”，进入“访问授权”配置页面，根据参数说明进行配置。表1 参数说明参数说明 “授权对象类型” 包括IAM子用户、联邦用户、委托用户和所有用户。 IAM子用户：由主账号在IAM中创建的用户，是服务的使用人员，具有独立的身份凭证（密码和访问密钥），根据账号授予的权限使用资源。IAM子用户相关介绍请参见IAM用户介绍。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio） > 配置MaaS访问授权
Ascend-vLLM介绍 - AI开发平台ModelArts

带来了极大的便利和性能提升。Ascend-vLLM可广泛应用于各种大模型推理任务，特别是在需要高性能和高效率的场景中，如自然语言处理、图像生成和语音识别等。 Ascend-vLLM的主要特点易用性：Ascend-vLLM简化了在大模型上的部署和推理过程，使开发者可以更轻松地使用它。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912）
ModelArts SDK、OBS SDK和MoXing的区别是什么？ - AI开发平台ModelArts

s较多功能需使用OBS中存储的数据，用户可使用OBS SDK进行调用，使用OBS存储您的数据。 OBS提供了多种语言SDK供选择，开发者可根据使用习惯下载OBS SDK进行调用。使用OBS SDK前，需下载OBS SDK包，然后在本地开发环境中安装使用。详细指导：《OBS SDK参考》

帮助中心 > AI开发平台ModelArts > 常见问题 > API/SDK
在ModelArts自动学习中，如何进行增量训练？ - AI开发平台ModelArts

在图片都标注完成后，单击右上角“开始训练”，在“训练设置”中，在“增量训练版本”中选择之前已完成的训练版本，在此版本基础上进行增量训练。其他参数请根据界面提示填写。设置完成后，单击“确定”，即进行增量训练。系统将自动跳转至“模型训练”页面，待训练完成后，您可以在此页面中查看训练详情，如

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard自动学习
使用SFS盘出现报错rpc_check_timeout:939 callbacks suppressed - AI开发平台ModelArts

但有时候会出现读取速度变慢的现象，并且SFS提示报错"rpc_check_timeout:939 callbacks suppressed"。原因分析根据SFS客户端日志分析出现问题的时间点发现，SFS盘连接的客户端个数较多，在问题的时间点并发读取数据，I/O超高；当前SFS服务端的机制是：

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
华为云CCE集群纳管GPU裸金属服务器由于CloudInit导致纳管失败的解决方案 - AI开发平台ModelArts

（后面称模板机）的实例ID信息，如果制作镜像不清理“/var/lib/cloud/*”就会导致用该镜像再重装模板机时，cloud-init根据残留目录（含实例ID）判断已经执行过一次，进而不会再执行user-data里面的脚本。而使用该镜像的服务器B和C，由于实例ID信息和镜像

 帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
创建训练任务 - AI开发平台ModelArts

认无误后单击“确定”。训练作业创建完成后，后台将自动完成容器镜像下载、代码目录下载、执行启动命令等动作。训练作业一般需要运行一段时间，根据您的训练业务逻辑和选择的资源不同，训练时长将持续几十分钟到几小时不等。训练作业执行成功后，日志信息如下所示。父主题：单机多卡

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 单机多卡
人工标注音频数据 - AI开发平台ModelArts

认显示“未标注”的音频列表。在“未标注”页签左侧音频列表中，单击目标音频文件，在右侧的区域中出现音频，单击音频下方，即可进行音频播放。根据播放内容，在下方“语音内容”文本框中填写音频内容。输入内容后单击下方的“确认标注”按钮完成标注。音频将被自动移动至“已标注”页签。图3

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 标注ModelArts数据集中的数据 > 通过人工标注方式标注数据
版本说明和要求 - AI开发平台ModelArts

benchmark_utils.py # 抽离的工具集 ├── generate_datasets.py # 生成自定义数据集的脚本 ├── requirements.txt # 第三方依赖 ├──benchmark_eval

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912）
执行训练任务【旧】 - AI开发平台ModelArts

即便模型训练中断，也可以基于checkpoint接续训练。当训练作业发生故障中断本次作业时，代码可自动从训练中断的位置接续训练，加载中断生成的checkpoint，中间不需要改动任何参数。可以通过训练脚本中的SAVE_INTERVAL参数来指定间隔多少step保存checkpoint。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.912） > 执行训练任务
创建训练作业 - AI开发平台ModelArts

modelarts.estimatorV2 import Estimator session = Session() #训练脚本里接收的参数，请根据实际情况填写 parameters = [{"name": "mod", "value":"gpu"}, {"name":

帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业
约束与限制 - AI开发平台ModelArts

间不会造成额外费用增加。更多信息，请参见导入AI应用对镜像大小的约束限制。自动学习项目中，在完成模型部署后，其生成的模型也将自动上传至模型列表中。但是自动学习生成的模型无法下载，只能用于部署上线。 Standard推理服务部署只支持使用专属资源池部署的在线服务使用Cloud

帮助中心 > AI开发平台ModelArts > 产品介绍
昇腾云服务6.3.904版本说明 - AI开发平台ModelArts

配套CANN8.0.RC1镜像无算子，包名：AscendCloud-OPP Scatter、Gather算子性能提升，满足MoE场景昇腾随机数生成算子与GPU保持一致支持GroupNorm+transpose+BMM融合算子 FFN推理算子支持geglu激活函数支持配套pybind推理的10+算子（matmul

帮助中心 > AI开发平台ModelArts > 服务公告 > 产品发布说明
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

桶的目录结构如下。 <bucket_name> |──llm_train # 解压代码包后自动生成的代码目录，无需用户创建 |── AscendSpeed # 代码目录

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.907） > 准备工作
训练作业日志中提示“No such file or directory” - AI开发平台ModelArts

被自动下载至训练容器的“${MA_JOB_DIR}/demo-code”目录中，demo-code为OBS存放代码路径的最后一级目录，可以根据实际修改。使用自定义镜像创建训练作业时，在代码目录下载完成后，镜像的启动命令会被自动执行。启动命令的填写规范如下：如果训练启动脚本用的是py文件，例如train

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
Lite Cluster使用流程 - AI开发平台ModelArts

要购买一个CCE集群。在ModelArts控制台购买Lite Cluster集群时，ModelArts的资源池会先纳管这个CCE集群，然后根据用户设置的规格创建相应的计算节点（BMS/ECS）。随后，CCE会对这些节点进行纳管，并且ModelArts会在CCE集群中安装npuDr

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster使用前必读
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

桶的目录结构如下。 <bucket_name> |──llm_train # 解压代码包后自动生成的代码目录，无需用户创建 |── AscendSpeed # 代码目录

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.908） > 准备工作
配置Grafana数据源 - AI开发平台ModelArts

s实例的Grafana数据源配置代码。在Grafana中增加数据源。登录Grafana。首次登录用户名和密码为admin，登录成功后可根据提示修改密码。在左侧菜单栏，选择“Configuration > Data Sources”，单击“Add data source”。图3

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源监控 > 使用Grafana查看AOM中的监控指标
数据准备使用流程 - AI开发平台ModelArts

帮助用户提高数据的质量。提供图像、文本、音频、视频等多种格式数据的预览，帮助用户识别数据质量。提供对数据进行多维筛选的能力，用户可以根据样本属性、标注信息等进行样本筛选。提供12+标注工具，方便用户进行精细化、场景化和专业化的数据标注。提供基于样本和标注结果进行特征分析，帮助用户整体了解数据的质量。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理

总条数： 1218

上一页
1
...
52
53
54
...
61
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

准备环境 - AI开发平台ModelArts

配置ModelArts委托授权 - AI开发平台ModelArts

Ascend-vLLM介绍 - AI开发平台ModelArts

ModelArts SDK、OBS SDK和MoXing的区别是什么？ - AI开发平台ModelArts

在ModelArts自动学习中，如何进行增量训练？ - AI开发平台ModelArts

使用SFS盘出现报错rpc_check_timeout:939 callbacks suppressed - AI开发平台ModelArts

华为云CCE集群纳管GPU裸金属服务器由于CloudInit导致纳管失败的解决方案 - AI开发平台ModelArts

创建训练任务 - AI开发平台ModelArts

人工标注音频数据 - AI开发平台ModelArts

版本说明和要求 - AI开发平台ModelArts

执行训练任务【旧】 - AI开发平台ModelArts

创建训练作业 - AI开发平台ModelArts

约束与限制 - AI开发平台ModelArts

昇腾云服务6.3.904版本说明 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

训练作业日志中提示“No such file or directory” - AI开发平台ModelArts

Lite Cluster使用流程 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

配置Grafana数据源 - AI开发平台ModelArts

数据准备使用流程 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线