搜索_华为云

准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

|──llm_inference # 推理代码包 |──llm_tools # 推理工具代码上传至SFS Turbo 将AscendSpeed代码包AscendCloud-LLM-xxx.zip直接上传至ECS服务器中的SFS

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.911） > 准备工作
通过AK/SK认证的方式访问在线服务 - AI开发平台ModelArts

Name），AK（Access Key Id），SK（Secret Access Key）。图1 credential.csv文件内容 AK/SK生成步骤：注册并登录管理控制台。单击右上角的用户名，在下拉列表中单击“我的凭证”。单击“访问密钥”。单击“新增访问密钥”，进入“身份验证”页面。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的认证方式
附录：训练常见问题 - AI开发平台ModelArts

ue 将yaml文件中的per_device_train_batch_size调小，重新训练如未解决则执行下一步。替换深度学习训练加速的工具或增加zero等级，可参考模型NPU卡数、梯度累积值取值表，如原使用Accelerator可替换为Deepspeed-ZeRO-1，Dee

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.909）
查看模型评估结果 - AI开发平台ModelArts

nifest文件格式）使用moxing的copy_manifest接口将文件复制到本地并获取新的manifest文件路径，然后使用SDK解析新的manifest文件。 ModelArts数据管理模块在重构升级中，对未使用过数据管理的用户不可见。建议新用户将训练数据存放至OBS桶中使用。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
创建并完成图像分类的智能标注任务 - AI开发平台ModelArts

调用获取智能任务的信息接口根据智能标注的任务ID查询任务详情。待智能标注任务完成后，调用查询智能标注的样本列表接口可以查看标注结果。调用批量更新样本标签根据获取的智能标注样本列表确认智能标注结果。前提条件已获取IAM的EndPoint和ModelArts的EndPoint。

帮助中心 > AI开发平台ModelArts > API参考 > 应用示例
获取APP列表 - AI开发平台ModelArts

APP密钥。 app_type String APP类型。枚举值如下： APIC：该APP注册在roma connect网关上 APIG：该APP注册在共享API网关上 DEDICATE_APIG：该APP注册在专享API网关上 bounded_api_count Integer APP绑定API数量。

帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理
使用CodeLab免费体验Notebook - AI开发平台ModelArts

释放资源。保存在其中的代码文档将丢失，请注意备份文件以及使用时长。 CodeLab入口 ModelArts管理控制台的“总览”页在“开发工具”区域下方，展示“CodeLab”简介卡片，单击“立即体验”，即可进入。图1 CodeLab入口 AI Gallery页面提供的Notebook样例

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试
附录：训练常见问题 - AI开发平台ModelArts

ue 将yaml文件中的per_device_train_batch_size调小，重新训练如未解决则执行下一步。替换深度学习训练加速的工具或增加zero等级，可参考模型NPU卡数、梯度累积值取值表，如原使用Accelerator可替换为Deepspeed-ZeRO-1，Dee

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.910）
附录：训练常见问题 - AI开发平台ModelArts

ue 将yaml文件中的per_device_train_batch_size调小，重新训练如未解决则执行下一步。替换深度学习训练加速的工具或增加zero等级，可参考模型NPU卡数、梯度累积值取值表，如原使用Accelerator可替换为Deepspeed-ZeRO-1，Dee

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.911）
创建图像分类数据集并进行标注任务 - AI开发平台ModelArts

调用创建数据集接口创建一个图像分类类型的数据集。调用查询数据集详情接口根据数据集ID查询数据集的详情。调用查询样本列表接口根据数据集ID获取数据集的样本详情。调用批量更新样本标签接口根据数据集ID和样本ID给样本添加标签进行人工标注。调用查询数据集的统计信息接口查看数据集的标注统计信息。当数据集使用

 帮助中心 > AI开发平台ModelArts > API参考 > 应用示例
查询数据集详情 - AI开发平台ModelArts

false：不导出图片到版本输出目录（默认值） extract_serial_number Boolean 发布时是否需要解析子样本序号，用于医疗数据集。可选值如下： true：解析子样本序号 false：不解析子样本序号（默认值） include_dataset_data Boolean 发布时是否包含数据集源数据。可选值如下：

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
使用自定义引擎在ModelArts Standard创建模型 - AI开发平台ModelArts

flask import Flask, request import json app = Flask(__name__) @app.route('/greet', methods=['POST']) def say_hello_func(): print("-----------

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
Standard支持的AI框架 - AI开发平台ModelArts

mlstudio-pyspark2.3.2-ubuntu16.04 CPU算法开发和训练基础镜像，包含可以图形化机器学习算法开发和调测MLStudio工具，并预置PySpark2.3.2 CPU 否是 mindspore_1.10.0-cann_6.0.1-py_3.7-euler_2.8

帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍 > Standard功能介绍
准备工作 - AI开发平台ModelArts
准备工作 - AI开发平台ModelArts

attention算子（性能较优）或者使用小算子。训练脚本由算法迁移人员排查迁移后的NPU脚本是否存在问题，可以通过Beyond Compare工具比对GPU训练脚本和NPU训练脚本之间是否存在差异。例如是否GPU环境下开启了FA但是NPU上未开启FA。三方库版本比对大模型训练通常

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导 > PyTorch迁移精度调优
查询支持的服务部署规格 - AI开发平台ModelArts

是否查询专属资源池支持的服务部署规格列表，默认为false。 infer_type 否 String 推理方式，枚举值如下： real-time：在线服务，默认值 batch：批量服务 edge: 边缘服务 limit 否 String 指定每一页返回的最大条目数，默认为1000。 offset 否 String 返回数据的起始偏移量，默认为0。

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
ModelArts最佳实践案例列表 - AI开发平台ModelArts

PyCharm ToolKit工具目标检测本案例介绍如何在本地进行MindSpore模型开发，并将模型迁移至ModelArts训练。使用ModelArts VSCode插件调试训练ResNet50图像分类模型 MindSpore VS Code Toolkit工具目标检测本案例以Ascend

帮助中心 > AI开发平台ModelArts > 最佳实践
Lite Cluster使用流程 - AI开发平台ModelArts

等插件。完成Cluster资源池的购买后，您即可对资源进行配置，并将数据上传至存储云服务中。当您需要使用集群资源时，可以使用kubectl工具或k8s API来下发作业。此外，ModelArts还提供了扩缩容、驱动升级等功能，方便您对集群资源进行管理。图2 使用流程推荐您根据以下使用流程对Lite

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster使用前必读
查看在线服务的事件 - AI开发平台ModelArts

Instance is %s in node(%s), %s - 正常当前边缘服务状态为xxx Service status is %s. - 异常批量服务失败，请稍后重试。错误信息：xxx Failed to %s batch service, retry later. Error message:

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理同步在线服务
镜像保存时报错“BuildImage,True,Commit successfully|PushImage,False,Task is running.” - AI开发平台ModelArts

镜像过大Push任务一直在运行，或实例节点有问题。解决方法以对应租户的华为云账号登录SWR服务，查看镜像是否已经Push成功。如果Push成功，请重新注册镜像。如果未Push成功，联系SRE查看对应实例的节点是否有问题。父主题：自定义镜像故障

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 自定义镜像故障
执行训练任务 - AI开发平台ModelArts

指令监督微调/ppo：alpaca_en_demo rm/dpo:dpo_en_demo 多模态数据集(图像)：mllm_demo,identity 【可选】注册在dataset_info.json文件数据集名称。如选用定义数据请参考准备数据（可选）配置dataset_info.json文件，并将数据集存放于dataset_info

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.911）

总条数： 707

上一页
1
...
26
27
28
...
36
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

准备代码 - AI开发平台ModelArts

通过AK/SK认证的方式访问在线服务 - AI开发平台ModelArts

附录：训练常见问题 - AI开发平台ModelArts

查看模型评估结果 - AI开发平台ModelArts

创建并完成图像分类的智能标注任务 - AI开发平台ModelArts

获取APP列表 - AI开发平台ModelArts

使用CodeLab免费体验Notebook - AI开发平台ModelArts

附录：训练常见问题 - AI开发平台ModelArts

附录：训练常见问题 - AI开发平台ModelArts

创建图像分类数据集并进行标注任务 - AI开发平台ModelArts

查询数据集详情 - AI开发平台ModelArts

使用自定义引擎在ModelArts Standard创建模型 - AI开发平台ModelArts

Standard支持的AI框架 - AI开发平台ModelArts

准备工作 - AI开发平台ModelArts

查询支持的服务部署规格 - AI开发平台ModelArts

ModelArts最佳实践案例列表 - AI开发平台ModelArts

Lite Cluster使用流程 - AI开发平台ModelArts

查看在线服务的事件 - AI开发平台ModelArts

镜像保存时报错“BuildImage,True,Commit successfully|PushImage,False,Task is running.” - AI开发平台ModelArts

执行训练任务 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线