搜索_华为云

SDXL基于Standard适配PyTorch NPU的LoRA训练指导（6.3.908） - AI开发平台ModelArts

Step6 准备镜像创建ECS。参考ECS文档购买弹性云服务器。网络配置、高级配置等后续步骤，可根据默认选择，或进行自定义。创建完成后，单击“远程登录”，并在控制台发送后续步骤中的远程命令。注意：创建的ECS虚拟机使用ARM镜像创建。图1 购买ECS 安装Docker。检查docker是否安装。

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
创建训练作业时出现“实例挂卷失败”的事件 - AI开发平台ModelArts

是，则修改安全组的配置，具体操作请参见修改安全组规则。否，则继续下一步。确认SFS Turbo是否存在异常。新建一个和SFS Turbo在同一个网段的ECS，用ECS去挂载SFS Turbo，如果挂载失败，则表示SFS Turbo异常。是，联系SFS服务的技术支持处理。否，联系ModelArts的技术支持处理。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 专属资源池创建训练作业
断点续训练 - AI开发平台ModelArts

态、调度器状态）。即便模型训练中断，也可以基于checkpoint接续训练。当需要从训练中断的位置接续训练，只需要加载checkpoint，并用checkpoint信息初始化训练状态即可。用户需要在代码里加上reload ckpt的代码，使能读取前一次训练保存的预训练模型。断点续训练操作过程

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > GLM3-6B模型基于DevServer适配PyTorch NPU训练指导（6.3.904） > 预训练
断点续训练 - AI开发平台ModelArts

态、调度器状态）。即便模型训练中断，也可以基于checkpoint接续训练。当需要从训练中断的位置接续训练，只需要加载checkpoint，并用checkpoint信息初始化训练状态即可。用户需要在代码里加上reload ckpt的代码，使能读取前一次训练保存的预训练模型。原

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > Baichuan2-13B模型基于DevServer适配PyTorch NPU训练指导（6.3.904） > 预训练
团队标注的完成验收的各选项表示什么意思？ - AI开发平台ModelArts

全部通过：被驳回的样本，也会通过。全部驳回：已经通过的样本，需要重新标注，下次验收时重新进行审核。剩余全部通过：已经驳回的会驳回，其余会自动验收通过。剩余全部驳回：样本抽中的通过的，不需要标注了，未通过和样本未抽中的需要重新标注验收。父主题： Standard数据管理

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard数据管理
使用自定义引擎在ModelArts Standard创建AI应用 - AI开发平台ModelArts

CMD sh /home/mind/run.sh 启动入口文件run.sh需要自定义。示例如下： #!/bin/bash # 自定义脚本内容 ... # run.sh调用app.py启动服务器，app.py请参考https示例 python app.py 除了按上述要求设

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
在ModelArts Studio基于Llama3-8B模型实现新闻自动分类 - AI开发平台ModelArts

在对话框中输入问题，查看返回结果。输入的问题需要添加如下prompt，其中“{title}”要换成待判断的新闻标题，“{key_word}”要换成待判断的新闻关键词。你是一位资深的新闻从业者，现在需要依据新闻标题和关键词对新闻进行分类。接下来你会收到<标题>和<关键词>，给出的分类结果需要严格按照以下要求：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
Notebook提示磁盘空间已满 - AI开发平台ModelArts

用内存，导致磁盘空间不足。磁盘配额不足。处理方法查看虚拟机所使用的存储空间，再查看回收站文件占用内存，根据实际删除回收站里不需要的大文件。在Notebook实例详情页，查看实例的存储容量。执行如下命令，排查虚拟机所使用的存储空间，一般接近存储容量，请排查回收站占用内存。

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 环境配置故障
创建和保存Manifest文件 - AI开发平台ModelArts

创建和保存Manifest文件需要先创建包含Manifest信息的对象，然后保存。Manifest信息请见表2。路径支持本地和OBS，如果是OBS，需要Session信息。 manifest_info.save(path, session=None, save_mode="w")

帮助中心 > AI开发平台ModelArts > SDK参考 > 数据管理 > Manifest管理
创建和保存Pascal VOC文件 - AI开发平台ModelArts

创建和保存Pascal VOC文件需要先创建包含Pascal VOC信息的对象，然后保存。Pascal VOC信息请见表2。路径支持本地和OBS，如果是OBS，需要Session信息。 pascal_voc.save_xml(xml_file_path, save_mode='w'

帮助中心 > AI开发平台ModelArts > SDK参考 > 数据管理 > Manifest管理
身份认证与访问控制 - AI开发平台ModelArts

rts在AI计算任务执行过程中需要访问用户的其他服务，例如训练过程中，需要访问OBS读取用户的训练数据。在这个过程中，就出现了ModelArts“代表”用户去访问其他云服务的情形。从安全角度出发，ModelArts代表用户访问任何云服务之前，均需要先获得用户的授权，而这个动作就是

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
配置节点参数控制分支执行 - AI开发平台ModelArts

跳过，同时可以基于此能力完成对执行流程的控制。应用场景主要用于存在多分支选择执行的复杂场景，在每次启动执行后需要根据相关配置信息决定哪些分支需要执行，哪些分支需要跳过，达到分支部分执行的目的，与ConditionStep的使用场景类似，但功能更加强大。当前该能力适用于数据集创

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 构建Workflow多分支运行场景
Notebook实例常见错误 - AI开发平台ModelArts

单击Notebook的打开按钮时报“请求超时”错误？使用CodeLab时报错kernel restart 使用SSH工具连接Notebook，服务器的进程被清理了，GPU使用率显示还是100% Notebook实例出现“Server Connection Error”错误父主题： Standard

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
使用ModelArts Studio的Llama3.1-8B模型框架实现对话问答 - AI开发平台ModelArts

专属资源池需单独创建，不与其他租户共享。公共资源池实例规格选择实例规格，规格中描述了服务器类型、型号等信息。 xxx 单实例流量限制（QPS）设置待部署模型的单实例流量限制QPS。 3 实例数设置服务器个数。增加实例个数可提高总QPS，“总QPS = 单实例QPS x 实例数”。 1

帮助中心 > AI开发平台ModelArts > 快速入门
推理精度测试 - AI开发平台ModelArts

├──vllm_api.py #启动vllm api服务器 ├──vllm.py #构造vllm评测配置脚本名字确保Notebook内通网，已通网可以跳过这一步，未通网需要配置$config_proxy_str，$config_pip_st

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906）
推理精度测试 - AI开发平台ModelArts

#安装opencompass脚本 ├──vllm_api.py #启动vllm api服务器 ├──vllm.py #构造vllm评测配置脚本名字确保容器内通网，未通网需要配置$config_proxy_str，$config_pip_str设置对应的代理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.906）
准备环境 - AI开发平台ModelArts
准备环境 - AI开发平台ModelArts

本文档中的模型运行环境是ModelArts Lite的DevServer。请参考本文档要求准备DevServer机器。资源规格要求计算规格：单机训练需要使用单机8卡，多机训练需要使用2机16卡。硬盘空间：至少200GB。 Ascend资源规格： Ascend: 1*ascend-snt9b表示Ascend单卡。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > GLM3-6B模型基于DevServer适配PyTorch NPU训练指导（6.3.904） > 准备工作
查找Notebook实例 - AI开发平台ModelArts

远程连接其他用户的Notebook实例，需要将SSH密钥对更新成自己的，否则会报错ModelArts.6786。更新密钥对具体操作请参见修改Notebook SSH远程连接配置。具体的错误信息提示：ModelArts.6789: 在ECS密钥对管理中找不到指定的ssh密钥对xxx，请更新密钥对并重试。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 管理Notebook实例
服务韧性 - AI开发平台ModelArts
服务韧性 - AI开发平台ModelArts

免了域名使用过程中的合规和钓鱼风险。其中：租户可见域名：指租户可访问的域名，需要格外重视安全性和合规性。租户不可见域名：指华为云服务在内网相互调用使用的域名，外部用户无法访问到对应的权威DNS服务器；或者Internet受限访问域名，只允许华为办公网络黄&绿区华为员工及合作方或外包人员访问的域名。

帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
Open-Clip基于DevServer适配PyTorch NPU训练指导 - AI开发平台ModelArts

report-to tensorboard：指定输出loss指标到tensorboard，一般需要做精度评估才需要带上。 train-num-samples：指定每个epoch需要训练的样本个数，不超过总样本个数。 batch-size：指定一次处理的数据batch。 epochs：指定训练的epoch个数。

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理

总条数： 1148

上一页
1
...
11
12
13
...
58
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

SDXL基于Standard适配PyTorch NPU的LoRA训练指导（6.3.908） - AI开发平台ModelArts

创建训练作业时出现“实例挂卷失败”的事件 - AI开发平台ModelArts

断点续训练 - AI开发平台ModelArts

断点续训练 - AI开发平台ModelArts

团队标注的完成验收的各选项表示什么意思？ - AI开发平台ModelArts

使用自定义引擎在ModelArts Standard创建AI应用 - AI开发平台ModelArts

在ModelArts Studio基于Llama3-8B模型实现新闻自动分类 - AI开发平台ModelArts

Notebook提示磁盘空间已满 - AI开发平台ModelArts

创建和保存Manifest文件 - AI开发平台ModelArts

创建和保存Pascal VOC文件 - AI开发平台ModelArts

身份认证与访问控制 - AI开发平台ModelArts

配置节点参数控制分支执行 - AI开发平台ModelArts

Notebook实例常见错误 - AI开发平台ModelArts

使用ModelArts Studio的Llama3.1-8B模型框架实现对话问答 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

准备环境 - AI开发平台ModelArts

查找Notebook实例 - AI开发平台ModelArts

服务韧性 - AI开发平台ModelArts

Open-Clip基于DevServer适配PyTorch NPU训练指导 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线