搜索_华为云

以PyTorch框架创建训练作业（新版训练） - AI开发平台ModelArts

其中，加粗的斜体字段需要根据实际值填写： iam_endpoint为IAM的终端节点。 user_name为IAM用户名。 user_password为用户登录密码。 domain_name为用户所属的账号名。 cn-north-1为项目名，代表服务的部署区域。返回状态码“201 Create

帮助中心 > AI开发平台ModelArts > API参考 > 应用示例
Notebook提示磁盘空间已满 - AI开发平台ModelArts

磁盘配额不足。处理方法查看虚拟机所使用的存储空间，再查看回收站文件占用内存，根据实际删除回收站里不需要的大文件。在Notebook实例详情页，查看实例的存储容量。执行如下命令，排查虚拟机所使用的存储空间，一般接近存储容量，请排查回收站占用内存。 cd /home/ma-user/work

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 环境配置故障
系统容器异常退出 - AI开发平台ModelArts

原因分析出现该问题的可能原因如下： OBS相关错误。 OBS文件不存在。The specified key does not exist。用户OBS权限不足。 OBS限流。 OBS其他问题。磁盘空间不足。处理方法如果是OBS相关错误。 OBS文件不存在。The specified

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

#tokenizer目录，需要用户手动创建，后续操作步骤中会提示 |── Llama2-70B |── model #原始权重与tokenizer目录，需要用户手动创建，后续操作步骤中会提示 |──

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU训练指导（6.3.906） > 准备工作
查询服务对象列表 - AI开发平台ModelArts

查询服务对象列表获取当前用户服务对象列表。示例代码在ModelArts notebook平台，Session鉴权无需输入鉴权参数。其它平台的Session鉴权请参见Session鉴权。场景1：查询当前用户所有服务对象 1 2 3 4 5 6 from modelarts.session

帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
在ModelArts的Notebook中安装远端插件时不稳定要怎么办？ - AI开发平台ModelArts

Code远端默认安装的插件？配置，即会在连接远端时自动安装，减少等待时间。方法三：VS Code官网排查方式https://code.visualstudio.com/docs/remote/troubleshooting 小技巧（按需调整远端连接的相关参数）： "remote.SSH

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

|──saves/qwen2-7b/sft_lora/ # 训练完成生成目录Qwen2-7B，自动生成上传代码和权重文件到工作环境使用root用户以SSH的方式登录Server。将AscendCloud代码包AscendCloud-xxx-xxx.zip上传到${workdir}目录下并解压

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.912） > 准备工作
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

#原始权重及tokenizer目录，需要用户手动创建，后续操作步骤中会提示 |── Llama2-70B |── training_data #原始数据目录，需要用户手动创建，后续操作步骤中会提示 |── t

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU训练指导（6.3.905） > 准备工作
执行训练任务（推荐） - AI开发平台ModelArts

执行训练任务（推荐）新的训练方式将统一管理训练日志、训练结果和训练配置，使用yaml配置文件方便用户根据自己实际需求进行修改。推荐用户使用该方式进行训练。权重文件支持以下组合方式，用户根据自己实际要求选择：训练stage 不加载权重增量训练：加载权重，不加载优化器（默认开启）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.912） > 执行训练任务
如何将在ModelArts中训练好的模型下载或迁移到其他账号？ - AI开发平台ModelArts

如何将在ModelArts中训练好的模型下载或迁移到其他账号？通过训练作业训练好的模型可以下载，然后将下载的模型上传存储至其他账号对应区域的OBS中。获取模型下载路径登录ModelArts管理控制台，在左侧导航栏中选择“模型训练 > 训练作业”，进入“训练作业”列表。在训练作业列表中，单击目标训练作业名称，查看该作业的详情。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard模型训练
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

#原始权重与tokenizer目录，需要用户手动创建，后续操作步骤中会提示 |── Llama2-70B |── tokenizers #tokenizer目录，需要用户手动创建，后续操作步骤中会提示 |──

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.907） > 准备工作
导入模型 - AI开发平台ModelArts
导入模型 - AI开发平台ModelArts

/model_file_parent_dir/”。 environment 否 Environment实例描述模型正常运行需要的环境，如使用的python版本、tensorflow版本等。 Environment实例的示例请参见示例代码。 source_job_id 否 String 来源训练作业

 帮助中心 > AI开发平台ModelArts > SDK参考 > 模型管理
认证证书 - AI开发平台ModelArts
认证证书 - AI开发平台ModelArts

I等）的安全合规认证，用户可自行申请下载合规资质证书。图1 合规证书下载资源中心华为云还提供以下资源来帮助用户满足合规性要求，具体请查看资源中心。图2 资源中心销售许可证&软件著作权证书另外，华为云还提供了以下销售许可证及软件著作权证书，供用户下载和参考。具体请查看合规资质证书。

帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
在推理生产环境中部署推理服务 - AI开发平台ModelArts

--gpu-memory-utilization：NPU使用的显存比例，复用原vLLM的入参名称，默认为0.9。 --trust-remote-code：是否相信远程代码。 --distributed-executor-backend：多卡推理启动后端，可选值为"ray"或者"mp"，其中"ray"表示

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）
工具介绍及准备工作 - AI开发平台ModelArts

chmark，支持训练、性能对比、下游任务评测、loss和下游任务对比能力。对比结果以excel文件呈现。方便用户验证发布模型的质量。所有配置都通过yaml文件设置，用户查看默认yaml文件即可知道最优性能的配置。目前仅支持SFT指令监督微调训练阶段。代码目录 benchma

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.910） > 训练benchmark工具
下载代码目录失败 - AI开发平台ModelArts

在创建训练作业时指定的代码目录不存在导致训练失败。处理方法请您根据报错原因排查创建训练作业时指定的代码目录，即OBS桶的路径是否正确。有两种方法判断是否存在。使用当前账户登录OBS管理控制台，去查找对应的OBS桶、文件夹、文件是否存在。通过接口判断路径是否存在。在代码中执行如下命令，检查路径是否存在。 import

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
保存镜像时报错“too many layers in your image”如何解决？ - AI开发平台ModelArts

image”如何解决？问题现象保存镜像时报错“too many layers in your image”。原因分析用户创建Notebook时所选用的镜像是经过多次保存的自定义镜像或用户自行注册的镜像，基于该镜像所创建的Notebook已经无法再执行镜像保存的操作了。解决方法使用公共镜像

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 自定义镜像故障
常见的磁盘空间不足的问题和解决办法 - AI开发平台ModelArts

数据处理过程中对数据进行解压，导致数据大小膨胀，将"/cache"目录空间用完。数据未保存至/cache目录或者/home/ma-user/目录（/cache会软连接成/home/ma-user/），导致数据占满系统目录。系统目录仅支持系统功能基本运行，无法支持大数据存储。部分训练任务会在训练过程中生

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 硬盘限制故障
查询数据集详情 - AI开发平台ModelArts

0：打标者 1：审核者 2：团队管理者 3：数据集拥有者 status Integer 标注成员的当前登录状态。可选值如下： 0：未发送邀请邮件 1：已发送邀请邮件但未登录 2：已登录 3：标注成员已删除 update_time Long 更新时间。 worker_id String

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

权重文件存放目录。如果使用了量化功能，则使用推理模型量化章节转换后的权重。 --max-num-seqs：最大同时处理的请求数，超过后拒绝访问。 --max-model-len：推理时最大输入+最大输出tokens数量，输入超过该数量会直接返回。max-model-len的值必须小于config

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907）

总条数： 2152

上一页
1
...
79
80
81
...
108
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

以PyTorch框架创建训练作业（新版训练） - AI开发平台ModelArts

Notebook提示磁盘空间已满 - AI开发平台ModelArts

系统容器异常退出 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

查询服务对象列表 - AI开发平台ModelArts

在ModelArts的Notebook中安装远端插件时不稳定要怎么办？ - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

执行训练任务（推荐） - AI开发平台ModelArts

如何将在ModelArts中训练好的模型下载或迁移到其他账号？ - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

导入模型 - AI开发平台ModelArts

认证证书 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

工具介绍及准备工作 - AI开发平台ModelArts

下载代码目录失败 - AI开发平台ModelArts

保存镜像时报错“too many layers in your image”如何解决？ - AI开发平台ModelArts

常见的磁盘空间不足的问题和解决办法 - AI开发平台ModelArts

查询数据集详情 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线