搜索_华为云

查看训练作业资源占用情况 - AI开发平台ModelArts

情况。建议优化数据读取和数据增强的性能，例如将数据读取并行化，或者使用NVIDIA Data Loading Library（DALI）等工具提高数据增强的速度。模型保存不要太频繁：模型保存操作一般会阻塞训练，如果模型较大，并且较频繁地进行保存，就会影响GPU/NPU利用率。同

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
附录：微调训练常见问题 - AI开发平台ModelArts

ue 将yaml文件中的per_device_train_batch_size调小，重新训练如未解决则执行下一步。替换深度学习训练加速的工具或增加zero等级，可参考模型NPU卡数、梯度累积值取值表，如原使用Accelerator可替换为Deepspeed-ZeRO-1，Dee

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.908）
自动续费 - AI开发平台ModelArts
自动续费 - AI开发平台ModelArts

图1 续费管理为包年/包月资源开通自动续费。单个资源开通自动续费：选择需要开通自动续费的专属资源池，单击操作列“开通自动续费”。批量资源开通自动续费：选择需要开通自动续费的专属资源池，单击列表左上角的“开通自动续费”。选择续费时长，并根据需要设置自动续费次数，单击“开通”。

帮助中心 > AI开发平台ModelArts > 计费说明 > 续费
模型NPU卡数、梯度累积值取值表 - AI开发平台ModelArts

表1 NPU卡数、加速框架、梯度配置取值表模型 Template 模型参数量训练策略类型序列长度cutoff_len 梯度累积值优化工具(Deepspeed) 规格与节点数 llama2 llama2 7B lora 4096/8192 gradient_accumulation_steps:

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.911） > 训练脚本说明
模型NPU卡数、梯度累积值取值表 - AI开发平台ModelArts

表1 NPU卡数、加速框架、梯度配置取值表模型 Template 模型参数量训练策略类型序列长度cutoff_len 梯度累积值优化工具(Deepspeed) 规格与节点数 llama2 llama2 7B lora 4096/8192 gradient_accumulation_steps:

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.910） > 训练脚本说明
从训练作业中导入模型文件创建模型 - AI开发平台ModelArts

选择此模型支持部署服务的类型，部署上线时只支持部署为此处选择的部署类型，例如此处只选择在线服务，那您导入后只能部署为在线服务。当前支持“在线服务”、“批量服务”和“边缘服务”。确认信息填写无误，单击“立即创建”，完成模型的创建。在模型列表中，您可以查看刚创建的模型及其对应的版本。当模型状

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型
推理精度测试 - AI开发平台ModelArts

Standard模式。 model_name：评测模型名称，llama2。 deploy_method：部署方法，不同的部署方式api参数输入、输出解析方式不同，目前支持tgi、ma_standard、vllm等方式。 vllm_model：deploy_method为vllm时，服务以o

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.905）
推理精度测试 - AI开发平台ModelArts

部署并启动推理服务中的模型地址参数model，模型格式是Huggingface的目录格式。 deploy_method：部署方法，不同的部署方式api参数输入、输出解析方式不同，目前支持tgi、vllm等方式，本案例使用vllm部署方式。若要在生产环境中进行精度测试，还需修改benchmark_eval/config/config

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905）
在AI Gallery订阅商品失败怎么办？ - AI开发平台ModelArts

发者生态社区，提供模型、算法、HiLens技能、数据集等内容的共享。当您订阅商品失败可参照如下方式解决：请检查您是否完成实名认证。账号注册成功后，您需要完成“实名认证”才可以正常使用服务。具体认证方式请参见实名认证。进入当前账号的费用中心，检查是否欠费。如果欠费，建议您参考华为云账户充值，为您的账号充值。

帮助中心 > AI开发平台ModelArts > 常见问题 > AI Gallery
配置ModelArts委托授权 - AI开发平台ModelArts

设置最小授权范围时，可以选择指定的区域，也可以选择所有区域，即不设置范围。删除授权为了更好的管理您的授权，您可以删除某一IAM用户的授权，也可批量清空所有用户的授权。删除某一用户的授权在“权限管理”页面，展示当前账号下为其IAM用户配置的授权列表，针对某一用户，您可以单击“操作”

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio） > 配置MaaS访问授权
推理场景介绍 - AI开发平台ModelArts

本教程需要使用到的AscendCloud-3rdLLM-xxx.zip软件包中的关键文件介绍如下。 ├──llm_tools #推理工具包 ├──llm_evaluation #推理评测代码包 ├──benchmark_eval # 精度评测

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.905）
管理标注数据 - AI开发平台ModelArts

基于标签修改在标注作业详情页，单击“已标注”页签，在图片列表右侧，显示全部标签的信息。批量修改：在“全部标签”区域中，单击操作列的编辑图标，然后在文本框中修改标签名称，选择标签颜色，单击“确定”完成修改。批量删除：在“全部标签”区域中，单击操作列的删除图标，在弹出对话框中，可选择“仅删

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 标注ModelArts数据集中的数据 > 通过人工标注方式标注数据
Method Not Allowed - AI开发平台ModelArts

Method Not Allowed 问题现象服务预测报错：Method Not Allowed 原因分析服务预测默认注册的API需要使用POST方法调用。如您使用了GET方法，APIG（API网关）将会拦截请求。处理方法使用POST方法调用。父主题：服务预测

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
资产识别与管理 - AI开发平台ModelArts

AI资产包括但不限于文本、图形、数据、文章、照片、图像、插图、代码、AI算法、AI模型等。用户的个人信息包括：用户注册时提供的昵称、头像、邮箱。用户参加实践时提供的姓名、手机号、邮箱。用户伙伴注册时提供的企业信息。用户发布资产时提供的联系人姓名、手机号、邮箱。资产管理对于用户发布在AI Gallery中的资产，AI

帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

|──llm_inference # 推理代码包 |──llm_tools # 推理工具代码上传至OBS 将AscendSpeed代码包AscendCloud-LLM-xxx.zip在本地解压缩后，将llm_train文件上传至OBS中。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.906） > 准备工作
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

|──llm_inference # 推理代码包 |──llm_tools # 推理工具代码上传至SFS Turbo 将AscendSpeed代码包AscendCloud-LLM-xxx.zip直接上传至ECS服务器中的SFS

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.909） > 准备工作
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

|──llm_inference # 推理代码包 |──llm_tools # 推理工具代码上传至SFS Turbo 将AscendSpeed代码包AscendCloud-LLM-xxx.zip直接上传至ECS服务器中的SFS

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.910） > 准备工作
快速配置ModelArts委托授权 - AI开发平台ModelArts

设置最小授权范围时，可以选择指定的区域，也可以选择所有区域，即不设置范围。删除授权为了更好的管理您的授权，您可以删除某一IAM用户的授权，也可批量清空所有用户的授权。请注意，删除授权操作会导致运行中的作业因缺失委托而运行失败，请谨慎操作。删除某一用户的授权在“权限管理”页面，展

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard准备工作 > 配置ModelArts Standard访问授权
执行微调训练任务 - AI开发平台ModelArts

4096 文本处理时的最大长度，此处为4096，用户可根据自己要求适配 dataset identity,alpaca_en_demo 【可选】注册在dataset_info.json文件数据集名称。如选用定义数据请参考准备数据（可选）配置dataset_info.json文件，并将数据集存放于dataset_info

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.908）
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

|──llm_inference # 推理代码包 |──llm_tools # 推理工具代码上传至OBS 将AscendSpeed代码包AscendCloud-LLM-xxx.zip在本地解压缩后，将llm_train文件上传至OBS中。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.907） > 准备工作

总条数： 744

上一页
1
...
25
26
27
...
38
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

查看训练作业资源占用情况 - AI开发平台ModelArts

附录：微调训练常见问题 - AI开发平台ModelArts

自动续费 - AI开发平台ModelArts

模型NPU卡数、梯度累积值取值表 - AI开发平台ModelArts

模型NPU卡数、梯度累积值取值表 - AI开发平台ModelArts

从训练作业中导入模型文件创建模型 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

在AI Gallery订阅商品失败怎么办？ - AI开发平台ModelArts

配置ModelArts委托授权 - AI开发平台ModelArts

推理场景介绍 - AI开发平台ModelArts

管理标注数据 - AI开发平台ModelArts

Method Not Allowed - AI开发平台ModelArts

资产识别与管理 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

快速配置ModelArts委托授权 - AI开发平台ModelArts

执行微调训练任务 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线