搜索_华为云

开发环境计费项 - AI开发平台ModelArts

10.221 元综上，运行Notebook实例的费用 = 10.221 元，根据按需计费规则抹零，最终费用为10.22元。示例：使用专属资源池。计费项：EVS存储费用假设用户于2023年4月1日10:00:00创建了一个Notebook实例，使用专属资源池和磁盘规格为5GB

帮助中心 > AI开发平台ModelArts > 计费说明 > 计费项
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

|──checkpoint # 训练完成生成目录Qwen2-7B，自动生成上传代码和权重文件到工作环境使用root用户以SSH的方式登录Server。将AscendCloud代码包AscendCloud-xxx-xxx.zip上传到${workdir}目

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.912） > 准备工作
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

|──checkpoint # 训练完成生成目录Qwen2-7B，自动生成上传代码和权重文件到工作环境使用root用户以SSH的方式登录服务器。将AscendCloud代码包AscendCloud-xxx-xxx.zip上传到${workdir}目录下并解压缩，如SFS

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.912） > 准备工作
附录：大模型推理常见问题 - AI开发平台ModelArts

问题10：使用benchmark-tools访问推理客户端返回报错或警告使用benchmark-tools访问推理客户端返回报错或警告：actual output_tokens_length < expected output_len 图5 benchmark-tools访问推理客户端返回报错图6 ben

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911）
SFT全参微调训练 - AI开发平台ModelArts

八卡规格。当前功能还处于试验阶段，只有llama3-8B/70B适配。 Step5 其他配置选择用户自己的专属资源池，以及规格与节点数。防止训练过程中出现内存溢出的情况，用户可参考表1进行配置。图4 选择资源池规格作业日志选择OBS中的路径，训练作业的日志信息则保存该路径下。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.909）
预训练 - AI开发平台ModelArts
预训练 - AI开发平台ModelArts

八卡规格。当前功能还处于试验阶段，只有llama3-8B/70B适配。 Step5 其他配置选择用户自己的专属资源池，以及规格与节点数。防止训练过程中出现内存溢出的情况，用户可参考表1进行配置。图3 选择资源池规格作业日志选择OBS中的路径，训练作业的日志信息则保存该路径下。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.910）
SFT全参微调训练 - AI开发平台ModelArts

八卡规格。当前功能还处于试验阶段，只有llama3-8B/70B适配。 Step5 其他配置选择用户自己的专属资源池，以及规格与节点数。防止训练过程中出现内存溢出的情况，用户可参考表1进行配置。图4 选择资源池规格作业日志选择OBS中的路径，训练作业的日志信息则保存该路径下。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.910）
资源池创建失败的原因与解决方法？ - AI开发平台ModelArts

CCE_错误码查看详细的错误信息及处理措施。其他报错请提工单联系ModelArts运维进一步定位解决。集群容器网段不足，导致创建失败？图6 报错信息用户可根据实际业务场景和节点规模，自定义配置容器网段，配置方式如下： ModelArts Standard池，资源池创建阶段指定容器网段，根据实际需要设置更大的容器网段。

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Cluster
附录：config.json文件 - AI开发平台ModelArts

size。config.json文件中默认是50，并发请求数量超出设置，推理请求会被拒绝。用户可以根据实际修改。 maxSeqLen：输入长度+输出长度的最大值。config.json文件中默认是6k，用户可以根据自己的推理场景设置。 httpsEnabled：取值需要修改为false。

帮助中心 > AI开发平台ModelArts > 最佳实践 > DeepSeek系列模型推理 > DeepSeek模型基于ModelArts Lite Server适配MindIE推理部署指导
示例：从 0 到 1 制作自定义镜像并用于训练（MPI+CPU/GPU） - AI开发平台ModelArts

\ mpirun --version # 增加 ma-user 用户 (uid = 1000, gid = 100) # 注意到基础容器镜像已存在 gid = 100 的组，因此 ma-user 用户可直接使用 RUN useradd -m -d /home/ma-user

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例
推理精度测试 - AI开发平台ModelArts

录结果保存到对应的测试工程。执行多少次，则会在{model_name}下生成多少次结果。benchmark_eval下生成的log中记录了客户端产生结果。数据集的打分结果在result/{model_name}/...目录下，查找到summmary目录，有txt和csv两种保存格式。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911）
附录：大模型推理常见问题 - AI开发平台ModelArts

问题10：使用benchmark-tools访问推理客户端返回报错或警告使用benchmark-tools访问推理客户端返回报错或警告：actual output_tokens_length < expected output_len 图5 benchmark-tools访问推理客户端返回报错图6 ben

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）
AIGC工具tailor使用指导 - AI开发平台ModelArts

run(input_shape=input_shape, output_path="/home/xxx") 运行结果将存储在output文件夹中，如果用户指定了output_path，会指定位置保存，如果不指定则在当前代码执行目录生成文件夹保存输出。整体运行的结果都存放在output文件夹中

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理
指令监督微调训练任务 - AI开发平台ModelArts

/home/ma-user/ws/Qwen2-72B/sft-4096 必须修改。指定输出目录。训练过程中生成的模型参数和日志文件将保存在这个目录下。用户根据自己实际要求适配。 per_device_train_batch_size 1 指定每个设备的训练批次大小 gradient_accumulation_steps

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.907）
如何登录并上传镜像到SWR？ - AI开发平台ModelArts

中使用到组织名称deep-learning时，均需要替换为此处实际创建的组织名称。单击右上角“登录指令”，获取登录访问指令。以root用户登录ECS环境，输入登录指令。图1 在ECS中执行登录指令 Step2 上传镜像到SWR 此小节介绍如何上传镜像至容器镜像服务SWR的镜像仓库。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard镜像相关
附录：大模型推理常见问题 - AI开发平台ModelArts

问题10：使用benchmark-tools访问推理客户端返回报错或警告使用benchmark-tools访问推理客户端返回报错或警告：actual output_tokens_length < expected output_len 图5 benchmark-tools访问推理客户端返回报错图6 ben

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911）
Chunked Prefill - AI开发平台ModelArts

Chunked Prefill 什么是Chunked Prefill Chunked Prefill（Splitfuse）特性的目的是将长prompt request分解成更小的块，并在多个forward step中进行调度，只有最后一块的forward完成后才开始这个prompt

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用
Notebook中构建新镜像 - AI开发平台ModelArts

本案例中的训练作业需要通过SFS Turbo挂载盘的形式创建，因此需要将上述数据集、代码、权重文件从OBS桶上传至SFS Turbo中。用户需要创建开发环境Notebook，并绑定SFS Turbo，以便能够通过Notebook访问SFS Turbo服务。随后，通过Notebook将OBS中的数据上传至SFS

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.907） > 准备工作 > 准备镜像
数据管理计费项 - AI开发平台ModelArts

创建桶不收取费用，按实际使用的存储容量和时长收费计费示例以下案例中出现的费用价格仅供参考，实际价格请参见各服务价格详情。示例：存储费用假设用户于2023年4月1日10:00:00创建了一个数据集，数据是存储在OBS中的。按照存储费用结算，那么数据存储到OBS的费用计算如下：存储

 帮助中心 > AI开发平台ModelArts > 计费说明 > 计费项
在ModelArts上如何提升训练效率并减少与OBS的交互？ - AI开发平台ModelArts

可通过如下方式进行调整优化。优化原理对于ModelArts提供的GPU资源池，每个训练节点会挂载500GB的NVMe类型SSD提供给用户免费使用。此SSD挂载到“/cache”目录，“/cache”目录下的数据生命周期与训练作业生命周期相同，当训练作业运行结束以后“/cac

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard模型训练

总条数： 2007

上一页
1
...
89
90
91
...
101
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

开发环境计费项 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

附录：大模型推理常见问题 - AI开发平台ModelArts

SFT全参微调训练 - AI开发平台ModelArts

预训练 - AI开发平台ModelArts

SFT全参微调训练 - AI开发平台ModelArts

资源池创建失败的原因与解决方法？ - AI开发平台ModelArts

附录：config.json文件 - AI开发平台ModelArts

示例：从 0 到 1 制作自定义镜像并用于训练（MPI+CPU/GPU） - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

附录：大模型推理常见问题 - AI开发平台ModelArts

AIGC工具tailor使用指导 - AI开发平台ModelArts

指令监督微调训练任务 - AI开发平台ModelArts

如何登录并上传镜像到SWR？ - AI开发平台ModelArts

附录：大模型推理常见问题 - AI开发平台ModelArts

Chunked Prefill - AI开发平台ModelArts

Notebook中构建新镜像 - AI开发平台ModelArts

数据管理计费项 - AI开发平台ModelArts

在ModelArts上如何提升训练效率并减少与OBS的交互？ - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线