搜索_华为云

服务启动失败 - AI开发平台ModelArts

模型本身问题，无法启动如果创建模型使用的镜像本身有问题，需要在创建模型之前，参考从0-1制作自定义镜像并创建AI应用，确保镜像可以正常启动，并可以在本地curl通返回预期内容。镜像中配置的端口错误模型可以正常启动，但是因为镜像中启用的端口非8080，或者镜像启用的端口与创建模型时配置的

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
配置仪表盘查看指标数据 - AI开发平台ModelArts

导入DashBoards模板。复制准备工作提供的模板的下载地址到浏览器中打开，复制JSON文件的内容。粘贴到DashBoards模板里，如图2所示，最后单击“Load”。图1 复制JSON文件的内容图2 粘贴JSON文件的内容到DashBoards模板修改视图名称，单击Import。图3 修改视图名称

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源监控 > 使用Grafana查看AOM中的监控指标
训练中的权重转换说明 - AI开发平台ModelArts

etrain_hf中的文件与原始Hugging Face模型中的文件进行对比，查看是否缺少如tokenizers.json、tokenizer_config.json、special_tokens_map.json等tokenizer文件或者其他json文件。如果缺少则需要直接复

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.910） > 训练脚本说明参考
训练中的权重转换说明 - AI开发平台ModelArts

etrain_hf中的文件与原始Hugging Face模型中的文件进行对比，查看是否缺少如tokenizers.json、tokenizer_config.json、special_tokens_map.json等tokenizer文件或者其他json文件。如果缺少则需要直接复

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.908） > 训练脚本说明参考
训练中的权重转换说明 - AI开发平台ModelArts

etrain_hf中的文件与原始Hugging Face模型中的文件进行对比，查看是否缺少如tokenizers.json、tokenizer_config.json、special_tokens_map.json等tokenizer文件或者其他json文件。若缺少则需要直接复制

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU训练指导（6.3.906） > 训练脚本说明
训练中的权重转换说明 - AI开发平台ModelArts

etrain_hf中的文件与原始Hugging Face模型中的文件进行对比，查看是否缺少如tokenizers.json、tokenizer_config.json、special_tokens_map.json等tokenizer文件或者其他json文件。如果缺少则需要直接复

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.907） > 训练脚本说明
训练中的权重转换说明 - AI开发平台ModelArts

etrain_hf中的文件与原始Hugging Face模型中的文件进行对比，查看是否缺少如tokenizers.json、tokenizer_config.json、special_tokens_map.json等tokenizer文件或者其他json文件。如果缺少则需要直接复

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.911） > 训练脚本说明参考
准备环境 - AI开发平台ModelArts
准备环境 - AI开发平台ModelArts

资源规格要求本文档中的模型运行环境是ModelArts Lite的Lite k8s Cluster。推荐使用“西南-贵阳一”Region上的资源和Ascend Snt9B。硬盘空间：至少200GB。 Ascend资源规格： Ascend: 1*ascend-snt9b表示Ascend单卡。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911） > 准备工作
准备环境 - AI开发平台ModelArts
准备环境 - AI开发平台ModelArts

资源规格要求本文档中的模型运行环境是ModelArts Lite的Lite k8s Cluster。推荐使用“西南-贵阳一”Region上的资源和Ascend Snt9B。硬盘空间：至少200GB。 Ascend资源规格： Ascend: 1*ascend-snt9b表示Ascend单卡。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910） > 准备工作
批量删除样本 - AI开发平台ModelArts

delete_source 否 Boolean 是否删除源文件，对非文本类型数据集有效(文本类型数据集因为是导入的整个文本文件，故删除一条样本不会对源文本有影响)。可选值如下： false：不删除源文件（默认值） true：删除源文件(注意：此操作可能影响已使用这些文件的数据集版本或其他数据集，导致页面展示异常或者训练/推理异常)

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
ModelArts中常用概念 - AI开发平台ModelArts

XNet、PyTorch、MindSpore等)下均可以使用。 MoXing Framework模块提供了OBS中常见的数据文件操作，如读写、列举、创建文件夹、查询、移动、复制、删除等。在ModelArts Notebook中使用MoXing接口时，可直接调用接口，无需下载或安装SDK，使用限制比ModelArts

帮助中心 > AI开发平台ModelArts > 产品介绍 > AI开发基础知识
更新服务配置 - AI开发平台ModelArts

批量任务中调用的推理接口，需要从模型的config.json文件中选取一个api路径用于此次推理 mapping_type 是 String 输入数据的映射类型，可选“file”或“csv”。 file指每个推理请求对应到输入数据目录下的一个文件，当使用此方式时，此模型对应req_uri只能有一个输入参数且此参数的类型是file。

帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
推理性能测试 - AI开发平台ModelArts

多个，如 128 2048 128 2048，数量需和--prompt-tokens的数量对应。 --benchmark-csv：结果保存文件，如benchmark_parallel.csv。 --served-model-name：选择性添加，在接口中使用的模型名；如果没有配置，则默认为tokenizer。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909）
其他故障 - AI开发平台ModelArts
其他故障 - AI开发平台ModelArts

其他故障 Notebook中无法打开“checkpoints”文件夹创建新版Notebook无法使用已购买的专属资源池，如何解决？在Notebook中使用tensorboard命令打开日志文件报错Permission denied 父主题：开发环境

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境
最新动态 - AI开发平台ModelArts
最新动态 - AI开发平台ModelArts

ark引擎相连接，让数据工程师能便捷地使用Notebook进行大数据开发，以及如何在DataArts Studio服务配置Notebook文件定时调度任务。白名单

 帮助中心 > AI开发平台ModelArts > 最新动态
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

本文档利用训练框架PyTorch_npu+华为自研Ascend Snt9B硬件，为用户提供了常见主流开源大模型在ModelArts Lite Server上的预训练和全量微调方案。本方案目前仅适用于部分企业客户，完成本方案的部署，需要先联系您所在企业的华为方技术支持。约束限制本文档适配昇腾云ModelArts

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU训练指导（6.3.906）
训练脚本说明 - AI开发平台ModelArts

训练脚本说明 Yaml配置文件参数配置说明模型NPU卡数、梯度累积值取值表各个模型训练前文件替换 NPU_Flash_Attn融合算子约束 BF16和FP16说明录制Profiling 父主题：主流开源大模型基于Lite Server适配LlamaFactory PyTorch

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.909）
训练脚本说明 - AI开发平台ModelArts

训练脚本说明 yaml配置文件参数配置说明各个模型深度学习训练加速框架的选择模型NPU卡数取值表各个模型训练前文件替换父主题：主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.907）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.907）
训练脚本说明 - AI开发平台ModelArts

训练脚本说明 Yaml配置文件参数配置说明模型NPU卡数、梯度累积值取值表各个模型训练前文件替换 NPU_Flash_Attn融合算子约束录制Profiling 父主题：主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.908）
使用Advisor工具分析生成调优建议 - AI开发平台ModelArts

py中修改优化器为apex混合精度模式下的DDP优化方式（修改点：注释第161和167行，增加第168~170行）。二进制调优使能，减少算子编译耗时，在train.py头文件导入之后添加（修改点：增加第37行）。 torch_npu.npu.set_compile_mode(jit_compile=False)

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > Dit模型PyTorch迁移与精度性能调优 > 性能调优

总条数： 1532

上一页
1
...
58
59
60
...
77
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

服务启动失败 - AI开发平台ModelArts

配置仪表盘查看指标数据 - AI开发平台ModelArts

训练中的权重转换说明 - AI开发平台ModelArts

训练中的权重转换说明 - AI开发平台ModelArts

训练中的权重转换说明 - AI开发平台ModelArts

训练中的权重转换说明 - AI开发平台ModelArts

训练中的权重转换说明 - AI开发平台ModelArts

准备环境 - AI开发平台ModelArts

准备环境 - AI开发平台ModelArts

批量删除样本 - AI开发平台ModelArts

ModelArts中常用概念 - AI开发平台ModelArts

更新服务配置 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

其他故障 - AI开发平台ModelArts

最新动态 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

训练脚本说明 - AI开发平台ModelArts

训练脚本说明 - AI开发平台ModelArts

训练脚本说明 - AI开发平台ModelArts

使用Advisor工具分析生成调优建议 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线