搜索_华为云

自动学习简介 - AI开发平台ModelArts

开发工具。自动学习功能根据标注数据自动设计模型、自动调参、自动训练、自动压缩和部署模型。开发者无需专业的开发基础和编码能力，只需上传数据，通过自动学习界面引导和简单操作即可完成模型训练和部署。当前自动学习支持快速创建图像分类、物体检测、预测分析、声音分类和文本分类模型的定制化开发。可广泛应用在工业、零售安防等领域。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发
自动学习模型训练图片异常？ - AI开发平台ModelArts

系统已自动过跳过这张图片，不需要用户处理。 2 tf-decode failed 图片无法被TensorFlow解码且不能修复 ignore 系统已跳过这张图片，不需要用户处理。 3 size over 图片大于5MB resize to small 系统已将图片压缩到5MB以内处理，不需要用户处理。 4

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard自动学习 > 模型训练
修改训练作业优先级 - AI开发平台ModelArts

击“确定”。此时，该用户组下的所有用户均有权限通过Cloud Shell登录运行中的训练作业容器。如果没有用户组，也可以创建一个新的用户组，并通过“用户组管理”功能添加用户，并配置授权。如果指定的子用户没有在用户组中，也可以通过“用户组管理”功能增加用户。父主题：管理模型训练作业

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
训练性能测试 - AI开发平台ModelArts

<cfgs_yaml_file>：性能测试配置的yaml文件地址，指代码目录中performance_cfgs.yaml相对或绝对路径，此配置文件为训练最优配置参数。 --baseline <baseline>：<可选>GP-Ant8机器性能基线yaml文件路径，用户可自行修改，不填则使用工具自带基线配置，默认基线配置样例如下：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.910） > 训练benchmark工具
云上迁移适配故障 - AI开发平台ModelArts

如何安装第三方包，安装报错的处理方法下载代码目录失败训练作业日志中提示“No such file or directory” 训练过程中无法找到so文件 ModelArts训练作业无法解析参数，日志报错训练输出路径被其他作业使用 PyTorch1.0引擎提示“RuntimeError: std:exception”

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业
创建多机多卡的分布式训练（DistributedDataParallel） - AI开发平台ModelArts

其中“DDP”为创建训练作业时的“代码目录”，“main.py”为上文代码示例（即创建训练作业时的“启动文件”），“cifar-10-batches-py”为解压后的数据集文件夹（放在input_dir文件夹下）。如果使用自定义的随机数据，则将代码示例中的参数“custom_data”改为“true”，修改后内容如下：

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 分布式模型训练
订阅免费模型 - AI开发平台ModelArts

台将根据实际使用情况收取硬件资源的费用。前提条件注册并登录华为云，且创建好OBS桶用于存储数据和模型。如果是订阅使用HiLens技能，则需要获取相关服务权限，详细操作请参见准备工作（华为HiLens）。订阅免费模型登录“AI Gallery”。选择“资产集市 > 模型

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（旧版） > 订阅使用
附录：大模型推理常见问题 - AI开发平台ModelArts

max_model_len is greater than the drived max_model_len。解决方法：修改config.json文件中的"seq_length"的值，"seq_length"需要大于等于 --max-model-len的值。config.json存在模型

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.907）
训练的权重转换说明 - AI开发平台ModelArts

输出转换后权重文件保存路径：权重转换完成后，在/home/ma-user/work/llm_train/processed_for_ma_input/llama2-13b/converted_weights_TP${TP}PP${PP}目录下查看转换后的权重文件。 Megatron转HuggingFace参数说明

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.905） > 训练脚本说明
报错“Connection permission denied (publickey)”如何解决 - AI开发平台ModelArts

the instance keypair information on ModelArts console.” 原因分析可能是密钥文件或放置密钥的文件夹权限问题，密钥不正确等，请按以下步骤排查。解决方案排查/home/ma-user权限，建议将该目录权限设置为755或750，

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

M、Yi、Baichuan等推理部署的详细过程，利用适配昇腾平台的大模型推理服务框架vLLM和华为自研昇腾Snt9B硬件，为用户提供推理部署方案，帮助用户使能大模型业务。本方案目前仅适用于部分企业客户，完成本方案的部署，需要先联系您所在企业的华为方技术支持。约束限制本方案目前仅适用于部分企业客户。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906）
如何查看账号ID和IAM用户ID - AI开发平台ModelArts

如何查看账号ID和IAM用户ID 使用IAM账号登录华为云。在页面右上方单击“控制台”，进入华为云管理控制台。图1 控制台入口在控制台右上角的账户名下方，单击“我的凭证”，进入“我的凭证”页面。图2 我的凭证在API凭证页面获取IAM用户名、用户ID、账号名和账号ID。

帮助中心 > AI开发平台ModelArts > 常见问题 > 一般性问题
授权API至APP - AI开发平台ModelArts

授权API至APP 功能介绍将指定的API授权给APP。API的认证方式必须为APP认证，APP的创建用户必须是API所属服务的创建者，且请求用户对API所属服务必须有更新权限。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以

 帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理
开发环境如何实现IAM用户隔离？ - AI开发平台ModelArts

方案一：删除modelarts:notebook:listAllNotebooks细粒度权限。方案二：使用工作空间功能：目前工作空间功能是“受邀开通”状态，作为企业用户您可以通过您对口的技术支持申请开通。父主题：更多功能咨询

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > 更多功能咨询
训练中的权重转换说明 - AI开发平台ModelArts

tokenizer路径。输出转换后权重文件保存路径：权重转换完成后，在 /home/ma-user/ws/processed_for_ma_input/llama2-13b/converted_weights_TP${TP}PP${PP} 目录下查看转换后的权重文件。 Megatron转HuggingFace参数说明

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.905） > 训练脚本说明
在Notebook中如何查看GPU使用情况 - AI开发平台ModelArts

py 如果当前进程使用GPU 如果当前没有进程使用GPU 方法二：打开文件“/resource_info/gpu_usage.json”，可以看到有哪些进程在使用GPU。如果当前没有进程使用GPU，该文件可能不存在或为空。父主题：更多功能咨询

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > 更多功能咨询
资源超分对Notebook实例有什么影响？ - AI开发平台ModelArts

67个Notebook实例。这里的0.6就是超分比率。即启动该Notebook实例最少需要1.2U的CPU，运行Notebook时最大使用到2U的资源；内存同理，最少需要4.8G的内存，运行时最大使用到8U的内存。超分情况下会存在实例终止的风险。如1个8U的节点上同时启动了6个2U的实例，如果

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > 更多功能咨询
Cluster资源池节点故障如何定位 - AI开发平台ModelArts

可能是亚健康，建议先重启节点，若重启节点后未恢复，发起维修流程。 NT_NPU_NET NPU 链路 npu dcmi net异常。 NPU网络链接异常。可能是亚健康，建议先重启节点，若重启节点后未恢复，发起维修流程。 NT_NPU_CARD_LOSE NPU 掉卡 NPU卡丢失。

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Cluster
迁移评估 - AI开发平台ModelArts
迁移评估 - AI开发平台ModelArts

运行环境：6348（单核48U超线程）性能指标：QPS 10/s（四进程）性能约束：单次请求最大可以接受时延需小于1s 性能预期：QPS 20/s - 业务访问方式推理业务访问：“客户端 -> 云服务” 或 “云客户端 -> 云服务”。推理业务时延要求，客户端到云服务端到端可接受时延。例如：当前是“客户端

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
训练权重转换说明 - AI开发平台ModelArts

权重转换完成后，需要将转换后的文件与原始Hugging Face模型中的文件进行对比，查看是否缺少如tokenizers.json、tokenizer_config.json、special_tokens_map.json等tokenizer文件或者其他json文件。若缺少则需要直接复制

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.907） > 训练脚本说明

总条数： 1863

上一页
1
...
72
73
74
...
94
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

自动学习简介 - AI开发平台ModelArts

自动学习模型训练图片异常？ - AI开发平台ModelArts

修改训练作业优先级 - AI开发平台ModelArts

训练性能测试 - AI开发平台ModelArts

云上迁移适配故障 - AI开发平台ModelArts

创建多机多卡的分布式训练（DistributedDataParallel） - AI开发平台ModelArts

订阅免费模型 - AI开发平台ModelArts

附录：大模型推理常见问题 - AI开发平台ModelArts

训练的权重转换说明 - AI开发平台ModelArts

报错“Connection permission denied (publickey)”如何解决 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

如何查看账号ID和IAM用户ID - AI开发平台ModelArts

授权API至APP - AI开发平台ModelArts

开发环境如何实现IAM用户隔离？ - AI开发平台ModelArts

训练中的权重转换说明 - AI开发平台ModelArts

在Notebook中如何查看GPU使用情况 - AI开发平台ModelArts

资源超分对Notebook实例有什么影响？ - AI开发平台ModelArts

Cluster资源池节点故障如何定位 - AI开发平台ModelArts

迁移评估 - AI开发平台ModelArts

训练权重转换说明 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线