搜索_华为云

Standard模型训练 - AI开发平台ModelArts

能力，保障用户训练作业的长稳运行提供训练作业断点续训与增量训练能力，即使训练因某些原因中断，也可以基于checkpoint接续训练，保障需要长时间训练的模型的稳定性和可靠性，避免重头训练耗费的时间与计算成本支持训练数据使用SFS Turbo文件系统进行数据挂载，训练作业产生的

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍 > Standard功能介绍
日志提示“No module name 'unidecode'” - AI开发平台ModelArts

txt中的Unidecode改为unidecode。建议与总结您可以在训练代码里添加一行： os.system('pip list') 然后运行训练作业，查看日志中是否有所需要的模块。父主题：业务代码问题

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
服务启动后，状态断断续续处于“告警中” - AI开发平台ModelArts

able to process the new request 原因分析该报错是因为发送预测请求后，服务出现停止后又启动的情况。处理方法需要您检查服务使用的镜像，确定服务停止的原因，修复问题。重新创建模型部署服务。父主题：服务部署

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
用户创建模型时构建镜像或导入文件失败 - AI开发平台ModelArts

obs:object:PutObjectAcl permission.）。图2 复制模型文件失败原因分析由于ModelArts的使用权限依赖OBS服务的授权，需要为用户授予OBS的系统权限。子用户的IAM权限是由其主用户设置的，如果主用户没有赋予OBS的putObjectAcl权限即会导致创建模型构建失败。

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 模型管理
上传算法至SFS - AI开发平台ModelArts

requirements.txt内容如下 timm==0.4.12 termcolor==1.1.0 yacs==0.1.8 准备run.sh文件中所需要的obs文件路径。准备imagenet数据集的分享链接勾选要分享的imagenet21k_whole数据集文件夹，单击分享按钮，选择分

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 多机多卡
附录：大模型推理常见问题 - AI开发平台ModelArts

drived max_model_len 解决方法：修改config.json文件中的"seq_length"的值，"seq_length"需要大于等于 --max-model-len的值。 config.json存在模型对应的路径下，例如：/data/nfs/benchmark/

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.906）
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

Standard运行，需要购买ModelArts专属资源池。准备权重准备对应模型的权重文件。准备代码准备AscendCloud-6.3.906-xxx.zip。准备镜像准备推理模型适用的容器镜像。准备Notebook 本案例在Notebook上部署推理服务进行调试，因此需要创建Notebook。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906）
训练运行报错AttributeError: 'torch_npu._C._NPUDeviceProperties' object has no attribute 'multi_processor_count' - AI开发平台ModelArts

如果是运行单卡模式，在训练脚本中加入export ASCEND_RT_VISIBLE_DEVICES=0（指定 0 号卡对当前进程可见）。多卡环境模式需要运行DDP并行模式。父主题：常见问题

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于LLM模型的GPU训练业务迁移至昇腾指导 > 常见问题
Notebook中已安装对应库，仍报错import numba ModuleNotFoundError: No module named 'numba' - AI开发平台ModelArts

在Terminal中执行conda deactivate命令退出当前虚拟环境，默认进入base环境。执行pip list命令查询已安装的包，然后安装需要的依赖进行保存，最后切换至指定的虚拟环境后再运行脚本。父主题：环境配置故障

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 环境配置故障
VS Code使用技巧 - AI开发平台ModelArts

VS Code使用技巧安装远端插件时不稳定，需尝试多次 Notebook实例重新启动后，需要删除本地known_hosts才能连接使用VS Code调试代码时不能进入源码使用VS Code提交代码时弹出对话框提示用户名和用户邮箱配置错误实例重新启动后，Notebook内安装的插件丢失

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
审核并验收团队标注任务结果 - AI开发平台ModelArts

全部通过：被驳回的样本，也会通过。全部驳回：已经通过的样本，需要重新标注，下次验收时重新进行审核。剩余全部通过：已经驳回的会驳回，其余会自动验收通过。剩余全部驳回：样本抽中的通过的，不需要标注了，未通过和样本未抽中的需要重新标注验收。图10 完成验收查看验收报告针对进行中

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 标注ModelArts数据集中的数据 > 通过团队标注方式标注数据
什么是区域、可用区？ - AI开发平台ModelArts

目前，华为云已在全球多个地域开放云服务，您可以根据需求选择适合自己的区域和可用区。更多信息请参见华为云全球站点。如何选择区域？选择区域时，您需要考虑以下几个因素：地理位置一般情况下，建议就近选择靠近您或者您的目标用户的区域，这样可以减少网络时延，提高访问速度。在除中国大陆以外

 帮助中心 > AI开发平台ModelArts > 常见问题 > 一般性问题
ModelArts - AI开发平台ModelArts
ModelArts - AI开发平台ModelArts

制作模型镜像并导入自定义镜像规范模型包规范在AI应用管理创建AI应用时，如果是从OBS或容器镜像中导入元模型，则需要符合一定的模型包规范。您需要编写对应的推理代码和配置文件，方便后续进行推理部署。说明：由于使用预置算法训练得到的模型，已包含了推理代码和配置文件，所以无需另外编写提供。

帮助中心 > AI开发平台ModelArts > 功能总览
查看授权列表 - AI开发平台ModelArts

用户ID，获取方法请参见获取用户ID和名称。当user_id为all时，表示对所有IAM子用户进行授权，如果已有部分用户已授权，则更新授权。仅当授权类型为委托时，需要该字段。 type String 授权类型。推荐使用委托方式。可选值： agency：委托 credential：访问密钥（AK/SK）

帮助中心 > AI开发平台ModelArts > API参考 > 授权管理
查询数据集列表 - AI开发平台ModelArts

指定查询的排序顺序。可选值如下： asc：递增排序 desc：递减排序（默认值） running_task_type 否 Integer 指定需要检测的正在运行任务（包括初始化）的类型。可选值如下： 0：自动标注 1：预标注 2：导出任务 3：切换版本 4：导出manifest 5：导入manifest

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
（可选）工作空间配置 - AI开发平台ModelArts

如果您未开通企业项目管理服务的权限，也可以在ModelArts创建自己独立的工作空间，但是无法使用跟企业项目相关的功能。工作空间为白名单功能，使用该功能需要提工单申请开通。父主题：基本配置

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 基本配置
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

#tokenizer目录，需要用户手动创建，后续操作步骤中会提示 |── Llama2-70B |── models #原始权重与tokenizer目录，需要用户手动创建，后续操作步骤中会提示

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.911） > 准备工作
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

#tokenizer目录，需要用户手动创建，后续操作步骤中会提示 |── Llama2-70B |── models #原始权重与tokenizer目录，需要用户手动创建，后续操作步骤中会提示

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.910） > 准备工作
手动续费 - AI开发平台ModelArts
手动续费 - AI开发平台ModelArts

所有需手动续费的资源都可归置到“手动续费项”页签，具体操作请参见如何恢复为手动续费。手动续费资源。单个续费：在资源页面找到需要续费的资源，单击操作列的“续费”。图1 单个续费批量续费：在资源页面勾选需要续费的资源，单击列表左上角的“批量续费”。选择资源的续费时长，判断是否勾选“统一到期日”，将资源

 帮助中心 > AI开发平台ModelArts > 计费说明 > 续费
发布Workflow到AI Gallery - AI开发平台ModelArts

rivate"。否 str group_users 白名单列表，仅支持填写domain_id，当visibility为"group"时才需要填写该字段否 list[str] 根据方法的入参不同，主要可分为以下两种使用场景： Workflow.release_to_galler

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 发布Workflow

总条数： 1550

上一页
1
...
67
68
69
...
78
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Standard模型训练 - AI开发平台ModelArts

日志提示“No module name 'unidecode'” - AI开发平台ModelArts

服务启动后，状态断断续续处于“告警中” - AI开发平台ModelArts

用户创建模型时构建镜像或导入文件失败 - AI开发平台ModelArts

上传算法至SFS - AI开发平台ModelArts

附录：大模型推理常见问题 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

训练运行报错AttributeError: 'torch_npu._C._NPUDeviceProperties' object has no attribute 'multi_processor_count' - AI开发平台ModelArts

Notebook中已安装对应库，仍报错import numba ModuleNotFoundError: No module named 'numba' - AI开发平台ModelArts

VS Code使用技巧 - AI开发平台ModelArts

审核并验收团队标注任务结果 - AI开发平台ModelArts

什么是区域、可用区？ - AI开发平台ModelArts

ModelArts - AI开发平台ModelArts

查看授权列表 - AI开发平台ModelArts

查询数据集列表 - AI开发平台ModelArts

（可选）工作空间配置 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

手动续费 - AI开发平台ModelArts

发布Workflow到AI Gallery - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线