搜索_华为云

准备环境 - AI开发平台ModelArts
准备环境 - AI开发平台ModelArts

lArts Lite DevServer 支持配置的存储方案请参考配置Lite Server存储。其中访问方式中，可支持在裸金属服务器中挂载的有弹性文件服务SFS和云硬盘EVS。父主题：准备工作

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.908） > 准备工作
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

提示：本文档适用于仅使用OBS对象存储服务（Object Storage Service）作为存储的方案，OBS用于存储模型文件、训练数据、代码、日志等，提供了高可靠性的数据存储解决方案。约束限制如果要使用自动重启功能，资源规格必须选择八卡规格，只有llama3-8B/70B支持该功能。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.908）
Lite功能介绍 - AI开发平台ModelArts

领域广泛得到应用。 ModelArts Lite又分以下2种形态： ModelArts Lite Server提供不同型号的xPU裸金属服务器，您可以通过弹性公网IP进行访问，在给定的操作系统镜像上可以自行安装加速卡相关的驱动和其他软件，使用SFS或OBS进行数据存储和读取相关的

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍
查看Standard专属资源池详情 - AI开发平台ModelArts

大小，则显示默认值）查看资源池监控在资源池详情页，切换到“监控”页签。展示了CPU使用量、内存利用率、磁盘可用容量等使用情况，均以资源池的维度呈现。当资源池中有AI加速卡时，还会显示GPU、NPU的相关监控信息。图4 查看资源视图表1 监控指标名称指标含义单位取值范围

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理 > 管理Standard专属资源池
从本地上传数据到ModelArts数据集 - AI开发平台ModelArts

创建一个空的OBS桶，OBS桶与ModelArts在同一区域，并确保用户具有OBS桶的操作权限。本地上传文件型和表格型数据均支持从本地上传。从本地上传的数据存储在OBS目录中，请先提前创建OBS桶。从本地上传的数据单次最多支持100个文件同时上传，总大小不超过5GB。不同类型的数据集，导入操作界面的示意图存

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 导入数据到ModelArts数据集
下载代码目录失败 - AI开发平台ModelArts

请您根据报错原因排查创建训练作业时指定的代码目录，即OBS桶的路径是否正确。有两种方法判断是否存在。使用当前账户登录OBS管理控制台，去查找对应的OBS桶、文件夹、文件是否存在。通过接口判断路径是否存在。在代码中执行如下命令，检查路径是否存在。 import moxing as mox mox.file

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
准备环境 - AI开发平台ModelArts
准备环境 - AI开发平台ModelArts

lArts Lite DevServer 支持配置的存储方案请参考配置Lite Server存储。其中访问方式中，可支持在裸金属服务器中挂载的有弹性文件服务SFS和云硬盘EVS。父主题：准备工作

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.907） > 准备工作
准备环境 - AI开发平台ModelArts
准备环境 - AI开发平台ModelArts

lArts Lite DevServer 支持配置的存储方案请参考配置Lite Server存储。其中访问方式中，可支持在裸金属服务器中挂载的有弹性文件服务SFS和云硬盘EVS。父主题：准备工作

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.908） > 准备工作
PyTorch - AI开发平台ModelArts
PyTorch - AI开发平台ModelArts

self.label = [0,1,2,3,4,5,6,7,8,9] # 亦可通过文件标签文件加载 # model目录下放置label.json文件，此处读取 dir_path = os.path.dirname(os.path.realpath(self

帮助中心 > AI开发平台ModelArts > 推理部署（历史文档待下线） > 推理规范说明 > 自定义脚本代码示例
VS Code中设置远端默认安装的插件 - AI开发平台ModelArts

VS Code中设置远端默认安装的插件在VS Code的配置文件settings.json中添加remote.SSH.defaultExtensions参数，如自动安装Python和Maven插件，可配置如下。 "remote.SSH.defaultExtensions": [

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > VS Code使用技巧
查看在线服务的事件 - AI开发平台ModelArts

build image. - 异常构建模型(xxx) 镜像失败，构建日志:\nxxx。 Failed to build image for model (%s %s), docker build log:\n%s. 根据构建日志定位和处理问题。异常构建镜像失败。 Failed to build

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理同步在线服务
Lite Cluster资源管理 - AI开发平台ModelArts

Cluster节点池管理Lite Cluster资源池标签扩缩容Lite Cluster资源池升级Lite Cluster资源池驱动监控Lite Cluster资源释放Lite Cluster资源

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster）
TensorFlow 2.1 - AI开发平台ModelArts

epochs=10) tf.keras.models.save_model(model, "./mnist") 推理代码在模型代码推理文件customize_service.py中，需要添加一个子类，该子类继承对应模型类型的父类，各模型类型的父类名称和导入语句如请参考表1。 import

帮助中心 > AI开发平台ModelArts > 推理部署（历史文档待下线） > 推理规范说明 > 自定义脚本代码示例
Lite Cluster资源管理介绍 - AI开发平台ModelArts

ModelArts面向此类客户提供了自助升级专属资源池GPU/Ascend驱动的能力。监控Lite Cluster资源：ModelArts支持使用AOM和Prometheus对资源进行监控，方便您了解当前的资源使用情况。释放Lite Cluster资源：针对不再使用的Lite

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理
Notebook使用场景 - AI开发平台ModelArts

在AI开发过程中，如何将文件方便快速地上传到Notebook几乎是每个开发者都会遇到的问题。ModelArts提供了多种文件上传方式，在文件上传过程中，可以查看上传进度和速度。将本地文件上传，请参考支持上传本地文件； GitHub的开源仓库的文件上传，请参考支持Clone GitHub开源仓库；

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试
SD1.5基于DevServer适配PyTorch NPU Finetune训练指导（6.3.904） - AI开发平台ModelArts

启动前配置。有两种方式修改配置文件：方式一：可以参考解压出来的default_config.yaml或者deepspeed_default_config.yaml文件，再通过在启动脚本命令中增加--config_file=xxx.yaml参数来指定其为配置文件。方式二：通过命令accelerate

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
分布式Tensorflow无法使用“tf.variable” - AI开发平台ModelArts

原因分析分布式Tensorflow不能使用“tf.variable”要使用“tf.get_variable”。处理方法请您将“启动文件”中的“tf.variable”替换为“tf.get_variable”。父主题：业务代码问题

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
数据类型不匹配问题如何处理？ - AI开发平台ModelArts

配的类型。图1 报错信息处理该问题时，pipeline_onnx_stable_diffusion_img2img_mslite.py文件的第454行修改如下：图2 修改内容父主题：常见问题

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导 > 常见问题
查看批量服务的事件 - AI开发平台ModelArts

build image. - 异常构建模型(xxx) 镜像失败，构建日志:\nxxx。 Failed to build image for model (%s %s), docker build log:\n%s. 根据构建日志定位和处理问题。异常构建镜像失败。 Failed to build

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理批量推理作业
给子账号配置训练作业基本使用权限 - AI开发平台ModelArts

obs:object:PutObject 训练作业启动前下载数据、模型、代码。训练作业运行中上传日志、模型。建议配置。操作步骤本案例场景为单机单卡场景下创建训练作业，数据和代码存储在OBS服务的并行文件系统下，创建自定义镜像训练作业。使用主用户账号登录管理控制台，单击右上角用户名，在

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践

总条数： 1257

上一页
1
...
32
33
34
...
63
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

准备环境 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

Lite功能介绍 - AI开发平台ModelArts

查看Standard专属资源池详情 - AI开发平台ModelArts

从本地上传数据到ModelArts数据集 - AI开发平台ModelArts

下载代码目录失败 - AI开发平台ModelArts

准备环境 - AI开发平台ModelArts

准备环境 - AI开发平台ModelArts

PyTorch - AI开发平台ModelArts

VS Code中设置远端默认安装的插件 - AI开发平台ModelArts

查看在线服务的事件 - AI开发平台ModelArts

Lite Cluster资源管理 - AI开发平台ModelArts

TensorFlow 2.1 - AI开发平台ModelArts

Lite Cluster资源管理介绍 - AI开发平台ModelArts

Notebook使用场景 - AI开发平台ModelArts

SD1.5基于DevServer适配PyTorch NPU Finetune训练指导（6.3.904） - AI开发平台ModelArts

分布式Tensorflow无法使用“tf.variable” - AI开发平台ModelArts

数据类型不匹配问题如何处理？ - AI开发平台ModelArts

查看批量服务的事件 - AI开发平台ModelArts

给子账号配置训练作业基本使用权限 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线