搜索_华为云

查看日志和性能 - AI开发平台ModelArts

rser查看loss收敛情况，如图2所示。单节点训练：训练过程中的loss直接打印在窗口上。多节点训练：训练过程中的loss打印在最后一个节点上。图2 Loss收敛情况（示意图）父主题：主流开源大模型基于Lite Cluster适配PyTorch NPU训练指导（6.3

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU训练指导（6.3.910）
查看日志和性能 - AI开发平台ModelArts

rser查看loss收敛情况，如图2所示。单节点训练：训练过程中的loss直接打印在窗口上。多节点训练：训练过程中的loss打印在最后一个节点上。图2 Loss收敛情况（示意图）父主题：主流开源大模型基于Lite Cluster适配PyTorch NPU训练指导（6.3

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU训练指导（6.3.909）
如何提升训练效率，同时减少与OBS的交互？ - AI开发平台ModelArts

“/cache”目录下的数据生命周期与训练作业生命周期相同，当训练作业运行结束以后“/cache”目录下面所有内容会被清空，腾出空间，供下一次训练作业使用。因此，可以在训练过程中将数据从OBS复制到“/cache”目录，然后每次从“/cache”目录读取数据，直到训练结束。训练结

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard训练作业 > 训练过程读取数据
获取训练作业日志的文件名 - AI开发平台ModelArts

调用失败时的错误码，具体请参见错误码。调用成功时无此字段。 log_file_list String 训练作业的日志文件名。单机作业日志仅有一个文件，分布式作业日志有多个文件。请求示例如下以获取“job_id”为10，“version_id”为10的作业日志文件为例。 GET

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
数据管理计费项 - AI开发平台ModelArts

计费示例以下案例中出现的费用价格仅供参考，实际价格请参见各服务价格详情。示例：存储费用假设用户于2023年4月1日10:00:00创建了一个数据集，数据是存储在OBS中的。按照存储费用结算，那么数据存储到OBS的费用计算如下：存储费用：数据管理模块的数据通过对象存储服务（OB

帮助中心 > AI开发平台ModelArts > 计费说明 > 计费项
ECS服务器挂载SFS Turbo存储 - AI开发平台ModelArts

ECS服务器和SFS的共享硬盘在相同的VPC或者对应VPC能够互联。 ECS服务器基础镜像需要用Ubuntu 18.04的。 ECS服务器和SFS Turbo需要在同一子网中。操作步骤在ECS服务器中设置华为云镜像源。 sudo sed -i "s@http://.*archive.ubuntu.com@http://repo

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 基本配置
使用llm-compressor工具量化 - AI开发平台ModelArts

使用量化模型需要在NPU的机器上运行。启动vLLM前，请开启图模式（参考步骤六启动推理服务中的配置环境变量），启动服务的命令和启动非量化模型一致。父主题：推理模型量化

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
预训练任务 - AI开发平台ModelArts

ain_70b.sh <MASTER_ADDR=xx.xx.xx.xx> <NNODES=4> <NODE_RANK=0> 示例： # 第一台节点 sh scripts/llama2/0_pl_pretrain_70b.sh xx.xx.xx.xx 4 0 # 第二台节点

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.906）
【下线公告】华为云ModelArts服务模型转换下线公告 - AI开发平台ModelArts

您可以通过链接下载ATC模型转换工具，按照指导，在线下转换成.om格式模型。 ModelArts中是否还会增加模型转换的能力？ ModelArts开发环境中在贵阳一Region，支持将ONNX或PyTorch模型转换到.mindir格式。其它能力在持续增加中。如果您暂时无法在该region中使用该能力，您可以通过链接下载MindSpore

帮助中心 > AI开发平台ModelArts > 服务公告 > 下线公告
查看日志和性能 - AI开发平台ModelArts

rser查看loss收敛情况，如图2所示。单节点训练：训练过程中的loss直接打印在窗口上。多节点训练：训练过程中的loss打印在最后一个节点上。图2 Loss收敛情况（示意图）父主题：主流开源大模型基于Lite Cluster适配PyTorch NPU训练指导（6.3

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU训练指导（6.3.911）
迁移环境准备 - AI开发平台ModelArts

迁移环境准备迁移环境准备有以下两种方式：表1 方式说明序号名称说明方式一 ModelArts Notebook 该环境为在线调试环境，主要面向演示、体验和快速原型调试场景。优点：可快速、低成本地搭建环境，使用标准化容器镜像，官方Notebook示例可直接运行。缺点

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导
创建网络 - AI开发平台ModelArts
创建网络 - AI开发平台ModelArts

0/12~26、192.168.0.0/16~26。 IPV6：开启IPv6功能后，将自动为子网分配IPv6网段，暂不支持自定义设置IPv6网段，该功能一旦开启，将不能关闭。若创建网络时未勾选开启IPv6，也可在创建网络后在操作列单击“启动IPv6”，如图3 打通VPC前，需要保证Model

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 基本配置
配置Lite Cluster网络 - AI开发平台ModelArts

选择刚才创建的弹性公网IP，单击“确定”。图5 绑定弹性公网IP 通过SSH方式远程访问集群资源包括2种方式，密码方式或密钥方式，二选一即可。通过SSH密钥方式登录云服务器，具体操作请参见SSH密钥登录方式。通过SSH密码方式登录云服务器，具体操作请参见SSH密码登录方式。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源配置
查询Workflow Execution - AI开发平台ModelArts

StepExecution 参数参数类型描述 step_name String 节点的名称，在一个DAG中唯一，1到64位只包含中英文，数字，空格，下划线（_）和中划线（-），并且以中英文开头。 uuid String 唯一标识uuid。创建节点执行时，后台自动生成。 created_at String

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
moondream2基于DevServer适配PyTorch NPU推理指导 - AI开发平台ModelArts

e/2024-03-06。在宿主机上创建一个空目录/home/temp，将下载的模型包存放在宿主机/home/temp/moondream2目录下，修改目录权限后，复制到容器中。 mkdir /home/temp #创建一个空目录，将下载的模型包存放在宿主机/ho

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
查询节点池的节点列表 - AI开发平台ModelArts

nodepool_name 是 String 节点池名称。表2 Query参数参数是否必选参数类型描述 continue 否 String 分页查询时上一页位置。 limit 否 String 分页单次查询返回数。请求参数无响应参数状态码： 200 表3 响应Body参数参数参数类型

 帮助中心 > AI开发平台ModelArts > API参考 > 节点池管理
查询资源规格列表 - AI开发平台ModelArts

用户项目ID。获取方法请参见获取项目ID和名称。表2 Query参数参数是否必选参数类型描述 continue 否 String 分页查询时上一页位置。 labelSelector 否 String 标签筛选。 limit 否 Integer 分页数目。请求参数无响应参数状态码：

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
查询Notebook支持的可切换规格列表 - AI开发平台ModelArts

用户项目ID，获取方法请参见获取项目ID和名称。表2 Query参数参数是否必选参数类型描述 limit 否 Integer 每一页的数量，默认不限制。 offset 否 Integer 分页记录的起始位置偏移量。请求参数无响应参数状态码： 200 表3 响应Body参数

 帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
查询节点列表 - AI开发平台ModelArts

pool_name 是 String 资源池名称。表2 Query参数参数是否必选参数类型描述 continue 否 String 分页查询时上一页位置。 limit 否 Integer 分页单次查询返回数。请求参数无响应参数状态码： 200 表3 响应Body参数参数参数类型

 帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
推理精度测试 - AI开发平台ModelArts

数据集数据预处理方法集 │ ├── chatglm.py # 处理请求相应模块, 一般和chatglm的官方评测数据集ceval搭配 │ ├── llama.py # 处理请求相应模块, 一般和llama的评测数据集mmlu搭配 ├── mmlu-exam, mmlu数据集

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.905）

总条数： 1440

上一页
1
...
61
62
63
...
72
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

查看日志和性能 - AI开发平台ModelArts

查看日志和性能 - AI开发平台ModelArts

如何提升训练效率，同时减少与OBS的交互？ - AI开发平台ModelArts

获取训练作业日志的文件名 - AI开发平台ModelArts

数据管理计费项 - AI开发平台ModelArts

ECS服务器挂载SFS Turbo存储 - AI开发平台ModelArts

使用llm-compressor工具量化 - AI开发平台ModelArts

预训练任务 - AI开发平台ModelArts

【下线公告】华为云ModelArts服务模型转换下线公告 - AI开发平台ModelArts

查看日志和性能 - AI开发平台ModelArts

迁移环境准备 - AI开发平台ModelArts

创建网络 - AI开发平台ModelArts

配置Lite Cluster网络 - AI开发平台ModelArts

查询Workflow Execution - AI开发平台ModelArts

moondream2基于DevServer适配PyTorch NPU推理指导 - AI开发平台ModelArts

查询节点池的节点列表 - AI开发平台ModelArts

查询资源规格列表 - AI开发平台ModelArts

查询Notebook支持的可切换规格列表 - AI开发平台ModelArts

查询节点列表 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线