搜索_华为云

扩缩容Lite Cluster资源池 - AI开发平台ModelArts

选择随机分配时，可通过增减“目标总节点数”实现扩缩容，请用户根据本身业务诉求进行调整。增加目标节点数量即表示扩容，减少目标节点数量即表示缩容。扩缩容完成后，节点的可用区分布由系统后台随机选择。选择指定AZ时，可指定扩缩容完成后节点的可用区分布。图1 资源配置（单节点方式）若购买资源池时，节点数量采用整柜方式购

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理
从0制作自定义镜像用于创建训练作业（Tensorflow+GPU） - AI开发平台ModelArts

nsorflow，训练使用的资源是GPU。本实践教程仅适用于新版训练作业。场景描述本示例使用Linux x86_64架构的主机，操作系统ubuntu-18.04，通过编写Dockerfile文件制作自定义镜像。目标：构建安装如下软件的容器镜像，并在ModelArts平台上使用GPU规格资源运行训练任务。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于训练模型
裸金属服务器Euler OS升级NetworkManager-config-server导致SSH链接故障解决方案 - AI开发平台ModelArts

update -y”，“yum update -y”命令是用于在Linux操作系统上更新软件包的命令。其中，选项-y表示在更新时自动确认所有提示信息，而不需要手动输入“y”确认。请注意，使用此命令将会检查您系统中已安装的软件包并更新至最新版本。图1 yum命令历史查看NetworkManager配置：

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
在MaaS中创建模型 - AI开发平台ModelArts

sampling parameters such as temperature, top_p, top_k etc. 在generation_config.json中没有将do_sample的值设置为true，与配置的temperature、top_p、top_k等采样参数矛盾。将“generation_config

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
查询数据集列表 - AI开发平台ModelArts

根据版本切分比例筛选数据集。例如：“0.0,1.0”，根据逗号分隔最小和最大切分比例，筛选出切分比例在此范围内的版本。说明：如果参数值为空或无该参数，系统默认不根据版本切分比例筛选数据集。 version_format 否 Integer 根据数据集发布的版本格式筛选数据集，过滤出包含符合筛选条件的数据集列表。可选值如下：

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
线下容器镜像构建及调试 - AI开发平台ModelArts

可以直接把SFS的目录直接挂载到调试节点的"/mnt/sfs_turbo"目录，或者保证对应目录的内容和SFS盘匹配。调试时建议使用接近的方式，即：启动容器实例时使用"-v"参数来指定挂载某个宿主机目录到容器环境。 docker run -ti -d -v /mnt/sfs_turbo:/sfs my_deeplearning_image:v1

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 单机单卡
示例：创建DDP分布式训练（PyTorch+GPU） - AI开发平台ModelArts

self.net2 = nn.Linear(10, 5) def forward(self, x): return self.net2(self.relu(self.net1(x))) def ddp_train(device_id): #

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 分布式模型训练
获取支持的超参搜索算法 - AI开发平台ModelArts

} ], "description" : "Hyperparameter search using the tree-structured Parzen estimator algorithm." }, { "name" : "anneal_search",

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
GPT-2基于Server适配PyTorch GPU的训练推理指导 - AI开发平台ModelArts

Megatron-Deepspeed是一个基于PyTorch的深度学习模型训练框架。它结合了两个强大的工具：Megatron-LM和DeepSpeed，可在具有分布式计算能力的系统上进行训练，并且充分利用了多个GPU和深度学习加速器的并行处理能力。可以高效地训练大规模的语言模型。 Megatron-LM是一个用于大规

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源使用
更新服务配置 - AI开发平台ModelArts

挂载在系统目录下，如“/”、“/var/run”等，会导致容器异常。建议挂载在空目录下，若目录不为空，请确保目录下无影响容器启动的文件，否则文件会被替换，导致容器启动异常，工作负载创建失败。 storage_type 否 String 挂载类型sfs_turbo极速文件系统挂载。

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
pipeline代码适配 - AI开发平台ModelArts

thread_affinity_mode = 2 return context def __call__(self, **kwargs): if not self.use_ascend: return self.onnx_runtime_model(**kwargs)

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导 > 应用迁移
分离部署推理服务 - AI开发平台ModelArts

nci5。 -v ${dir}:${container_work_dir} 代表需要在容器中挂载宿主机的目录。宿主机和容器使用不同的大文件系统，dir为宿主机中文件目录，${container_work_dir}为要挂载到的容器中的目录。为方便两个地址可以相同。容器不能挂载到/

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.908） > 部署推理服务
分离部署推理服务 - AI开发平台ModelArts

nci5。 -v ${dir}:${container_work_dir} 代表需要在容器中挂载宿主机的目录。宿主机和容器使用不同的大文件系统，dir为宿主机中文件目录，${container_work_dir}为要挂载到的容器中的目录。为方便两个地址可以相同。容器不能挂载到/

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.909） > 部署推理服务
什么是区域、可用区？ - AI开发平台ModelArts

独立的风火水电，AZ内逻辑上再将计算、网络、存储等资源划分成多个集群。一个Region中的多个AZ间通过高速光纤相连，以满足用户跨AZ构建高可用性系统的需求。图1阐明了区域和可用区之间的关系。图1 区域和可用区目前，华为云已在全球多个地域开放云服务，您可以根据需求选择适合自

 帮助中心 > AI开发平台ModelArts > 常见问题 > 一般性问题
开发环境的应用示例 - AI开发平台ModelArts

"id": "88bd7bcd-0c91-45b2-ad0e-ef65553d19c5", "name": "dls-feature-engineering", "resource_categories": [ "CPU" ], "service_type":

帮助中心 > AI开发平台ModelArts > API参考 > 应用示例
约束与限制 - AI开发平台ModelArts

装操作系统，您可通过切换操作系统的方式解决。更多信息，请参见Server使用前须知。 ModelArts Lite Server服务器重装或者切换操作系统后，对应的EVS系统盘ID发生变化，和下单时订单中的EVS ID已经不一致，因此EVS系统盘无法扩容，并显示信息："当前订单

 帮助中心 > AI开发平台ModelArts > 产品介绍
Lite Server高危操作一览表 - AI开发平台ModelArts

高：对于可能直接导致业务失败、数据丢失、系统不能维护、系统资源耗尽的高危操作。中：对于可能导致安全风险及可靠性降低的高危操作。低：高、中风险等级外的其他高危操作。表1 高危操作一览表操作对象操作名称风险描述风险等级应对措施操作系统升级/修改操作系统内核或者驱动。如果升级/修改操作系统内核或者

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server使用前必读
上传本地文件至JupyterLab - AI开发平台ModelArts

对于大小不超过100MB的文件直接上传，并展示文件大小、上传进度及速度等详细信息。对于大小超过100MB不超过50GB的文件可以使用OBS中转，系统先将文件上传OBS（对象桶或并行文件系统），然后从OBS下载到Notebook，上传完成后，会将文件从OBS中删除。 50GB以上的文件上传通过调用ModelArts

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过JupyterLab在线使用Notebook实例进行AI开发 > 上传文件至JupyterLab
Lite Cluster高危操作一览表 - AI开发平台ModelArts

下表可帮助您定位异常出现的原因，风险操作包括但不限于以下内容。高危操作风险等级说明：高：对于可能直接导致业务失败、数据丢失、系统不能维护、系统资源耗尽的高危操作。中：对于可能导致安全风险及可靠性降低的高危操作。低：高、中风险等级外的其他高危操作。表1 操作及其对应风险

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster使用前必读
在推理生产环境中部署推理服务 - AI开发平台ModelArts

模型来源选择“从对象存储服务（OBS）中选择”，元模型选择转换后模型的存储路径，AI引擎选择“Custom”，引擎包选择准备镜像中上传的推理镜像。系统运行架构选择“ARM”。图2 设置AI应用单击“立即创建”开始AI应用创建，待应用状态显示“正常”即完成AI应用创建。若权重文件大于

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905）

总条数： 595

上一页
1
...
12
13
14
...
30
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

扩缩容Lite Cluster资源池 - AI开发平台ModelArts

从0制作自定义镜像用于创建训练作业（Tensorflow+GPU） - AI开发平台ModelArts

裸金属服务器Euler OS升级NetworkManager-config-server导致SSH链接故障解决方案 - AI开发平台ModelArts

在MaaS中创建模型 - AI开发平台ModelArts

查询数据集列表 - AI开发平台ModelArts

线下容器镜像构建及调试 - AI开发平台ModelArts

示例：创建DDP分布式训练（PyTorch+GPU） - AI开发平台ModelArts

获取支持的超参搜索算法 - AI开发平台ModelArts

GPT-2基于Server适配PyTorch GPU的训练推理指导 - AI开发平台ModelArts

更新服务配置 - AI开发平台ModelArts

pipeline代码适配 - AI开发平台ModelArts

分离部署推理服务 - AI开发平台ModelArts

分离部署推理服务 - AI开发平台ModelArts

什么是区域、可用区？ - AI开发平台ModelArts

开发环境的应用示例 - AI开发平台ModelArts

约束与限制 - AI开发平台ModelArts

Lite Server高危操作一览表 - AI开发平台ModelArts

上传本地文件至JupyterLab - AI开发平台ModelArts

Lite Cluster高危操作一览表 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线