搜索_华为云

Jupyter可以安装插件吗？ - AI开发平台ModelArts

local/lib/python3.7/site-packages 配置文件目录：/home/ma-user/.jupyter/ 后端插件使用jupyter server extension list命令查询。父主题： CodeLab

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > CodeLab
ma-cli configure鉴权命令 - AI开发平台ModelArts

ma-cli configure鉴权命令鉴权信息说明在虚拟机及个人PC场景，需要配置鉴权信息，目前支持用户名密码鉴权（默认）和AK/SK鉴权；在使用账号认证时，需要指定username和password；在使用IAM用户认证时，需要指定account、username和password；

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > ModelArts CLI命令参考
准备MaaS资源 - AI开发平台ModelArts

5的专属资源池，其他版本会导致任务失败。当专属资源池的驱动版本不适配时，可以参考升级Standard专属资源池驱动升级驱动。公共资源池：公共资源池提供公共的大规模计算集群，根据用户作业参数分配使用，资源按作业隔离。MaaS服务可以使用ModelArts Standard形态下提供的公共资源池完成模型训推

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
迁移过程使用工具概览 - AI开发平台ModelArts

AKG由三个基本的优化模块组成：规范化、自动调度和后端优化。规范化：为了解决polyhedral表达能力的局限性（只能处理静态的线性程序），需要首先对计算公式IR进行规范化。规范化模块中的优化主要包括自动运算符inline、自动循环融合和公共子表达式优化等。自动调度：自动调度模块基于po

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
部署推理服务 - AI开发平台ModelArts

/目录下通过vLLM服务API接口启动服务，具体操作命令如下，API Server的命令相关参数说明如下，可以根据参数说明修改配置。 python -m vllm.entrypoints.api_server --model ${container_model_path} \ --max-num-seqs=256

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.907）
yaml配置文件参数配置说明 - AI开发平台ModelArts

1000 用于指定训练过程中使用的最大样本数量。如果设置了这个参数，训练过程将只使用指定数量的样本，而忽略其他样本。这可以用于控制训练过程的规模和计算需求 overwrite_cache true 用于指定是否覆盖缓存。如果设置为"overwrite_cache"，则在训练过程中覆盖缓存

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.907） > 训练脚本说明
使用SDK调测单机训练作业 - AI开发平台ModelArts

值是一个列表，描述了训练服务支持的所有规格的信息。每个元素中flavor_id是可直接用于远程训练任务的计算规格，max_num是该规格的最大节点数。如果用户知道要使用的计算规格，可以略过这一步。提交远程训练作业。 from modelarts.estimatorV2 import

帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业 > 训练作业调测
如何关闭Mox的warmup - AI开发平台ModelArts

step记录执行时间，选择执行时间最少的模型。处理方法创建训练作业时，在“运行参数”中增加参数“variable_update=parameter_server”来关闭Mox的warmup。父主题： MoXing

帮助中心 > AI开发平台ModelArts > 故障排除 > MoXing
更新资源池 - AI开发平台ModelArts

资源规格名称，比如：modelarts.vm.gpu.tnt004。 count Integer 规格保障使用量。 maxCount Integer 资源规格的弹性使用量，物理池该值和count相同。 azs Array of azs objects 资源所在的AZ的数量。 nodePool String

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
Lite Server资源配置流程 - AI开发平台ModelArts

不同镜像中预安装的软件不同，您通过Lite Server算力资源和镜像版本配套关系章节查看已安装的软件。当Server服务器中预装的软件无法满足业务需求时，您可在Server服务器中配置所需要的软件环境。父主题： Lite Server资源配置

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源配置
使用ModelArts Standard自动学习实现垃圾分类 - AI开发平台ModelArts

其他参数保持默认。计算节点规格：根据您的实际需求选择相应的规格，不同规格的配置费用不同，选择好规格后，配置费用处会显示相应的费用。是否自动停止：为了避免资源浪费，建议您打开该开关，根据您的需求，选择自动停止时间，也可以自定义自动停止的时间。图2 选择计算节点规格图3 设置自动停止

 帮助中心 > AI开发平台ModelArts > 快速入门
使用ModelArts Standard自动学习实现垃圾分类 - AI开发平台ModelArts

其他参数保持默认。计算节点规格：根据您的实际需求选择相应的规格，不同规格的配置费用不同，选择好规格后，配置费用处会显示相应的费用。是否自动停止：为了避免资源浪费，建议您打开该开关，根据您的需求，选择自动停止时间，也可以自定义自动停止的时间。图2 选择计算节点规格图3 设置自动停止

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard自动学习
使用WebSocket协议的方式访问在线服务 - AI开发平台ModelArts

IDL中的WebSocket API由W3C标准化。 WebSocket使得客户端和服务器之间的数据交换变得更加简单，允许服务端主动向客户端推送数据。在WebSocket API中，浏览器和服务器只需要完成一次握手，两者之间就可以建立持久性的连接，并进行双向数据传输。前提条件

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的传输协议
功能咨询 - AI开发平台ModelArts
功能咨询 - AI开发平台ModelArts

如何查询自定义镜像的cuda和cudnn版本？ Moxing安装文件如何获取？如何使用soft NMS方法降低目标框堆叠度多节点训练TensorFlow框架ps节点作为server会一直挂着，ModelArts是怎么判定训练任务结束？如何知道是哪个节点是worker呢？训练作业的自定义镜像如何安装Moxing？

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard训练作业
训练作业找不到GPU - AI开发平台ModelArts

可见的GPU： os.environ['CUDA_VISIBLE_DEVICES'] = '0,1,2,3,4,5,6,7' 其中，0为服务器的GPU编号，可以为0，1，2，3等，表明对程序可见的GPU编号。如果未进行添加配置则该编号对应的GPU不可用。父主题： GPU相关问题

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > GPU相关问题
使用DCGM监控Lite Server资源 - AI开发平台ModelArts

GPU大规模集群的一体化工具，提供多种能力，包括主动健康监控、诊断、系统验证、策略、电源和时钟管理、配置管理和审计等。约束限制仅适用于GPU资源监控。前提条件裸金属服务器需要安装driver、cuda、fabric-manager软件包。步骤一：安装Docker 使用Docker官方脚本安装最新版Docker：

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源管理 > 监控Lite Server资源
从0制作自定义镜像用于创建训练作业（Pytorch+Ascend） - AI开发平台ModelArts

7及以上版本docker的虚拟机或物理机用作镜像构建节点，以下称“构建节点”。可以通过执行docker pull、apt-get update/upgrade和pip install命令判断是否可正常访问外部可用的开源软件仓库，若可以正常访问表示环境已连接外部网络。上述的虚拟机或物理机需要为arm64架构。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于训练模型
在推理生产环境中部署推理服务 - AI开发平台ModelArts

--image-feature-size：图片输入解析维度大小；llava-v1.6图片输入维度与image-feature-size关系映射表见git；计算原理如下：最小处理单元为14*14 【llava1.5】 336*336图像 ==(336/14=24)>> 24*24=576 672*672图像

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908）
查看训练作业日志 - AI开发平台ModelArts

键字、系统日志过滤能力。预览系统日志窗口提供训练日志预览功能，如果训练作业有多个节点，则支持查看不同计算节点的日志，通过右侧下拉框可以选择目标节点预览。图4 查看不同计算节日志当日志文件过大时，系统日志窗口仅加载最新的部分日志，并在日志窗口上方提供全量日志访问链接。打开该链接可在新页面查看全部日志。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

包含了本教程中使用到的模型训练代码、推理部署代码和推理评测代码。代码包具体说明请参见模型软件包结构说明。 AscendSpeed是用于模型并行计算的框架，其中包含了许多模型的输入处理方法。获取路径：Support-E 请联系您所在企业的华为方技术支持下载获取。模型软件包结构说明

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.909） > 准备工作

总条数： 713

上一页
1
...
28
29
30
...
36
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Jupyter可以安装插件吗？ - AI开发平台ModelArts

ma-cli configure鉴权命令 - AI开发平台ModelArts

准备MaaS资源 - AI开发平台ModelArts

迁移过程使用工具概览 - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

yaml配置文件参数配置说明 - AI开发平台ModelArts

使用SDK调测单机训练作业 - AI开发平台ModelArts

如何关闭Mox的warmup - AI开发平台ModelArts

更新资源池 - AI开发平台ModelArts

Lite Server资源配置流程 - AI开发平台ModelArts

使用ModelArts Standard自动学习实现垃圾分类 - AI开发平台ModelArts

使用ModelArts Standard自动学习实现垃圾分类 - AI开发平台ModelArts

使用WebSocket协议的方式访问在线服务 - AI开发平台ModelArts

功能咨询 - AI开发平台ModelArts

训练作业找不到GPU - AI开发平台ModelArts

使用DCGM监控Lite Server资源 - AI开发平台ModelArts

从0制作自定义镜像用于创建训练作业（Pytorch+Ascend） - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

查看训练作业日志 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线