搜索_华为云

启动推理服务 - AI开发平台ModelArts

ggingFace的目录格式。即上传的HuggingFace权重文件存放目录。如果使用了量化功能，则使用量化章节转换后的权重。如果使用的是训练后模型转换为HuggingFace格式的地址，还需要有Tokenizer原始文件。 --max-num-seqs：最大同时处理的请求数，超过后在等待池等候处理。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理服务部署
IAM - AI开发平台ModelArts
IAM - AI开发平台ModelArts

开发环境的Notebook实例 exemlProject 自动学习项目 exemlProjectInf 自动学习项目的在线推理服务 exemlProjectTrain 自动学习项目的训练作业 exemlProjectVersion 自动学习项目的版本 workflow Workflow项目 pool

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 权限控制方式
推理性能测试 - AI开发平台ModelArts

├── requirements.txt # 第三方依赖目前性能测试已经支持投机推理能力。静态benchmark验证本章节介绍如何进行静态benchmark验证。已经上传benchmark验证脚本到推理容器中。如果在Step3 制作推理镜像步骤中已经上传过AscendCloud-LLM-x

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910）
图模式 - AI开发平台ModelArts
图模式 - AI开发平台ModelArts

-e . 开启图模式后，服务第一次响应请求时会有一个较长时间的图编译过程，并且会在当前目录下生成.torchair_cache文件夹来保存图编译的缓存文件。当服务第二次启动时，可通过缓存文件来快速完成图编译的过程，避免长时间的等待，并且基于图编译缓存文件来启动服务可获得更优的推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用
（可选）本地服务器安装ModelArts SDK - AI开发平台ModelArts

SDK，安装后可直接调用ModelArts SDK轻松管理数据集、创建ModelArts训练作业及创建AI应用，并将其部署为在线服务。 ModelArts SDK使用限制本地ModelArts SDK不支持进行训练作业调测、模型调试和在开发环境中部署本地服务进行调试，当前仅支持在开发环境Notebook中调试。

帮助中心 > AI开发平台ModelArts > SDK参考
订阅免费算法 - AI开发平台ModelArts

订阅免费算法在AI Gallery中，您可以查找并订阅免费满足业务需要的算法，直接用于创建训练作业。 AI Gallery中分享的算法支持免费订阅，但在使用过程中如果消耗了硬件资源进行部署，管理控制台将根据实际使用情况收取硬件资源的费用。前提条件注册并登录华为云，且创建好OBS桶用于存储数据和模型。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（旧版） > 订阅使用
Manifest管理概述 - AI开发平台ModelArts

Manifest管理概述在ModelArts使用过程中，需要做数据标注、模型训练、推理、数据集管理、市场发布等业务，这些业务都基于数据集进行的。为了规范对数据集的使用，适配各个使用场景，同时兼顾数据集管理的灵活性，本文档描述数据集管理的接口和描述规范——Manifest文件。

帮助中心 > AI开发平台ModelArts > SDK参考 > 数据管理 > Manifest管理
W4A16量化 - AI开发平台ModelArts
W4A16量化 - AI开发平台ModelArts

算时的数据类型（activation）和kvcache一般使用半精度浮点FP16或BF16。量化指将高比特的浮点转换为更低比特的数据类型的过程。例如int4、int8等。模型量化分为weight-only量化，weight-activation量化和kvcache量化。量化的

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用 > 量化
在ModelArts的Notebook中，如何使用昇腾多卡进行调试？ - AI开发平台ModelArts

在ModelArts的Notebook中，如何使用昇腾多卡进行调试？昇腾多卡训练任务是多进程多卡模式，跑几卡需要起几个python进程。昇腾底层会读取环境变量：RANK_TABLE_FILE，开发环境已经设置，用户无需关注。比如跑八卡，可以如下片段代码： export RANK_SIZE=8

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
查询Workflow工作流 - AI开发平台ModelArts

Boolean SMN开关。 subscription_id String SMN消息订阅ID。 exeml_template_id String 自动学习模板ID。 last_modified_at String 最近一次修改的时间。 package WorkflowServicePackege

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
ModelArts中提示OBS相关错误 - AI开发平台ModelArts

在左侧菜单栏选择“访问权限控制>桶策略”，检查当前OBS桶是否允许子用户访问。检查训练作业的代码目录和启动文件地址进入ModelArts管理控制台，在“作业管理 > 训练作业”中查找到对应的“运行失败”的训练作业，单击作业“名称/ID”进入详情页。在详情页左侧栏中，查看代码目录和启

 帮助中心 > AI开发平台ModelArts > 故障排除 > 通用问题
使用ModelArts Studio的Qwen2-7B模型框架实现对话问答 - AI开发平台ModelArts

本案例用于指导用户使用ModelArts Studio大模型即服务平台（下面简称为MaaS）的Qwen2-7B模型框架，创建并部署一个模型服务，实现对话问答。通过学习本案例，您可以快速了解如何在MaaS服务上的创建和部署模型。更多MaaS服务的使用指导请参见用户指南。操作流程开始使用如下样例前，请务必按准备工作指导完成必要操作。

帮助中心 > AI开发平台ModelArts > 快速入门
依赖和委托 - AI开发平台ModelArts

modelarts:workspace:get 创建训练作业和查看训练日志。 modelarts:workspace:getQuota 查询工作空间配额。如果开通了工作空间功能，则需要配置此权限。 modelarts:tag:list 在训练作业中使用标签管理服务TMS。 IAM iam

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 权限控制方式
在Workflow中使用大数据能力（DLI/MRS） - AI开发平台ModelArts

功能介绍该节点通过调用MRS服务，提供大数据集群计算能力。主要用于数据批量处理、模型训练等场景。应用场景需要使用MRS Spark组件进行大量数据的计算时，可以根据已有数据使用该节点进行训练计算。使用案例在华为云MRS服务下查看自己账号下可用的MRS集群，如果没有，则需要

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > Workflow高阶能力
自定义模型规范 - AI开发平台ModelArts

训练数据的日志文件存放路径。训练过程中的迭代次数、LOSS和吞吐数据按照“迭代次数|loss|吞吐”格式记录在日志中，AI Gallery通过环境变量找到日志，从中获取实际数据绘制成“吞吐”和“训练LOSS”曲线，呈现在训练的“指标效果”中。具体请参见查看训练效果。说明：日志文件中的迭代次

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery模型 > 构建模型
使用CodeLab免费体验Notebook - AI开发平台ModelArts

以直接通过Run in ModelArts，一键打开运行和学习，并且可将样例修改后分享到AI Gallery中直接另存用于个人开发。同时，您开发的代码，也可通过CodeLab快速分享到AI Gallery中给他人使用学习。使用限制 CodeLab默认打开，使用的是CPU计算资

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试
语言模型推理性能测试 - AI开发平台ModelArts

├── requirements.txt # 第三方依赖目前性能测试已经支持投机推理能力。静态benchmark验证本章节介绍如何进行静态benchmark验证。已经上传benchmark验证脚本到推理容器中。如果在步骤四制作推理镜像步骤中已经上传过AscendCloud-LLM-x

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.910） > 推理性能测试
ModelArts中的作业为什么一直处于等待中？ - AI开发平台ModelArts

如果是专属资源池，建议您进行以下排查：排查专属资源池中是否存在其他作业（包括推理作业、训练作业、开发环境作业等）。可通过总览页面，快速判断是否有其他模块的作业或实例在运行中，并进入到相关作业或实例上，判断是否使用了专属资源池。如判断相关作业或实例可停止，则可以停止，释放出更多的资源。单击进入专属资源池详情页面，查看作业列表。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard专属资源池
API概览 - AI开发平台ModelArts
API概览 - AI开发平台ModelArts

API 说明创建训练作业创建训练作业。查询训练作业详情查询训练作业详情。更新训练作业描述更新训练作业描述。删除训练作业删除训练作业。终止训练作业终止训练作业，只可终止创建中、等待中、运行中的作业。查询训练作业指定任务的日志（预览）查询训练作业指定任务的日志（预览）。

帮助中心 > AI开发平台ModelArts > API参考
语言模型推理性能测试 - AI开发平台ModelArts

├── requirements.txt # 第三方依赖目前性能测试已经支持投机推理能力。静态benchmark验证本章节介绍如何进行静态benchmark验证。已经上传benchmark验证脚本到推理容器中。如果在步骤四制作推理镜像步骤中已经上传过AscendCloud-LLM-x

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.909） > 推理性能测试

总条数： 1051

上一页
1
...
45
46
47
...
53
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

启动推理服务 - AI开发平台ModelArts

IAM - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

图模式 - AI开发平台ModelArts

（可选）本地服务器安装ModelArts SDK - AI开发平台ModelArts

订阅免费算法 - AI开发平台ModelArts

Manifest管理概述 - AI开发平台ModelArts

W4A16量化 - AI开发平台ModelArts

在ModelArts的Notebook中，如何使用昇腾多卡进行调试？ - AI开发平台ModelArts

查询Workflow工作流 - AI开发平台ModelArts

ModelArts中提示OBS相关错误 - AI开发平台ModelArts

使用ModelArts Studio的Qwen2-7B模型框架实现对话问答 - AI开发平台ModelArts

依赖和委托 - AI开发平台ModelArts

在Workflow中使用大数据能力（DLI/MRS） - AI开发平台ModelArts

自定义模型规范 - AI开发平台ModelArts

使用CodeLab免费体验Notebook - AI开发平台ModelArts

语言模型推理性能测试 - AI开发平台ModelArts

ModelArts中的作业为什么一直处于等待中？ - AI开发平台ModelArts

API概览 - AI开发平台ModelArts

语言模型推理性能测试 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线