搜索_华为云

推理性能测试 - AI开发平台ModelArts

评测静态性能脚本 ├── benchmark_serving.py # 评测动态性能脚本 ├── generate_dataset.py # 生成自定义数据集的脚本 ├── benchmark_utils.py # 工具函数集 ├── benchmark.py # 执行静态、动态性能评测脚本

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911）
查询服务监控信息 - AI开发平台ModelArts

service_instance_count Integer 服务实例数量。 req_count_per_min Long 服务分钟调用量，这里指当前时间上一分钟的服务调用总量。表5 Monitor 参数参数类型描述 failed_times Integer 模型实例调用失败次数，在线服务字段。

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
删除资源池 - AI开发平台ModelArts

系统自动生成的pool名称，相当于poolId。 creationTimestamp String 时间戳，例如"2021-11-01T03:49:41Z"。 deletionTimestamp String 时间戳，例如"2021-11-01T03:49:41Z"。 labels PoolMetaLabels

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
使用DCGM监控Lite Server资源 - AI开发平台ModelArts

rics-included.csv，指标采集对象详见dcgm-exporter。如果采集对象不能满足要求，可通过定制镜像或挂载的方式使用自定义配置。等待约1分钟，执行下面的命令获取GPU指标： curl localhost:9400/metrics 指标获取结果如下： # HELP

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源管理 > 监控Lite Server资源
Yaml配置文件参数配置说明 - AI开发平台ModelArts

rm/dpo:dpo_en_demo 多模态数据集(图像)：mllm_demo,identity 【可选】注册在dataset_info.json文件数据集名称。如选用定义数据请参考准备数据（可选）配置dataset_info.json文件，并将数据集存放于dataset_info.json同目录下。 dataset_dir

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.910） > 训练脚本说明
在Lite Cluster资源池上使用Snt9B完成推理任务 - AI开发平台ModelArts

python test.py 图2 部署在线服务在XShell中新建一个终端，参考步骤5~7进入容器，该容器为客户端。执行以下命令验证自定义镜像的三个API接口功能。当显示如图所示时，即可调用服务成功。 curl -X POST -H "Content-Type: application/json"

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源使用
Yaml配置文件参数配置说明 - AI开发平台ModelArts

rm/dpo:dpo_en_demo 多模态数据集(图像)：mllm_demo,identity 【可选】注册在dataset_info.json文件数据集名称。如选用定义数据请参考准备数据（可选）配置dataset_info.json文件，并将数据集存放于dataset_info.json同目录下。 dataset_dir

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.909） > 训练脚本说明
Yaml配置文件参数配置说明 - AI开发平台ModelArts

rm/dpo:dpo_en_demo 多模态数据集(图像)：mllm_demo,identity 【可选】注册在dataset_info.json文件数据集名称。如选用定义数据请参考准备数据（可选）配置dataset_info.json文件，并将数据集存放于dataset_info.json同目录下。 dataset_dir

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.911） > 训练脚本说明
管理AI Gallery数据集 - AI开发平台ModelArts

选择数据集额外支持的运行平台。设置运行平台后，当资产上架后，该资产支持通过订阅的方式同步到所选运行平台使用。设置运行平台后，单击“设置”，在弹窗中可以自定义设置运行平台的资产标签，且标签可以被一起同步至运行平台。数据集描述 - 资产的README内容，支持添加资产的简介、使用场景、使用方法等信息。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery数据集
批量更新团队标注样本的标签 - AI开发平台ModelArts

文本内容为“截止到2018年底，本公司人员规模已经超过100”，则其中时间“2018年底”的start_index为3，end_index为9。 @modelarts:end_time 否 String 语音起止点标签专用内置属性：语音的结束时间，格式“hh:mm:ss.SSS”(其中hh表示小时

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
API概览 - AI开发平台ModelArts
API概览 - AI开发平台ModelArts

删除指定Notebook资源的标签，支持批量删除。镜像管理查询支持的镜像列表根据指定条件分页查询满足条件的所有镜像。注册自定义镜像将用户自定义的镜像注册到ModelArts镜像管理。查询用户镜像组列表查询用户镜像信息概览，以镜像名称作为聚合的信息。查询镜像详情查询镜像详情。

帮助中心 > AI开发平台ModelArts > API参考
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

模型对应的软件包和依赖包获取地址代码包名称代码说明下载地址 AscendCloud-6.3.912-xxx.zip 说明：软件包名称中的xxx表示时间戳。包含了本教程中使用到的模型训练代码、推理部署代码和推理评测代码。代码包具体说明请参见模型软件包结构说明。 AscendFactory

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.912） > 准备工作
W8A8量化 - AI开发平台ModelArts
W8A8量化 - AI开发平台ModelArts

torch_dtype=torch.bfloat16, trust_remote_code=True, ) 3）为减少量化时间，建议将以下参数设置为512； NUM_CALIBRATION_SAMPLES = 512 执行权重量化： python deepseek_moe_w8a8_int8

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用 > 量化
使用CodeLab免费体验Notebook - AI开发平台ModelArts

昇腾卡进行训练，也支持切换规格。自启动后，免费规格默认可使用1小时，请注意右上角的剩余时长。超过1小时后，可执行续期操作，且系统每隔一段时间，将提醒确认下续期。免费的CodeLab主要用于体验，72小时内未使用，将释放资源。保存在其中的代码文档将丢失，请注意备份文件以及使用时长。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试
推理场景介绍 - AI开发平台ModelArts

软件配套版本和获取地址软件名称说明下载地址 AscendCloud-6.3.911-xxx.zip 说明：软件包名称中的xxx表示时间戳。包含了本教程中使用到的推理部署代码和推理评测代码、推理依赖的算子包。代码包具体说明请参见模型软件包结构说明。获取路径：Suppor

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911）
分析ModelArts数据集中的数据特征 - AI开发平台ModelArts

确定”启动分析。 “版本选择”，即选择当前数据集的已发布版本。图1 启动数据特征分析任务数据特征分析任务启动后，需执行一段时间，根据数据量不同等待时间不同，请耐心等待。当您选择分析的版本出现在“版本选择”列表下，且可选择时，即表示分析已完成。查看数据特征分析结果。 “版本选

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理
昇腾云服务6.3.907版本说明 - AI开发平台ModelArts

matmul、swiglu、rope等算子性能提升，支持vllm推理场景支持random随机数算子，优化FFN算子，满足AIGC等场景支持自定义交叉熵融合算子，满足BMTrain框架训练性能要求优化PageAttention算子，满足vllm投机推理场景支持CopyBlocks算子，满足vllm框架beam

帮助中心 > AI开发平台ModelArts > 服务公告 > 产品发布说明
Function Calling介绍 - AI开发平台ModelArts

Calling使用场景说明使用场景说明增强能力大模型通过Function Calling可以调用外部工具或服务，例如实时数据检索、文件处理、数据库查询等，从而扩展其能力。实时数据访问由于大模型通常基于静态数据集训练，不具备实时信息。Function Calling允许模型访问最新的数据，提供更准确、更及时的回答。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio） > 通过Function Calling扩展大语言模型交互能力
开发用于预置框架训练的代码 - AI开发平台ModelArts

的训练输出路径，请保证您设置的桶路径有写入权限和读取权限。在ModelArts中，训练代码需包含以下步骤：（可选）引入依赖当您使用自定义脚本创建算法的时候，如果您的模型引用了其他依赖，您需要在“算法管理 > 创建算法”的“代码目录”下放置相应的文件或安装包。安装pytho

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 准备模型训练代码
管理ModelArts服务的委托授权 - AI开发平台ModelArts

project_id为用户的项目ID。 “X-auth-Token”是上一步获取到的Token值。 “agency_name_suffix”是自定义的委托名称后缀。返回状态码“200 OK”表示委托“ma_agency_iam-user01”创建成功，响应Body如下所示： {

帮助中心 > AI开发平台ModelArts > API参考 > 应用示例

总条数： 1270

上一页
1
...
59
60
61
...
64
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

推理性能测试 - AI开发平台ModelArts

查询服务监控信息 - AI开发平台ModelArts

删除资源池 - AI开发平台ModelArts

使用DCGM监控Lite Server资源 - AI开发平台ModelArts

Yaml配置文件参数配置说明 - AI开发平台ModelArts

在Lite Cluster资源池上使用Snt9B完成推理任务 - AI开发平台ModelArts

Yaml配置文件参数配置说明 - AI开发平台ModelArts

Yaml配置文件参数配置说明 - AI开发平台ModelArts

管理AI Gallery数据集 - AI开发平台ModelArts

批量更新团队标注样本的标签 - AI开发平台ModelArts

API概览 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

W8A8量化 - AI开发平台ModelArts

使用CodeLab免费体验Notebook - AI开发平台ModelArts

推理场景介绍 - AI开发平台ModelArts

分析ModelArts数据集中的数据特征 - AI开发平台ModelArts

昇腾云服务6.3.907版本说明 - AI开发平台ModelArts

Function Calling介绍 - AI开发平台ModelArts

开发用于预置框架训练的代码 - AI开发平台ModelArts

管理ModelArts服务的委托授权 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线