搜索_华为云

昇腾云服务6.3.906版本说明 - AI开发平台ModelArts

matmul、swiglu、rope等算子性能提升，支持vllm推理场景新增random随机数算子，优化FFN算子，满足AIGC等场景新增自定义交叉熵融合算子，满足BMTrain框架训练性能要求优化PageAttention算子，满足vllm投机推理场景新增CopyBlocks算子，满足vllm框架beam

帮助中心 > AI开发平台ModelArts > 服务公告 > 产品发布说明
删除资源池 - AI开发平台ModelArts

系统自动生成的pool名称，相当于poolId。 creationTimestamp String 时间戳，例如"2021-11-01T03:49:41Z"。 deletionTimestamp String 时间戳，例如"2021-11-01T03:49:41Z"。 labels PoolMetaLabels

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
查询模型详情 - AI开发平台ModelArts

tenant String 租户。 project String 项目。 owner String 用户。 create_at Long 模型创建时间，距'1970.1.1 0:0:0 UTC'的毫秒数。 source_location String 模型所在的OBS路径。 source_job_id

帮助中心 > AI开发平台ModelArts > SDK参考 > 模型管理
查询服务对象列表 - AI开发平台ModelArts

project String 服务归属项目。 owner String 服务归属用户。 publish_at Number 服务最新的发布时间，距'1970.1.1 0:0:0 UTC'的毫秒数。 infer_type String 推理方式，取值为：real-time/batch/edge。

帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
训练精度测试 - AI开发平台ModelArts

任务完成之后会在test-benchmark目录下生成excel表格：精度结果 LLaMAFactory_train_accuracy_benchmark_<版本号>_<时间戳>.xlsx 样例截图：父主题：训练benchmark工具

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.912） > 训练benchmark工具
推理性能测试 - AI开发平台ModelArts

评测静态性能脚本 ├── benchmark_serving.py # 评测动态性能脚本 ├── generate_dataset.py # 生成自定义数据集的脚本 ├── benchmark_utils.py # 工具函数集 ├── benchmark.py # 执行静态、动态性能评测脚本

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909）
推理性能测试 - AI开发平台ModelArts

评测静态性能脚本 ├── benchmark_serving.py # 评测动态性能脚本 ├── generate_dataset.py # 生成自定义数据集的脚本 ├── benchmark_utils.py # 工具函数集 ├── benchmark.py # 执行静态、动态性能评测脚本

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910）
推理性能测试 - AI开发平台ModelArts

评测静态性能脚本 ├── benchmark_serving.py # 评测动态性能脚本 ├── generate_dataset.py # 生成自定义数据集的脚本 ├── benchmark_utils.py # 工具函数集 ├── benchmark.py # 执行静态、动态性能评测脚本

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911）
查询服务监控信息 - AI开发平台ModelArts

service_instance_count Integer 服务实例数量。 req_count_per_min Long 服务分钟调用量，这里指当前时间上一分钟的服务调用总量。表5 Monitor 参数参数类型描述 failed_times Integer 模型实例调用失败次数，在线服务字段。

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
在Lite Cluster资源池上使用Snt9B完成推理任务 - AI开发平台ModelArts

python test.py 图2 部署在线服务在XShell中新建一个终端，参考步骤5~7进入容器，该容器为客户端。执行以下命令验证自定义镜像的三个API接口功能。当显示如图所示时，即可调用服务成功。 curl -X POST -H "Content-Type: application/json"

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源使用
批量更新团队标注样本的标签 - AI开发平台ModelArts

文本内容为“截止到2018年底，本公司人员规模已经超过100”，则其中时间“2018年底”的start_index为3，end_index为9。 @modelarts:end_time 否 String 语音起止点标签专用内置属性：语音的结束时间，格式“hh:mm:ss.SSS”(其中hh表示小时

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
Yaml配置文件参数配置说明 - AI开发平台ModelArts

rm/dpo:dpo_en_demo 多模态数据集(图像)：mllm_demo,identity 【可选】注册在dataset_info.json文件数据集名称。如选用定义数据请参考准备数据（可选）配置dataset_info.json文件，并将数据集存放于dataset_info.json同目录下。 dataset_dir

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.911） > 训练脚本说明
Yaml配置文件参数配置说明 - AI开发平台ModelArts

rm/dpo:dpo_en_demo 多模态数据集(图像)：mllm_demo,identity 【可选】注册在dataset_info.json文件数据集名称。如选用定义数据请参考准备数据（可选）配置dataset_info.json文件，并将数据集存放于dataset_info.json同目录下。 dataset_dir

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.909） > 训练脚本说明
管理AI Gallery数据集 - AI开发平台ModelArts

选择数据集额外支持的运行平台。设置运行平台后，当资产上架后，该资产支持通过订阅的方式同步到所选运行平台使用。设置运行平台后，单击“设置”，在弹窗中可以自定义设置运行平台的资产标签，且标签可以被一起同步至运行平台。数据集描述 - 资产的README内容，支持添加资产的简介、使用场景、使用方法等信息。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery数据集
使用DCGM监控Lite Server资源 - AI开发平台ModelArts

rics-included.csv，指标采集对象详见dcgm-exporter。如果采集对象不能满足要求，可通过定制镜像或挂载的方式使用自定义配置。等待约1分钟，执行下面的命令获取GPU指标： curl localhost:9400/metrics 指标获取结果如下： # HELP

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源管理 > 监控Lite Server资源
Open-Clip基于DevServer适配PyTorch NPU训练指导 - AI开发平台ModelArts

${image_name} bash 参数说明： --name ${container_name} 容器名称，进入容器时会用到，此处可以自己定义一个容器名称。 -v ${work_dir}:${container_work_dir} 代表需要在容器中挂载宿主机的目录。宿主机和容器使

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理
Yaml配置文件参数配置说明 - AI开发平台ModelArts

rm/dpo:dpo_en_demo 多模态数据集(图像)：mllm_demo,identity 【可选】注册在dataset_info.json文件数据集名称。如选用定义数据请参考准备数据（可选）配置dataset_info.json文件，并将数据集存放于dataset_info.json同目录下。 dataset_dir

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.910） > 训练脚本说明
API概览 - AI开发平台ModelArts
API概览 - AI开发平台ModelArts

删除指定Notebook资源的标签，支持批量删除。镜像管理查询支持的镜像列表根据指定条件分页查询满足条件的所有镜像。注册自定义镜像将用户自定义的镜像注册到ModelArts镜像管理。查询用户镜像组列表查询用户镜像信息概览，以镜像名称作为聚合的信息。查询镜像详情查询镜像详情。

帮助中心 > AI开发平台ModelArts > API参考
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

模型对应的软件包和依赖包获取地址代码包名称代码说明下载地址 AscendCloud-6.3.912-xxx.zip 说明：软件包名称中的xxx表示时间戳。包含了本教程中使用到的模型训练代码、推理部署代码和推理评测代码。代码包具体说明请参见模型软件包结构说明。 AscendFactory

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.912） > 准备工作
W8A8量化 - AI开发平台ModelArts
W8A8量化 - AI开发平台ModelArts

torch_dtype=torch.bfloat16, trust_remote_code=True, ) 3）为减少量化时间，建议将以下参数设置为512； NUM_CALIBRATION_SAMPLES = 512 执行权重量化： python deepseek_moe_w8a8_int8

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用 > 量化

总条数： 1255

上一页
1
...
58
59
60
...
63
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

昇腾云服务6.3.906版本说明 - AI开发平台ModelArts

删除资源池 - AI开发平台ModelArts

查询模型详情 - AI开发平台ModelArts

查询服务对象列表 - AI开发平台ModelArts

训练精度测试 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

查询服务监控信息 - AI开发平台ModelArts

在Lite Cluster资源池上使用Snt9B完成推理任务 - AI开发平台ModelArts

批量更新团队标注样本的标签 - AI开发平台ModelArts

Yaml配置文件参数配置说明 - AI开发平台ModelArts

Yaml配置文件参数配置说明 - AI开发平台ModelArts

管理AI Gallery数据集 - AI开发平台ModelArts

使用DCGM监控Lite Server资源 - AI开发平台ModelArts

Open-Clip基于DevServer适配PyTorch NPU训练指导 - AI开发平台ModelArts

Yaml配置文件参数配置说明 - AI开发平台ModelArts

API概览 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

W8A8量化 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线