搜索_华为云

启动推理服务 - AI开发平台ModelArts

控制要考虑的前几个tokens的数量的整数。设置为-1表示考虑所有tokens。适当降低该值可以减少采样时间。 top_p 否 1.0 Float 控制要考虑的前几个tokens的累积概率的浮点数。必须在 (0，1] 范围内。设置为1表示考虑所有tokens。 temperature

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理服务部署
不同机型的对应的软件配套版本 - AI开发平台ModelArts

23（v1.23.5-r0及以上版本）|v1.25|v1.28（推荐）集群规模：50|200|1000|2000 集群网络模式：容器隧道网络|VPC 集群转发模式：iptables|ipvs huawei-npu npu-driver volcano 插件版本匹配关系请见表3。 RoCE

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster使用前必读
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

export USE_VOCAB_PARALLEL=1 # 是否使用词表并行；默认值为1表示开启并行，取值为0表示关闭并行。对于词表较小的模型（如llama2系模型），关闭并行可以减少推理时延，对于词表较大的模型（如qwen系模型），开启并行可以减少显存占用，以提升推理吞吐量。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906）
训练精度测试 - AI开发平台ModelArts

5-7b-sft-4096-lora-313T-20241028_164746-0.txt qwen2.5-7b-sft-4096-lora-313T-20241028_164746-npu_info-0.txt 执行精度比较脚本进入test-benchmark目录执行命令: benchmark-cli

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.910） > 训练benchmark工具
训练精度测试 - AI开发平台ModelArts

5-7b-sft-4096-lora-313T-20241028_164746-0.txt qwen2.5-7b-sft-4096-lora-313T-20241028_164746-npu_info-0.txt 执行精度比较脚本进入test-benchmark目录执行命令: benchmark-cli

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.911） > 训练benchmark工具
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

配置NPU环境时增加需要开启的高阶配置参数。词表切分在分布式场景下，默认不使用词表切分能提升推理性能，同时也会增加单卡的显存占用。不建议开启词表并行，如确需使用词表切分，配置以下环境变量。 export USE_VOCAB_PARALLEL=1 关闭词表切分的命令： unset USE_VOCAB_PARALLEL

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905）
昇腾云服务6.3.907版本说明 - AI开发平台ModelArts

0-cann_8.0.rc2-py_3.9-hce_2.0.2312-aarch64-snt9b-20240727152329-0f2c29a 镜像发布到SWR，从SWR拉取固件驱动：23.0.6 CANN：cann_8.0.rc2 容器镜像OS：hce_2.0 PyTorch：pytorch_2

帮助中心 > AI开发平台ModelArts > 服务公告 > 产品发布说明
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

export USE_VOCAB_PARALLEL=1 # 是否使用词表并行；默认值为1表示开启并行，取值为0表示关闭并行。对于词表较小的模型（如llama2系模型），关闭并行可以减少推理时延，对于词表较大的模型（如qwen系模型），开启并行可以减少显存占用，以提升推理吞吐量。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907）
标注物体检测数据 - AI开发平台ModelArts

物体检测标注，需要保证目标框内物体的完整性；针对图片中存在多个物体的情形，做到不重标、不漏标。项目创建完成后，将会自动跳转至新版自动学习页面，并开始运行，当数据标注节点的状态变为“等待操作”时，需要手动进行确认数据集中的数据标注情况，也可以对数据集中的数据进行标签的修改，数据的增加或删减。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用自动学习实现物体检测
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

conversations：包含一系列对话对象，每个对象都由发言者(from)和发言内容(value)组成。 from：表示对话的角色，可以是"human"（人类）或"gpt"（机器），表示是谁说的这句话。 value：具体的对话内容。 system：系统提示词，用来为整个对话设定场景或提供指导原则。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.912） > 准备工作
MoXing Framework功能介绍 - AI开发平台ModelArts

提供的MoXing Framework功能中主要包含操作OBS组件，即下文中描述的mox.file接口。 Moxing主要使用场景为提升从OBS读取和下载数据的易用性，适配对象为OBS对象桶，对于OBS并行文件系统部分接口可能存在问题，不建议使用。生产业务代码开发建议直接调用OBS

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 在Notebook中使用Moxing命令
在ModelArts自动学习中，如何进行增量训练？ - AI开发平台ModelArts

如果您增删标签，建议对所有的图片进行排查和重新标注。对已标注的数据，也需要检查是否需要增加新的标签。在图片都标注完成后，单击右上角“开始训练”，在“训练设置”中，在“增量训练版本”中选择之前已完成的训练版本，在此版本基础上进行增量训练。其他参数请根据界面提示填写。设置完成

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard自动学习
多模态 - AI开发平台ModelArts
多模态 - AI开发平台ModelArts

控制要考虑的前几个tokens的累积概率的浮点数。必须在 (0，1] 范围内。设置为1表示考虑所有tokens。 temperature 否 1.0 Float 控制采样的随机性的浮点数。较低的值使模型更加确定性，较高的值使模型更加随机。0表示贪婪采样。 stream 否 False Bool

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用
昇腾云服务6.3.905版本说明 - AI开发平台ModelArts

0-cann_8.0.rc2-py_3.9-hce_2.0.2312-aarch64-snt9b-20240528150158-b521cc0 镜像发布到SWR，从SWR拉取固件驱动：23.0.5 CANN：cann_8.0.rc2 容器镜像OS：hce_2.0 PyTorch：pytorch_2

帮助中心 > AI开发平台ModelArts > 服务公告 > 产品发布说明
推理精度测试 - AI开发平台ModelArts

参考模型llama3系列模型，数据集mmlu为例，配置如下：表1 参数配置模型 max_seq_len batch_size shot数 llama3_8b 3200 8 采用默认值 llama3_70b 3200 4 [0, 1, 2] (可选) opencompass也支持通过

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.907）
推理精度测试 - AI开发平台ModelArts

参考模型llama3系列模型，数据集 mmlu 为例，配置如下：表1 参数配置模型 max_seq_len batch_size shot数 llama3_8b 3200 8 采用默认值 llama3_70b 3200 4 [0, 1, 2] (可选) opencompass也支持通过

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907）
msprobe梯度监控 - AI开发平台ModelArts

"bounds": [-1, 0, 1] } } task参数需指定为grad_probe，dump_path表示输出目录，需手工指定，默认输出到dump_path目录。参数grad_level可取值L0、L1、L2，级别越大导出的数据越详细。更多详细参数说明请参考参数说明。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > msprobe工具使用指导
迁移评估 - AI开发平台ModelArts
迁移评估 - AI开发平台ModelArts

际的项目需要迁移，建议填写下方的推理业务迁移评估表，并将该调研表提供给华为云技术支持人员进行迁移评估，以确保迁移项目能顺利实施。通用的推理业务及LLM推理可提供下表进行业务迁移评估：表1 通用的推理业务及LLM推理业务迁移评估表收集项说明实际情况（请填写）项目名称项目名称，例如：XXX项目。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
使用SDK调测多机分布式训练作业 - AI开发平台ModelArts

里指定’local’即为本地训练。 train_instance_count：必选参数，训练使用的worker个数，分布式调测时为2，训练开始时SDK还会再创建一个Notebook，与当前的Notebook组成一个2节点的分布式调试环境。 script_interpreter：可

 帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业 > 训练作业调测
创建Workflow数据集节点 - AI开发平台ModelArts

数据集格式，默认为0，表示文件类型。否 0：文件类型 1：表格类型 data_type 数据类型，默认为FREE_FORMAT。否 DataTypeEnum description 描述信息。否 str import_data 是否要导入数据，当前只支持表格数据，默认为False。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 创建Workflow节点

总条数： 1236

上一页
1
...
55
56
57
...
62
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

启动推理服务 - AI开发平台ModelArts

不同机型的对应的软件配套版本 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

训练精度测试 - AI开发平台ModelArts

训练精度测试 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

昇腾云服务6.3.907版本说明 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

标注物体检测数据 - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

MoXing Framework功能介绍 - AI开发平台ModelArts

在ModelArts自动学习中，如何进行增量训练？ - AI开发平台ModelArts

多模态 - AI开发平台ModelArts

昇腾云服务6.3.905版本说明 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

msprobe梯度监控 - AI开发平台ModelArts

迁移评估 - AI开发平台ModelArts

使用SDK调测多机分布式训练作业 - AI开发平台ModelArts

创建Workflow数据集节点 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线