搜索_华为云

推理精度测试 - AI开发平台ModelArts

service_url：成功部署推理服务后的服务预测地址，示例：http://${docker_ip}:8080/generate。此处的${docker_ip}替换为宿主机实际的IP地址，端口号8080来自前面配置的服务端口。 few_shot：开启少量样本测试后添加示例样本的个数。默认为3，取值范围为0~5整数。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.904）
使用Msprobe工具分析偏差 - AI开发平台ModelArts

__mul__.2在forward计算阶段的第一个input存在偏差。追溯代码实现是下图中noise变量使用torch.rand_like ()作noise变量的初始化 (下图第730行)。由于torch.rand_like()该函数会根据输入的input构造同样size、dtype

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > Dit模型PyTorch迁移与精度性能调优 > 精度对齐
创建ModelArts数据校验任务 - AI开发平台ModelArts

} ] } 数据输出的data文件夹中存放的是修改、更新过的图片，对于数据处理过程中没有修改过的图片，在data文件夹中不会展示，图片的位置信息显示该图片在输入目录中。 output.manifest存放的是数据处理之后的图片信息（主要是指图片的位置和标注信息等），可以直接使用这个output

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 处理ModelArts数据集中的数据
创建ModelArts数据选择任务 - AI开发平台ModelArts

写正确的OBS路径。图2 输入输出设置-数据集图3 输入输出设置-OBS目录确认参数填写无误后，单击“创建”，完成数据处理任务的创建。数据去重算子（SimDeduplication算子）可以依据用户设置的相似程度阈值完成图像去重处理。图像去重是图像数据处理常见的数据处理

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 处理ModelArts数据集中的数据
克隆GitHub开源仓库文件到JupyterLab - AI开发平台ModelArts

在Notebook的JupyterLab中，支持从GitHub开源仓库Clone文件。通过JupyterLab打开一个运行中的Notebook。单击JupyterLab窗口上方导航栏的ModelArts Upload Files按钮，打开文件上传窗口，选择左侧的进入GitHub开源仓库Clone界面。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过JupyterLab在线使用Notebook实例进行AI开发 > 上传文件至JupyterLab
在ModelArts的Notebook中如何使用pandas库处理OBS桶中的数据？ - AI开发平台ModelArts

在ModelArts的Notebook中如何使用pandas库处理OBS桶中的数据？参考下载OBS文件到Notebook中的指导，将OBS中的数据下载至Notebook本地处理。参考pandas用户指南处理pandas数据。父主题： Standard Notebook

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
部署推理服务 - AI开发平台ModelArts

开启图模式后，服务第一次响应请求时会有一个较长时间的图编译过程，并且会在当前目录下生成.torchair_cache文件夹来保存图编译的缓存文件。当服务第二次启动时，可通过缓存文件来快速完成图编译的过程，避免长时间的等待，并且基于图编译缓存文件来启动服务可获得更优的推理性能，

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911）
创建DevServer - AI开发平台ModelArts

strings 允许通过SSH协议访问Notebook的公网IP地址白名单列表，默认都可以访问。当配置指定IP后，则仅允许IP所在的客户端实现对Notebook的访问。 dev_service String 访问Notebook的途径，枚举值如下： NOTEBOOK：可以通过https协议访问Notebook。

帮助中心 > AI开发平台ModelArts > API参考 > DevServer管理
推理服务精度评测 - AI开发平台ModelArts

enable_lora=True表示开启multi-lora的精度验证。如果不开启multi-lora的精度验证，不体现enable_lora参数即可。 lora_local_path=${lora_local_path}是挂载适配器对应路径，取值和multi-lora特性使用说明中的参数lora1=/path/

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.5.901）
推理服务精度评测 - AI开发平台ModelArts

enable_lora=True表示开启multi-lora的精度验证。如果不开启multi-lora的精度验证，不体现enable_lora参数即可。 lora_local_path=${lora_local_path}是挂载适配器对应路径，取值和multi-lora特性使用说明中的参数lora1=/path/

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912）
部署模型为在线服务 - AI开发平台ModelArts

使用所选规格部署服务时，会产生必要的系统消耗，因此服务实际占用的资源会略大于该规格。 “实例数” 设置当前版本模型的实例个数。如果实例数设置为1，表示后台的计算模式是单机模式；如果实例数设置大于1，表示后台的计算模式为分布式的。请根据实际编码情况选择计算模式。 “环境变量” 设置环境变

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业
通过智能标注方式标注数据 - AI开发平台ModelArts

通过智能标注方式标注数据创建智能标注作业确认智能标注作业的数据难例使用自动分组智能标注作业父主题：标注ModelArts数据集中的数据

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 标注ModelArts数据集中的数据
数据处理场景介绍 - AI开发平台ModelArts

东-上海一、华南-广州。 ModelArts平台提供的数据处理功能，基本目的是从大量的、杂乱无章的、难以理解的数据中抽取或者生成对某些特定的人们来说是有价值、有意义的数据。当数据采集和接入之后，数据一般是不能直接满足训练要求的。为了保障数据质量，以免对后续操作（如数据标注、模型训

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 处理ModelArts数据集中的数据
ModelArts CLI命令功能介绍 - AI开发平台ModelArts

yaml配置文件； -P表示鉴权文件中的某一组鉴权信息，默认是DEFAULT； -D表示是否开启debug模式（默认关闭），当开启debug模式后，命令的报错堆栈信息将会打印出来，否则只会打印报错信息； -h表示显示命令的帮助提示信息。命令说明表1 ma-cli支持的命令命令命令详情 configure

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > ModelArts CLI命令参考
推理性能测试 - AI开发平台ModelArts

静态性能测试：评估在固定输入、固定输出和固定并发下，模型的吞吐与首token延迟。该方式实现简单，能比较清楚的看出模型的性能和输入输出长度、以及并发的关系。动态性能测试：评估在请求并发在一定范围内波动，且输入输出长度也在一定范围内变化时，模型的延迟和吞吐。该场景能模拟实际业务下动态的发送不同长度请求，能评估推理框架在实际业务中能支持的并发数。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911）
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

设置动态分档位后，在PTA模式下不支持接收超过最大档的并发请求，超过后会导致推理服务终止。请将最大档（PTA_TORCHAIR_DECODE_GEAR_LIST参数的中设置的最大值）与模型启动时的max-num-seqs保持一致来进行规避。在MoE模型和小模型上推荐使用图模式部署，包括mi

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910）
推理性能测试 - AI开发平台ModelArts

静态性能测试：评估在固定输入、固定输出和固定并发下，模型的吞吐与首token延迟。该方式实现简单，能比较清楚的看出模型的性能和输入输出长度、以及并发的关系。动态性能测试：评估在请求并发在一定范围内波动，且输入输出长度也在一定范围内变化时，模型的延迟和吞吐。该场景能模拟实际业务下动态的发送不同长度请求，能评估推理框架在实际业务中能支持的并发数。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910）
推理精度测试 - AI开发平台ModelArts

表示ModelArts Standard模式。 vllm_model：对应Step4 部署并启动推理服务中的模型地址参数model，模型格式是Huggingface的目录格式。 deploy_method：部署方法，不同的部署方式api参数输入、输出解析方式不同，目前支持tgi、

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905）
查询数据集的标注任务列表 - AI开发平台ModelArts

查询数据集的标注任务列表查询当前数据集的所有标注任务列表。 dataset.get_label_tasks(is_workforce_task=False, **kwargs) 示例代码示例一：查询数据集下所有的标注任务，根据标注任务创建时间降序排序。 from modelarts

帮助中心 > AI开发平台ModelArts > SDK参考 > 数据管理 > 标注任务管理
如何将本地标注的数据导入ModelArts？ - AI开发平台ModelArts

如何将本地标注的数据导入ModelArts？ ModelArts支持通过导入数据集的操作，导入更多数据。本地标注的数据，当前支持从OBS目录导入或从Manifest文件导入两种方式。导入之后您还可以在ModelArts数据管理模块中对数据进行重新标注或修改标注情况。从OBS目录

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard数据准备

总条数： 1631

上一页
1
...
8
9
10
...
82
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

推理精度测试 - AI开发平台ModelArts

使用Msprobe工具分析偏差 - AI开发平台ModelArts

创建ModelArts数据校验任务 - AI开发平台ModelArts

创建ModelArts数据选择任务 - AI开发平台ModelArts

克隆GitHub开源仓库文件到JupyterLab - AI开发平台ModelArts

在ModelArts的Notebook中如何使用pandas库处理OBS桶中的数据？ - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

创建DevServer - AI开发平台ModelArts

推理服务精度评测 - AI开发平台ModelArts

推理服务精度评测 - AI开发平台ModelArts

部署模型为在线服务 - AI开发平台ModelArts

通过智能标注方式标注数据 - AI开发平台ModelArts

数据处理场景介绍 - AI开发平台ModelArts

ModelArts CLI命令功能介绍 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

查询数据集的标注任务列表 - AI开发平台ModelArts

如何将本地标注的数据导入ModelArts？ - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线