搜索_华为云

语言模型推理性能测试 - AI开发平台ModelArts

针对openai的/v1/completions以及/v1/chat/completions两个非流式接口，请求体中可以添加可选参数"return_latency"，默认为false，若指定该参数为true，则会在相应请求的返回体中返回字段"latency"，返回内容如下： pre

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.910） > 推理性能测试
语言模型推理性能测试 - AI开发平台ModelArts

针对openai的/v1/completions以及/v1/chat/completions两个非流式接口，请求体中可以添加可选参数"return_latency"，默认为false，如果指定该参数为true，则会在相应请求的返回体中返回字段"latency"，返回内容如下： pr

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911） > 推理性能测试
语言模型推理性能测试 - AI开发平台ModelArts

针对openai的/v1/completions以及/v1/chat/completions两个非流式接口，请求体中可以添加可选参数"return_latency"，默认为false，如果指定该参数为true，则会在相应请求的返回体中返回字段"latency"，返回内容如下： pr

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理服务性能评测
创建ModelArts数据增强任务 - AI开发平台ModelArts

在“数据处理”页面，单击“创建”进入“创建数据处理”页面。在创建数据处理页面，填写相关算法参数。填写基本信息。基本信息包括“名称”、“版本”和“描述”。其中“版本”信息由系统自动生成，按“V0001”、“V0002”规则命名，用户无法修改。您可以根据实际情况填写“名称”和“描述”信息。设置场景类别。场景类别当前支持“图像分类”和“物体检测”。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 处理ModelArts数据集中的数据
Notebook时长续约 - AI开发平台ModelArts

实例创建的时间，UTC毫秒。 duration Long 实例运行时长，以创建时间为起点计算，即“创建时间+duration > 当前时刻”时，系统会自动停止实例。 enable Boolean 是否启用自动停止功能。 type String 自动停止类别。 timing：自动停止。 idle：空闲停止。

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
责任共担 - AI开发平台ModelArts
责任共担 - AI开发平台ModelArts

华为云租户的安全责任在于对使用的IaaS、PaaS和SaaS类各项云服务内部的安全以及对租户定制配置进行安全有效的管理，包括但不限于虚拟网络、虚拟主机和访客虚拟机的操作系统，虚拟防火墙、API网关和高级安全服务，各项云服务，租户数据，以及身份账号和密钥管理等方面的安全配置。《华为云安全白皮书》详细介绍华为云

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
人工标注图片数据 - AI开发平台ModelArts

多边形标注，根据目标物体的轮廓绘制多边形。极点标注，在目标物体轮廓的最上、最左、最下、最右的位置分别标注四个极点，极点要在物体的轮廓上。系统将根据标注的极点推理出物体的轮廓。对于背景比较复杂的图片，极点标注效果不佳，推荐使用多边形标注。极点标注功能仅支持北京一与北京四区域。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 标注ModelArts数据集中的数据 > 通过人工标注方式标注数据
增量模型训练 - AI开发平台ModelArts

到的内容。增量训练通过保留旧知识的同时学习新知识来避免这个问题。增量训练在很多领域都有应用，比如自然语言处理、计算机视觉和推荐系统等。它使得AI系统能够更加灵活和适应性强，更好地应对现实世界中不断变化的数据环境。 ModelArts Standard中如何实现增量训练增量训练是通过Checkpoint机制实现。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型
在ECS上构建自定义镜像并在Notebook中使用 - AI开发平台ModelArts

基于昇腾、Dockerhub官网等官方开源的镜像制作，开源镜像需要满足如下操作系统约束： x86：Ubuntu18.04、Ubuntu20.04 ARM：Euler2.8.3、Euler2.10.7 Ubuntu20.04.6可能有兼容性问题，请优先使用低于该版本的操作系统。不满足以上镜像规范，所制作的镜像使用可

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于创建Notebook
续费概述 - AI开发平台ModelArts
续费概述 - AI开发平台ModelArts

在专属资源池到期前均可开通自动续费，到期前7日凌晨3:00首次尝试自动续费，如果扣款失败，每天凌晨3:00尝试一次，直至专属资源池到期或者续费成功。到期前7日自动续费扣款是系统默认配置，您也可以根据需要修改此扣款日。父主题：续费

 帮助中心 > AI开发平台ModelArts > 计费说明 > 续费
镜像方案说明 - AI开发平台ModelArts

在华为公有云平台申请的资源一般默认连通网络，如未连通网络或无法git clone下载代码时用户则需要找到已连通网络的机器（本章节以Linux系统机器为例）将下载完成的源码放置代码目录：AscendFactory/third-party下，命令如下： # 三方开源源码 git clone

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.912） > 准备工作 > 准备镜像
从AI Gallery订阅模型 - AI开发平台ModelArts

由于商用模型支持同时购买多种配额模式的资产，所以仅部署商用模型时需要进行配额选择。免费模型仅一种配额模式无需选择。图2 修改配额如果您选择部署的非商业模型，系统自动跳转至“部署”页面。在部署页面中，无需再选择模型及其版本，参考部署模型的操作指导完成其他参数填写，即可部署为您需要的服务。父主题：

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型
使用AI Gallery微调大师训练模型 - AI开发平台ModelArts

使用AI Gallery微调大师训练模型 AI Gallery支持将模型进行微调，训练后得到更优模型。场景描述模型微调是深度学习中的一种重要技术，它是指在预训练好的模型基础上，通过调整部分参数，使其在特定任务上达到更好的性能。在实际应用中，预训练模型是在大规模通用数据集上训

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版）
管理标注作业 - AI开发平台ModelArts

单击作业操作列的“更多>复制”。在标注任务复制的弹窗中，填写作业描述，作业名称task-xxxx-copy-xxxx，其中xxxx为系统生成的随机码，用来区分新作业与被复制作业。也可以修改新生成的作业名称。单击“确定”。复制完成后，在标注作业列表页即可查询新的标注任务，复

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 标注ModelArts数据集中的数据
欠费说明 - AI开发平台ModelArts
欠费说明 - AI开发平台ModelArts

的数据，以免继续扣费。您可以在“费用中心 > 总览”页面设置“可用额度预警”功能，当可用额度、通用代金券和现金券的总额度低于预警阈值时，系统自动发送短信和邮件提醒。当产生欠费后，请您及时充值使可用额度大于0。

帮助中心 > AI开发平台ModelArts > 计费说明
查询用户镜像组列表 - AI开发平台ModelArts

String 镜像所属组织,可以在SWR控制台“组织管理”创建和查看。 type 否 String 镜像类型。枚举值如下： BUILD_IN：系统内置镜像。 DEDICATED：用户保存的镜像。 workspace_id 否 String 工作空间ID。获取方法请参见查询工作空间列表

 帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
端到端运维ModelArts Standard推理服务方案 - AI开发平台ModelArts

然后可在云监控服务（CES）中获得ModelArts推理在线服务的监控数据，最后可配置告警规则实现实时告警通知。业务运行阶段，先将业务系统对接在线服务请求，然后进行业务逻辑处理和监控设置。图1 推理服务的端到端运维流程图整个运维过程会对服务请求失败和资源占用过高的场景进行监控，当超过阈值时发送告警通知。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
在JupyterLab中创建定时任务 - AI开发平台ModelArts

hon变量。 Schedule：任务执行策略，可以立即运行；也可以设置定时策略运行，支持cron表达式。 cron表达式需要使用linux系统下支持的格式，其他的cron表达式会报错。表达式可能会包含问号，要兼容linux的cron表达式，需将“?”替换为“*”。设置定时任务后

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过JupyterLab在线使用Notebook实例进行AI开发
查询支持的镜像列表 - AI开发平台ModelArts

sort_key 否 String 排序的字段，多个字段使用(“,”)逗号分割。 type 否 String 镜像类型。枚举值如下： BUILD_IN：系统内置镜像。 DEDICATED：用户保存的镜像。 workspace_id 否 String 工作空间ID。获取方法请参见查询工作空间列表

 帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
查看ModelArts模型详情 - AI开发平台ModelArts

为“执行命令检查”时显示）、健康检查周期、延迟时间、超时时间、最大失败次数。模型说明显示创建模型时添加的模型说明文档信息。系统运行架构显示系统运行架构。推理加速卡类型显示推理加速卡类型。表4 模型页签详情参数说明模型精度显示该模型的模型召回率、精准率、准确率和F1值。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理ModelArts模型

总条数： 1086

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

语言模型推理性能测试 - AI开发平台ModelArts

语言模型推理性能测试 - AI开发平台ModelArts

语言模型推理性能测试 - AI开发平台ModelArts

创建ModelArts数据增强任务 - AI开发平台ModelArts

Notebook时长续约 - AI开发平台ModelArts

责任共担 - AI开发平台ModelArts

人工标注图片数据 - AI开发平台ModelArts

增量模型训练 - AI开发平台ModelArts

在ECS上构建自定义镜像并在Notebook中使用 - AI开发平台ModelArts

续费概述 - AI开发平台ModelArts

镜像方案说明 - AI开发平台ModelArts

从AI Gallery订阅模型 - AI开发平台ModelArts

使用AI Gallery微调大师训练模型 - AI开发平台ModelArts

管理标注作业 - AI开发平台ModelArts

欠费说明 - AI开发平台ModelArts

查询用户镜像组列表 - AI开发平台ModelArts

端到端运维ModelArts Standard推理服务方案 - AI开发平台ModelArts

在JupyterLab中创建定时任务 - AI开发平台ModelArts

查询支持的镜像列表 - AI开发平台ModelArts

查看ModelArts模型详情 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线