搜索_华为云

Prefix Caching - AI开发平台ModelArts

在LLM推理应用中，经常会面临具有长system prompt的场景以及多轮对话的场景。长system prompt的场景，system prompt在不同的请求中但是相同的，KV Cache的计算也是相同的；多轮对话场景中，每一轮对话需要依赖所有历史轮次对话的上下文，历史轮次中的KV Cache在后续每一轮中

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用
计算规格说明 - AI开发平台ModelArts

上报就不计费，各个服务开始计费的状态如下。微调大师：“训练中” AI应用：“运行中” 在线推理服务：“运行中” 计费规则资源整点扣费，按需计费。计费的最小单位为秒，话单上报后的每一小时对用户账号进行一次扣费。如果使用过程中暂停、终止了消耗资源的AI Gallery工具链服务

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版）
将模型部署为实时推理作业 - AI开发平台ModelArts

将模型部署为实时推理作业实时推理的部署及使用流程部署模型为在线服务访问在线服务支持的认证方式访问在线服务支持的访问通道访问在线服务支持的传输协议父主题：使用ModelArts Standard部署模型并推理预测

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测
部署在线服务出现报错No CUDA runtime is found - AI开发平台ModelArts

py中添加一行代码os.system('nvcc -V)查看该镜像的cuda版本（customize_service.py编写指导请见模型推理代码编写说明）。确认该cuda版本与您安装的mmcv版本是否匹配。部署时是否需要使用GPU，取决于的模型需要用到CPU还是GPU，以及推理脚本如何编写。

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
如何查看ModelArts中正在收费的作业？ - AI开发平台ModelArts

动学习、停止因运行自动学习而创建的训练作业和部署的服务。同时，也需清理存储到OBS中的数据。 Notebook实例：运行中的Notebook实例会收费，使用完成后请及时停止Notebook实例或删除。使用EVS做存储时，需同时清理存储到EVS中的数据。 CodeLab计费：在体

 帮助中心 > AI开发平台ModelArts > 计费说明 > 计费FAQ
自动学习/Workflow计费项 - AI开发平台ModelArts

存储资源费用：数据存储到对象存储OBS的费用。表1 计费项计费项计费项说明适用的计费模式计费公式计算资源公共资源池使用计算资源的用量。具体费用可参见ModelArts价格详情。按需计费规格单价 * 计算节点个数 * 使用时长专属资源池专属资源池的费用已在购买时支付，运行

 帮助中心 > AI开发平台ModelArts > 计费说明 > 计费项
委托授权ModelArts云服务使用SFS Turbo - AI开发平台ModelArts

S Turbo的部分权限。涉及配置的自定义权限策略项如下： sfsturbo:shares:addShareNic：此策略项表示sfsturbo创建网卡的权限。 sfsturbo:shares:deleteShareNic：此策略项表示sfsturbo删除网卡的权限。 sfst

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践
Step4 测试用户权限 - AI开发平台ModelArts

ModelArts。验证OBS权限。在左上角的服务列表中，选择OBS服务，进入OBS管理控制台。在OBS管理控制台，单击右上角的“创建桶”，如果能正常打开页面，表示当前用户具备OBS的操作权限。验证SWR权限。在左上角的服务列表中，选择SWR服务，进入SWR管理控制台。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践 > 配置ModelArts基本使用权限
精度调优前准备工作 - AI开发平台ModelArts

学习率预热不同的学习率调度器（决定什么阶段用多大的学习率）有不同的学习率调度相关超参，例如线性调度可以选择从一个初始学习率lr-warmup-init开始预热。您可以选择多少比例的训练迭代步使用预热阶段的学习率。不同的训练框架有不同的参数命名，需要结合代码实现设置对应的参数。模型结构

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导 > PyTorch迁移精度调优
管理批量推理作业 - AI开发平台ModelArts

管理批量推理作业查看批量服务详情查看批量服务的事件管理批量服务生命周期修改批量服务配置父主题：使用ModelArts Standard部署模型并推理预测

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测
用户创建模型时构建镜像或导入文件失败 - AI开发平台ModelArts

用户授予OBS的系统权限。子用户的IAM权限是由其主用户设置的，如果主用户没有赋予OBS的putObjectAcl权限即会导致创建模型构建失败。处理方法了解ModelArts依赖的OBS权限自定义策略，请参见ModelArts依赖的OBS权限自定义策略样例。在统一身份认证服

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 模型管理
费用账单 - AI开发平台ModelArts
费用账单 - AI开发平台ModelArts

流水账单”中，“消费时间”即按需产品的实际使用时间。查看自动学习和Workflow的账单自动学习和Workflow运行时，在进行训练作业和部署服务时，会产生不同的账单。训练作业产生的账单可参考查看训练作业的账单查询。部署服务产生的账单可参考查看在线服务的账单查询。查看Notebook的账单登录

 帮助中心 > AI开发平台ModelArts > 计费说明
启动停止边缘节点服务实例 - AI开发平台ModelArts

（响应消息头中X-Subject-Token的值）。表3 请求Body参数参数是否必选参数类型描述 status 是 String 服务状态，取值为： running：running为启动节点实例，只有处于stopped状态的节点实例支持启动。 stopped：stop

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
ModelArts Standard资源监控概述 - AI开发平台ModelArts

方式二：通过AOM查看所有监控指标 ModelArts Standard上报的所有监控指标都保存在AOM中，当ModelArts控制台可以查看的指标不满足诉求时，用户可以通过AOM服务提供的指标消费和使用的能力来查看指标。设置指标阈值告警、告警上报等，都可以直接在AOM控制台操作。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源监控
最新动态 - AI开发平台ModelArts
最新动态 - AI开发平台ModelArts

本文介绍了ModelArts各特性版本的功能发布和对应的文档动态，新特性将在各个区域（Region）陆续发布，欢迎体验。 2023年8月序号功能名称功能描述阶段相关文档 1 Notebook连接大数据服务特性介绍如何将ModelArts Notebook开发环境与华为云大数据服务DLI中的Spar

帮助中心 > AI开发平台ModelArts > 最新动态
在ModelArts控制台查看监控指标 - AI开发平台ModelArts

在ModelArts控制台的总览页，支持查看生产概况（即总体作业运行数量）、资源占用情况、训练作业资源利用情况。您可以单击生产概况的链接、资源池名称、训练作业，跳转到对应界面查看更多详情。图1 总览页查看监控信息在总览页查看全部事件时，如果顶部事件总数和底部的“总条数”数量不一致，请刷新重试。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源监控
【下线公告】华为云ModelArts服务旧版数据集下线公告 - AI开发平台ModelArts

00:00（北京时间）用AI开发平台ModelArts的新版数据集全面替代旧版数据集，旧版数据集正式下线。下线范围下线区域：华北-北京四（其他区域已下线）受影响服务 ModelArts旧版数据集。下线影响正式下线后，所有用户将无法使用旧版数据集。为了避免影响您的业务，建议您在2024/10/30

帮助中心 > AI开发平台ModelArts > 服务公告 > 下线公告
下线公告 - AI开发平台ModelArts
下线公告 - AI开发平台ModelArts

下线公告【下线公告】华为云ModelArts自动学习下线公告【下线公告】华为云ModelArts自动学习模块的文本分类功能下线公告【下线公告】华为云ModelArts服务旧版数据集下线公告【下线公告】华为云ModelArts服务模型转换下线公告【下线公告】华为云ModelArts

帮助中心 > AI开发平台ModelArts > 服务公告
按需计费 - AI开发平台ModelArts
按需计费 - AI开发平台ModelArts

成功”的“事件发生时间”，创建成功的时间点对应界面上的“事件发生时间”。对于公共资源池：计费的起点以实例创建成功的时间点为准，终点以实例停止或删除的时间为准。实例具体如下：因运行自动学习作业，而创建的对应的训练作业和在线服务。因运行Workflow工作流，而创建的对应的训练作业和在线服务。

帮助中心 > AI开发平台ModelArts > 计费说明 > 计费模式
主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） - AI开发平台ModelArts

主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） Ascend-vLLM介绍支持的模型列表版本说明和要求推理服务部署推理关键特性使用推理服务精度评测推理服务性能评测附录父主题： LLM大语言模型训练推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理

总条数： 1675

上一页
1
...
78
79
80
...
84
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Prefix Caching - AI开发平台ModelArts

计算规格说明 - AI开发平台ModelArts

将模型部署为实时推理作业 - AI开发平台ModelArts

部署在线服务出现报错No CUDA runtime is found - AI开发平台ModelArts

如何查看ModelArts中正在收费的作业？ - AI开发平台ModelArts

自动学习/Workflow计费项 - AI开发平台ModelArts

委托授权ModelArts云服务使用SFS Turbo - AI开发平台ModelArts

Step4 测试用户权限 - AI开发平台ModelArts

精度调优前准备工作 - AI开发平台ModelArts

管理批量推理作业 - AI开发平台ModelArts

用户创建模型时构建镜像或导入文件失败 - AI开发平台ModelArts

费用账单 - AI开发平台ModelArts

启动停止边缘节点服务实例 - AI开发平台ModelArts

ModelArts Standard资源监控概述 - AI开发平台ModelArts

最新动态 - AI开发平台ModelArts

在ModelArts控制台查看监控指标 - AI开发平台ModelArts

【下线公告】华为云ModelArts服务旧版数据集下线公告 - AI开发平台ModelArts

下线公告 - AI开发平台ModelArts

按需计费 - AI开发平台ModelArts

主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线