搜索_华为云

在JupyterLab中使用TensorBoard可视化作业 - AI开发平台ModelArts

在开发环境中创建TensorBoard可视化作业流程 Step1 创建开发环境并在线打开 Step2 上传Summary数据 Step3 启动TensorBoard Step4 查看训练看板中的可视化数据 Step1 创建开发环境并在线打开在ModelArts控制台，进入“开发空间 > Note

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过JupyterLab在线使用Notebook实例进行AI开发
准备资源 - AI开发平台ModelArts
准备资源 - AI开发平台ModelArts

注意：CPU架构必须选择鲲鹏计算；镜像推荐选择EulerOS；ECS服务器确保可以访问公网，用于获取镜像和构建镜像。图3 购买ECS ECS服务器挂载SFS Turbo ECS服务器中手动挂载SFS Turbo步骤如下：用户可通过CloudShell或SSH等方式登录并访问ECS服务器，进入EC

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.909） > 准备工作
使用大模型在ModelArts Standard创建模型部署在线服务 - AI开发平台ModelArts

使用大模型在ModelArts Standard创建模型部署在线服务背景说明目前大模型的参数量已经达到千亿甚至万亿，随之大模型的体积也越来越大。千亿参数大模型的体积超过200G，在版本管理、生产部署上对平台系统产生了新的要求。例如：导入模型时，需要支持动态调整租户存储配额；模

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
准备资源 - AI开发平台ModelArts
准备资源 - AI开发平台ModelArts

注意：CPU架构必须选择鲲鹏计算；镜像推荐选择EulerOS；ECS服务器确保可以访问公网，用于获取镜像和构建镜像。图3 购买ECS ECS服务器挂载SFS Turbo ECS服务器中手动挂载SFS Turbo步骤如下：用户可通过CloudShell或SSH等方式登录并访问ECS服务器，进入EC

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.911） > 准备工作
服务部署失败，报错ModelArts.3520，服务总数超限 - AI开发平台ModelArts

部署服务时，ModelArts报错“ModelArts.3520: 在线服务总数超限，限制为20”，接口返回“A maximum of xxx real-time services are allowed.”，表示服务数量超限。正常情况下，单个用户最多可创建20个在线服务。可采取以下方式处理：删除状态为“异常”的服务。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署 > 部署上线 > 在线服务
约束与限制 - AI开发平台ModelArts

Server使用裸金属服务器时，如果升级/修改操作系统内核或者驱动，很可能导致驱动和内核版本不兼容，从而导致OS无法启动，或者基本功能不可用。如果需要升级/修改，请联系华为云技术支持。 ModelArts Lite Server使用ECS服务器时不支持重装操作系统，部分区域使用裸金属服务器时也不

 帮助中心 > AI开发平台ModelArts > 产品介绍
分离部署推理服务 - AI开发平台ModelArts

Prefill阶段（全量推理）将用户请求的prompt传入大模型，进行计算，中间结果写入KVCache并推出第1个token，属于计算密集型。 Decode阶段（增量推理）将请求的前1个token传入大模型，从显存读取前文产生的KVCache再进行计算，属于访存密集型。分离部署场景下，全量推理和增

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.910） > 部署推理服务
内存不足如何处理？ - AI开发平台ModelArts

处理方法在部署或升级在线服务时，选择更大内存规格的计算节点。图3 选择计算节点规格运行中服务出现告警时，需要分析是您的代码是否出现漏洞导致内存溢出、是否因为业务使用量太大需要更多的内存。如果因业务原因需要更多内存，请升级在线服务选择更大内存规格的计算节点。父主题：服务部署

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
不同机型的对应的软件配套版本 - AI开发平台ModelArts

数据直接从一台计算机的内存传输到另一台计算机。 RoCE：RDMA over Converged Ethernet（RoCE）是一种网络协议，允许应用通过以太网实现远程内存访问。 IB：InfiniBand (IB) 是一种高性能计算机网络通信协议，专为高性能计算和数据中心互连设计。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster使用前必读
模型训练计费项 - AI开发平台ModelArts

在ModelArts进行模型训练时，会产生计算资源和存储资源的累计值计费。计算资源为训练作业运行的费用。存储资源包括数据存储到OBS或SFS的费用。具体内容如表1所示。表1 计费项计费项计费项说明适用的计费模式计费公式计算资源公共资源池使用计算资源的用量。具体费用可参见ModelArts价格详情。

帮助中心 > AI开发平台ModelArts > 计费说明 > 计费项
在JupyterLab中使用MindInsight可视化作业 - AI开发平台ModelArts

在开发环境中创建MindInsight可视化作业流程 Step1 创建开发环境并在线打开 Step2 上传Summary数据 Step3 启动MindInsight Step4 查看训练看板中的可视化数据 Step1 创建开发环境并在线打开在ModelArts控制台，进入“开发空间> Noteb

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过JupyterLab在线使用Notebook实例进行AI开发
时序预测-time_series_v2算法部署在线服务预测报错 - AI开发平台ModelArts

时序预测-time_series_v2算法部署在线服务预测报错问题现象在线服务预测报错：ERROR: data is shorter than windows。原因分析该报错说明预测使用的数据行数小于window超参值。在使用订阅算法时序预测-time_series_v

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
使用预置AI算法部署在线服务报错gunicorn：error：unrecorgized arguments - AI开发平台ModelArts

使用预置AI算法部署在线服务报错gunicorn：error：unrecorgized arguments 问题现象使用预置AI算法部署在线服务报错gunicorn：error：unrecorgized arguments... 图1 在线服务报错原因分析根据报错日志分析，

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
专属资源池计费项 - AI开发平台ModelArts

示例：使用包年包月的专属资源池。计费项：计算资源费用假设用户于2023年4月1日10:00:00创建了一个包年/包月的专属资源池，资源池规格为CPU: 8 核 32GB，计算节点个数为1个，购买时长为2个月，单价为1,750.00元。按照计算资源费用结算，那么此专属资源池运行期间产生的费用计算如下：计算资源费用

 帮助中心 > AI开发平台ModelArts > 计费说明 > 计费项
上传数据和算法至SFS（首次使用时需要） - AI开发平台ModelArts

上传数据和算法至SFS（首次使用时需要）前提条件 ECS服务器已挂载SFS，请参考ECS服务器挂载SFS Turbo存储。在ECS中已经创建ma-user和ma-group用户，请参考在ECS中创建ma-user和ma-group。已经安装obsutil，请参考下载和安装obsutil。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 单机多卡
专属资源池购买后，中途扩容了一个节点，如何计费？ - AI开发平台ModelArts

专属资源池购买后，中途扩容了一个节点，如何计费？华为云会重新计算一个增加了该节点的账单，付费以后才能使用。父主题： Standard资源池

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard资源池
配置Lite Cluster网络 - AI开发平台ModelArts

本章节介绍如何申请弹性公网IP并绑定到弹性云服务器。通过本文档，您可以实现弹性云服务器访问公网的目的。使用华为云账号登录CCE管理控制台。找到购买Cluster资源时选择的CCE集群，单击名称进入CCE集群详情页面，单击“节点管理”页签，在“节点”页签中单击需要登录的节点名称，跳转至弹性云服务器页面。图1

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源配置
开发环境计费项 - AI开发平台ModelArts

实例时，会使用计算资源和存储资源，会产生计算资源和存储资源的累计值计费。具体内容如表1所示。 Notebook实例停止运行时，EVS还会持续计费，需及时删除才能停止EVS计费。计算资源费用：如果运行Notebook实例时，使用专属资源池进行模型训练和推理，计算资源不计费。如

 帮助中心 > AI开发平台ModelArts > 计费说明 > 计费项
配置了合理的服务部署超时时间，服务还是部署失败，无法启动 - AI开发平台ModelArts

初始化。因此，推荐在创建AI应用时配置健康检查，并设置合理的延迟检测时间，实现实际业务的是否成功的检测，确保服务部署成功。父主题：在线服务

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署 > 部署上线 > 在线服务
停止计费 - AI开发平台ModelArts
停止计费 - AI开发平台ModelArts

flow、开发环境、模型训练、在线服务、专属资源池涉及到需要停止的计费项如下：自动学习：停止因运行自动学习作业而创建的训练作业和在线服务。删除存储到OBS中的数据及OBS桶。 Workflow：停止因运行Workflow作业而创建的训练作业和在线服务。删除存储到OBS中的数据及OBS桶。

帮助中心 > AI开发平台ModelArts > 计费说明

总条数： 1288

上一页
1
...
5
6
7
...
65
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

在JupyterLab中使用TensorBoard可视化作业 - AI开发平台ModelArts

准备资源 - AI开发平台ModelArts

使用大模型在ModelArts Standard创建模型部署在线服务 - AI开发平台ModelArts

准备资源 - AI开发平台ModelArts

服务部署失败，报错ModelArts.3520，服务总数超限 - AI开发平台ModelArts

约束与限制 - AI开发平台ModelArts

分离部署推理服务 - AI开发平台ModelArts

内存不足如何处理？ - AI开发平台ModelArts

不同机型的对应的软件配套版本 - AI开发平台ModelArts

模型训练计费项 - AI开发平台ModelArts

在JupyterLab中使用MindInsight可视化作业 - AI开发平台ModelArts

时序预测-time_series_v2算法部署在线服务预测报错 - AI开发平台ModelArts

使用预置AI算法部署在线服务报错gunicorn：error：unrecorgized arguments - AI开发平台ModelArts

专属资源池计费项 - AI开发平台ModelArts

上传数据和算法至SFS（首次使用时需要） - AI开发平台ModelArts

专属资源池购买后，中途扩容了一个节点，如何计费？ - AI开发平台ModelArts

配置Lite Cluster网络 - AI开发平台ModelArts

开发环境计费项 - AI开发平台ModelArts

配置了合理的服务部署超时时间，服务还是部署失败，无法启动 - AI开发平台ModelArts

停止计费 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线