搜索_华为云

使用kv-cache-int8量化 - AI开发平台ModelArts

--quantization-param-path kv_cache_scales.json #输入Step2 抽取kv-cache量化系数生成的json文件路径; 如果只测试推理功能和性能，不需要此json文件，此时scale系数默认为1，但是可能会造成精度下降。父主题：推理模型量化

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911） > 推理模型量化
创建多机多卡的分布式训练（DistributedDataParallel） - AI开发平台ModelArts

__name__ == '__main__': main() 结果对比分别以单机单卡和两节点16卡两种资源类型完成100epoch的cifar-10数据集训练，训练时长和测试集准确率如下。表1 训练结果对比资源类型单机单卡两节点16卡耗时 60分钟 20分钟准确率

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 分布式模型训练
ModelArts - AI开发平台ModelArts
ModelArts - AI开发平台ModelArts

Jupyter Notebook，提供在线的代码开发环境。业务开发者使用自动学习构建模型 AI初学者使用自定义算法构建模型免费体验ModelArts 免费体验CodeLab 自动学习口罩检测（使用新版自动学习实现物体检测）部署在线服务使用大模型在ModelArts

帮助中心 > AI开发平台ModelArts > 成长地图
在Notebook中通过镜像保存功能制作自定义镜像用于推理 - AI开发平台ModelArts

正常”。单击新建的模型名称左侧的小三角形，展开模型的版本列表。在操作列单击“部署 > 在线服务”，跳转至在线服务的部署页面。在部署页面，参考如下说明填写关键参数。 “名称”：自定义一个在线服务的名称，也可以使用默认值。 “资源池”：选择“公共资源池”。 “模型来源”和“选择模型及版本”：会自动选择模型和版本号。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于推理
使用Notebook进行AI开发调试 - AI开发平台ModelArts

使用Notebook进行AI开发调试 Notebook使用场景创建Notebook实例通过JupyterLab在线使用Notebook实例进行AI开发通过PyCharm远程使用Notebook实例通过VS Code远程使用Notebook实例通过SSH工具远程使用Notebook

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard）
自动学习训练作业失败 - AI开发平台ModelArts

数据集文件有以下限制：如果您使用2u8g规格，测试建议数据集文件应小于10MB。当文件大小符合限制要求，如果存在极端的数据规模（行数列数之积）时，仍可能会导致训练失败，建议的数据规模低于10000。如果您使用8u32g规格，测试建议数据集文件应小于100MB。当文件大小符合限

 帮助中心 > AI开发平台ModelArts > 故障排除 > 自动学习 > 模型训练
按需计费 - AI开发平台ModelArts
按需计费 - AI开发平台ModelArts

止或删除的时间为准。实例具体如下：因运行自动学习作业，而创建的对应的训练作业和在线服务。因运行Workflow工作流，而创建的对应的训练作业和在线服务。 Notebook实例训练作业在线服务例如，您在8:45:30购买了一个按需计费的专属资源池，相关资源为计算资源（v

帮助中心 > AI开发平台ModelArts > 计费说明 > 计费模式
AI开发基本流程介绍 - AI开发平台ModelArts

一些常用的指标，如准确率、召回率、AUC等，能帮助您有效的评估，最终获得一个满意的模型。部署模型模型的开发训练，是基于之前的已有数据（有可能是测试数据），而在得到一个满意的模型之后，需要将其应用到正式的实际数据或新产生数据中，进行预测、评价、或以可视化和报表的形式把数据中的高价值信息

 帮助中心 > AI开发平台ModelArts > 产品介绍 > AI开发基础知识
使用kv-cache-int8量化 - AI开发平台ModelArts

--quantization-param-path kv_cache_scales.json #输入Step2 抽取kv-cache量化系数生成的json文件路径; 如果只测试推理功能和性能，不需要此json文件，此时scale系数默认为1，但是可能会造成精度下降。父主题：推理模型量化

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.907） > 推理模型量化
费用账单 - AI开发平台ModelArts
费用账单 - AI开发平台ModelArts

期为“按账期”，您也可以设置其他统计维度和周期，详细介绍请参见流水与明细账单。查看在线服务的账单 ModelArts在线服务查询资源账单首先需要获取资源名称，而ModelArts控制台展示的在线服务名称与账单中上报的资源名称不一致，您需要先了解资源名称的查询方法，以及资源名称与

 帮助中心 > AI开发平台ModelArts > 计费说明
与其他云服务的关系 - AI开发平台ModelArts

ModelArts标注的数据存储在OBS中。自动训练训练作业结束后，其生成的模型存储在OBS中。部署上线 ModelArts将存储在OBS中的模型部署上线为在线服务。 AI全流程开发数据管理数据集存储在OBS中。数据集的标注信息存储在OBS中。支持从OBS中导入数据。开发环境 Noteb

帮助中心 > AI开发平台ModelArts > 产品介绍
ModelArts与其他服务的关系 - AI开发平台ModelArts

ModelArts标注的数据存储在OBS中。自动训练训练作业结束后，其生成的模型存储在OBS中。部署上线 ModelArts将存储在OBS中的模型部署上线为在线服务。 AI全流程开发数据管理数据集存储在OBS中。数据集的标注信息存储在OBS中。支持从OBS中导入数据。开发环境 Noteb

帮助中心 > AI开发平台ModelArts > 常见问题 > 历史文档待下线
AI Gallery使用流程 - AI开发平台ModelArts

见将AI Gallery中的模型部署为AI应用。发布后的资产，可通过微调大师训练模型和在线推理服务部署模型，具体可参见使用AI Gallery微调大师训练模型、使用AI Gallery在线推理服务部署模型。图1 AI Gallery使用流程 AI Gallery也支持管理从M

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版）
查询服务列表 - AI开发平台ModelArts

finished：只有批量服务会有这个状态，表示运行完成。 stopping: 停止中。 deleting: 删除中。 pending: 待启动，仅在线有这个状态。 waiting: 资源排队中，仅在线服务有这个状态。 offset 否 Integer 分页列表的起始页，默认为0。 limit 否 Integer

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
计费概述 - AI开发平台ModelArts
计费概述 - AI开发平台ModelArts

具体计费请以ModelArts价格计算器中的价格为准。 ModelArts Standard专属资源池、自动学习、Workflow、Notebook、训练作业、在线/批量/边缘服务 ModelArts Lite Cluster资源池 ModelArts弹性集群Server ModelArts Studio（MAAS）

帮助中心 > AI开发平台ModelArts > 计费说明
管理员和开发者权限分离 - AI开发平台ModelArts

”。管理员不做权限控制，此处默认使用普通用户委托即可。勾选“我已经详细阅读并同意《 ModelArts服务声明》”，单击“创建”。测试管理员用户权限。使用管理员用户登录ModelArts管理控制台。在登录页面，请使用“IAM用户登录”方式进行登录。首次登录会提示修改密码，请根据界面提示进行修改。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践
Step2 为用户配置云服务使用权限 - AI开发平台ModelArts

配置CES云监控和SMN消息通知使用权限。ModelArts推理部署的在线服务详情页面内有调用次数详情，单击可查看该在线服务的调用次数随时间详细分布的情况。如果想进一步通过CES云监控查看ModelArts的在线服务和对应模型负载运行状态的整体情况，需要给子账号授予CES权限。如果只是查看监控，给子账号授予CES

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践 > 配置ModelArts基本使用权限
迁移评估 - AI开发平台ModelArts
迁移评估 - AI开发平台ModelArts

练。 - 自定义算子是否有自定义算子，CPU还是CUDA，复杂程度。例如：有5个CUDA自定义算子。1个高复杂度算子，基于C++开发2000行代码。4个中等复杂度算子，基于C++开发，平均每个自定义算子约500行代码。 - 动态shape 是否需要支持动态shape。例如：

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
安全边界 - AI开发平台ModelArts
安全边界 - AI开发平台ModelArts

口，监听在localhost上。避免通过环境变量传递敏感信息，需要通过加密组件进行加密后再通过环境变量配置。部署在线服务，当打开APP认证时，app认证密钥是在线服务的另一个访问凭据，需要妥善保存app密钥，防止泄露。父主题：安全

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
AI Gallery（新版） - AI开发平台ModelArts

发布和管理AI Gallery镜像发布和管理AI Gallery中的AI应用使用AI Gallery微调大师训练模型使用AI Gallery在线推理服务部署模型 Gallery CLI配置工具指南计算规格说明

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery）

总条数： 599

上一页
1
...
19
20
21
...
30
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用kv-cache-int8量化 - AI开发平台ModelArts

创建多机多卡的分布式训练（DistributedDataParallel） - AI开发平台ModelArts

ModelArts - AI开发平台ModelArts

在Notebook中通过镜像保存功能制作自定义镜像用于推理 - AI开发平台ModelArts

使用Notebook进行AI开发调试 - AI开发平台ModelArts

自动学习训练作业失败 - AI开发平台ModelArts

按需计费 - AI开发平台ModelArts

AI开发基本流程介绍 - AI开发平台ModelArts

使用kv-cache-int8量化 - AI开发平台ModelArts

费用账单 - AI开发平台ModelArts

与其他云服务的关系 - AI开发平台ModelArts

ModelArts与其他服务的关系 - AI开发平台ModelArts

AI Gallery使用流程 - AI开发平台ModelArts

查询服务列表 - AI开发平台ModelArts

计费概述 - AI开发平台ModelArts

管理员和开发者权限分离 - AI开发平台ModelArts

Step2 为用户配置云服务使用权限 - AI开发平台ModelArts

迁移评估 - AI开发平台ModelArts

安全边界 - AI开发平台ModelArts

AI Gallery（新版） - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线