搜索_华为云

推理精度测试 - AI开发平台ModelArts

g、Winogrande、TruthfulQA等。约束限制确保容器可以访问公网。当前的精度测试仅适用于语言模型精度验证，不适用于多模态模型的精度验证。多模态模型的精度验证，建议使用开源MME数据集和工具（GitHub - BradyFU/Awesome-Multimodal

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910）
推理精度测试 - AI开发平台ModelArts

g、Winogrande、TruthfulQA等。约束限制确保容器可以访问公网。当前的精度测试仅适用于语言模型精度验证，不适用于多模态模型的精度验证。多模态模型的精度验证，建议使用开源MME数据集和工具（GitHub - BradyFU/Awesome-Multimodal

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910）
模型训练存储加速 - AI开发平台ModelArts

件服务SFS Turbo的AI云存储解决方案，如下图所示。 SFS Turbo HPC型支持和OBS数据联动，您可以通过SFS Turbo HPC型文件系统来加速对OBS对象存储中的数据访问，并将生成的结果数据异步持久化到OBS对象存储中长期低成本保存。图1 基于OBS+SFS

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型
释放Standard专属资源池和删除网络 - AI开发平台ModelArts

释放Standard专属资源池和删除网络删除资源池当AI业务开发不再需要使用专属资源池时，您可以删除专属资源池，释放资源。专属资源池删除后，将导致使用此资源的开发环境、训练作业和推理服务等不可用，且删除后不可恢复，请谨慎操作。登录ModelArts管理控制台，在左侧导航栏中选择“AI专属资源池

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理 > 管理Standard专属资源池
管理Workflow StepExecution - AI开发平台ModelArts

管理Workflow StepExecution 功能介绍本接口支持对Workflow StepExecution进行重试、停止和继续操作。接口约束无调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
使用AI Gallery SDK构建自定义模型 - AI开发平台ModelArts

支持支持 Bloom 支持不支持支持不支持 Falcon 支持不支持支持不支持 BERT 支持不支持支持不支持 MPT 支持不支持支持不支持 ChatGLM 支持不支持支持支持核心基础类介绍使用AI Gallery SDK构建自定义模型，需要了

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery模型 > 构建模型
分离部署推理服务 - AI开发平台ModelArts

"software|firmware" #查看驱动和固件版本如出现错误，可能是机器上的NPU设备没有正常安装，或者NPU镜像被其他容器挂载。请先正常安装固件和驱动，或释放被挂载的NPU。驱动版本要求是23.0.6。如果不符合要求请参考安装固件和驱动章节升级驱动。检查docker是否安装。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.908） > 部署推理服务
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

准备代码本教程中用到的模型软件包如下表所示，请提前准备好。获取模型软件包本方案支持的模型对应的软件和依赖包获取地址如表1所示。表1 模型对应的软件包和依赖包获取地址代码包名称代码说明下载地址 AscendCloud-6.3.912-xxx.zip 说明：软件包名称中的xxx表示时间戳。

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.912） > 准备工作
昇腾云服务6.3.912版本说明 - AI开发平台ModelArts

Ascend-vllm支持如下推理特性：支持分离部署支持多机推理支持大小模型投机推理及eagle投机推理支持chunked prefill特性支持automatic prefix caching 支持multi-lora特性支持W4A16、W8A16和W8A8量化升级vLLM

帮助中心 > AI开发平台ModelArts > 服务公告 > 产品发布说明
昇腾云服务6.3.911版本说明 - AI开发平台ModelArts

Ascend-vllm支持如下推理特性：支持分离部署支持多机推理支持大小模型投机推理及eagle投机推理支持chunked prefill特性支持automatic prefix caching 支持multi-lora特性支持W4A16、W8A16和W8A8量化升级vLLM

帮助中心 > AI开发平台ModelArts > 服务公告 > 产品发布说明
分离部署推理服务 - AI开发平台ModelArts

"software|firmware" #查看驱动和固件版本如出现错误，可能是机器上的NPU设备没有正常安装，或者NPU镜像被其他容器挂载。请先正常安装固件和驱动，或释放被挂载的NPU。驱动版本要求是23.0.6。如果不符合要求请参考安装固件和驱动章节升级驱动。检查docker是否安装。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.910） > 部署推理服务
使用PyCharm Toolkit插件连接Notebook - AI开发平台ModelArts

使用限制当前仅支持2019.2-2023.2之间（包含2019.2和2023.2）版本，包括社区版和专业版。使用PyCharm ToolKit远程连接Notebook开发环境，仅限PyCharm专业版。使用PyCharm ToolKit提交训练作业，社区版和专业版都支持，PyCharm

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过PyCharm远程使用Notebook实例
AIGC工具tailor使用指导 - AI开发平台ModelArts

到mindir）和性能分析的辅助工具，当前支持以下功能。表1 功能总览功能大类具体功能模型转换固定shape转模型动态shape传入指定档位转模型支持fp32 支持AOE优化 benchmark 支持测试性能支持精度测试 profiling 支持分析算子的profiling

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理
IAM - AI开发平台ModelArts
IAM - AI开发平台ModelArts

如果您需要为企业中的员工设置不同的权限访问ModelArts资源，以达到不同员工之间的权限隔离，您可以使用统一身份认证服务（Identity and Access Management，简称IAM）进行精细的权限管理。该服务提供用户身份认证、权限分配、访问控制等功能，可以帮助您安全的控制云服务资源的访问。如果华

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 权限控制方式
创建Notebook实例 - AI开发平台ModelArts

“远程访问白名单” 可选，开启“SSH远程开发”功能后，可以设置此参数。设置为允许远程接入访问这个Notebook的IP地址（例如本地PC的IP地址或者访问机器的外网IP地址，最多配置5个，用英文逗号隔开），不设置则表示无接入IP地址限制。如果用户使用的访问机器和Model

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试
昇腾云服务6.3.910版本说明（推荐） - AI开发平台ModelArts

Ascend-vllm支持如下推理特性：支持分离部署支持多机推理支持大小模型投机推理及eagle投机推理支持chunked prefill特性支持automatic prefix caching 支持multi-lora特性支持W4A16、W8A16和W8A8量化升级vLLM

帮助中心 > AI开发平台ModelArts > 服务公告 > 产品发布说明
分离部署推理服务 - AI开发平台ModelArts

"software|firmware" #查看驱动和固件版本如出现错误，可能是机器上的NPU设备没有正常安装，或者NPU镜像被其他容器挂载。请先正常安装固件和驱动，或释放被挂载的NPU。驱动版本要求是23.0.6。如果不符合要求请参考安装固件和驱动章节升级驱动。检查docker是否安装。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.909） > 部署推理服务
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

准备代码本教程中用到的训练推理代码和如下表所示，请提前准备好。获取模型软件包和权重文件本方案支持的模型对应的软件和依赖包获取地址如表1所示，模型列表、对应的开源权重获取地址如表2所示。表1 模型对应的软件包和依赖包获取地址代码包名称代码说明下载地址 AscendCloud-6

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU训练指导（6.3.906） > 准备工作
ModelArts权限管理基本概念 - AI开发平台ModelArts

的各种操作，AI平台在任务执行过程中需要访问用户的其他服务，典型的就是训练过程中，需要访问OBS读取用户的训练数据。在这个过程中，就出现了ModelArts“代表”用户去访问其他云服务的情形。从安全角度出发，ModelArts代表用户访问任何云服务之前，均需要先获得用户的授权，而

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理
断点续训和故障快恢说明 - AI开发平台ModelArts

断点续训和故障快恢说明相同点断点续训（Checkpointing）和故障快恢都是指训练中断后可从训练中一定间隔（${save-interval}）保存的模型（包括模型参数、优化器状态、训练迭代次数等）继续训练恢复，而不需要从头开始。不同点断点续训：可指定加载训练过程中生成

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.912） > 训练脚本说明

总条数： 1587

上一页
1
...
16
17
18
...
80
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

推理精度测试 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

模型训练存储加速 - AI开发平台ModelArts

释放Standard专属资源池和删除网络 - AI开发平台ModelArts

管理Workflow StepExecution - AI开发平台ModelArts

使用AI Gallery SDK构建自定义模型 - AI开发平台ModelArts

分离部署推理服务 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

昇腾云服务6.3.912版本说明 - AI开发平台ModelArts

昇腾云服务6.3.911版本说明 - AI开发平台ModelArts

分离部署推理服务 - AI开发平台ModelArts

使用PyCharm Toolkit插件连接Notebook - AI开发平台ModelArts

AIGC工具tailor使用指导 - AI开发平台ModelArts

IAM - AI开发平台ModelArts

创建Notebook实例 - AI开发平台ModelArts

昇腾云服务6.3.910版本说明（推荐） - AI开发平台ModelArts

分离部署推理服务 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

ModelArts权限管理基本概念 - AI开发平台ModelArts

断点续训和故障快恢说明 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线