搜索_华为云

准备资源 - AI开发平台ModelArts
准备资源 - AI开发平台ModelArts

详细操作指导请参考创建SFS Turbo文件系统。图1 创建SFS Turbo 其中，文件系统类型推荐选用500MB/s/TiB或1000MB/s/TiB，应用于AI大模型场景中。存储容量推荐使用 6.0~10.8TB ，以存储更多模型文件。图2 SFS类型和容量选择创建ECS服务器弹性云服务器（Elastic

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.910） > 准备工作
查看在线服务的事件 - AI开发平台ModelArts

failed, error message: %s 请根据错误信息定位和处理问题。正常删除应用实例 xxx 成功。 Delete service instance %s success - 异常删除应用实例 xxx 失败，错误信息 xxx Failed to delete service

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理同步在线服务
准备资源 - AI开发平台ModelArts
准备资源 - AI开发平台ModelArts

详细操作指导请参考创建SFS Turbo文件系统。图1 创建SFS Turbo 其中，文件系统类型推荐选用500MB/s/TiB或1000MB/s/TiB，应用于AI大模型场景中。存储容量推荐使用 6.0~10.8TB ，以存储更多模型文件。图2 SFS类型和容量选择创建ECS服务器弹性云服务器（Elastic

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.908） > 准备工作
分离部署推理服务 - AI开发平台ModelArts

POST http://${docker_ip}:8080/v1/chat/completions \ -H "Content-Type: application/json" \ -d '{ "model": "${container_model_path}", "messages":

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911） > 部署推理服务
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

able Diffusion WebUI的迁移不包含在本文中，具体原因详见Stable Diffusion WebUI如何适配。 AI推理应用运行在昇腾设备上一般有两种方式：方式1：通过Ascend PyTorch，后端执行推理，又称在线推理。方式2：通过模型静态转换后，执行推理，又称离线推理。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导
在ECS上构建自定义镜像并在Notebook中使用 - AI开发平台ModelArts

注册SWR镜像到ModelArts。创建Notebook并验证新镜像。准备Docker机器并配置环境信息准备一台具有Docker功能的机器，如果没有，建议申请一台弹性云服务器并购买弹性公网IP，并在准备好的机器上安装必要的软件。 ModelArts提供了ubuntu系统的脚本，方便安装docker。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于创建Notebook
管理Workflow Execution - AI开发平台ModelArts

type 是 String 数据来源类型。枚举值如下： dataset：数据集 obs：OBS swr：SWR model_list：AI应用列表 label_task：标注任务 service：在线服务 conditions 否 Array of Constraint objects

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
准备资源 - AI开发平台ModelArts
准备资源 - AI开发平台ModelArts

建SFS Turbo文件系统。图1 创建SFS Turbo 其中，文件系统类型推荐选用500MB/s/TiB或1000MB/s/TiB，应用于AI大模型场景中。存储容量推荐使用 6.0~10.8TB ，以存储更多模型文件。图2 SFS类型和容量选择 ModelArts网络关联SFS

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.905） > 准备工作
准备资源 - AI开发平台ModelArts
准备资源 - AI开发平台ModelArts

建SFS Turbo文件系统。图1 创建SFS Turbo 其中，文件系统类型推荐选用500MB/s/TiB或1000MB/s/TiB，应用于AI大模型场景中。存储容量推荐使用 6.0~10.8TB ，以存储更多模型文件。图2 SFS类型和容量选择 ModelArts网络关联SFS

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.906） > 准备工作
管理Workflow StepExecution - AI开发平台ModelArts

type 是 String 数据来源类型。枚举值如下： dataset：数据集 obs：OBS swr：SWR model_list：AI应用列表 label_task：标注任务 service：在线服务 conditions 否 Array of Constraint objects

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
更新Workflow Execution - AI开发平台ModelArts

描述 name 否 String 输出数据的名称。 type 否 String 输出项类型。枚举值如下： obs：OBS model：AI应用元模型 config 否 Map<String,Object> 输出配置。表6 WorkflowErrorInfo 参数是否必选参数类型

 帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
环境准备 - AI开发平台ModelArts
环境准备 - AI开发平台ModelArts

开发者可以通过浏览器入口以Notebook方式访问，也可以通过VSCode远程开发的模式直接接入到云上环境中完成迁移开发与调测，最终生成适配昇腾的推理应用。当前支持以下两种迁移环境搭建方式： ModelArts Standard：在Notebook中，使用预置镜像进行。 ModelArts

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
使用前必读 - AI开发平台ModelArts

账号、用户和密码等信息。区域指云资源所在的物理位置，同一区域内可用区间内网互通，不同区域间内网不互通。通过在不同地区创建云资源，可以将应用程序设计的更接近特定客户的要求，或满足不同地区的法律或其他要求。可用区一个可用区（AZ）是一个或多个物理数据中心的集合，有独立的风火水

 帮助中心 > AI开发平台ModelArts > API参考
创建算法 - AI开发平台ModelArts
创建算法 - AI开发平台ModelArts

Gallery百模千态社区服务声明》和《华为云AI Gallery服务协议》”选项，需要阅读并勾选同意才能正常发布资产。提交资产发布申请后，AI Gallery侧会自动托管上架，可以前往AI Gallery查看资产上架情况。删除算法删除后，创建的算法资产会被删除，且无法恢复，请谨慎操作。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型
查询用户所有DevServer实例列表 - AI开发平台ModelArts

MA_STUDIO TENSOR_BOARD WEB_IDE extensions Map<String,String> 通过应用专属URL直接打开应用进入远程开发模式。 ssh_keys Array of strings SSH密钥对名称列表，允许设置多个密钥对实现同时对SSH实例的访问。

帮助中心 > AI开发平台ModelArts > API参考 > DevServer管理
实时同步用户所有DevServer实例状态 - AI开发平台ModelArts

MA_STUDIO TENSOR_BOARD WEB_IDE extensions Map<String,String> 通过应用专属URL直接打开应用进入远程开发模式。 ssh_keys Array of strings SSH密钥对名称列表，允许设置多个密钥对实现同时对SSH实例的访问。

帮助中心 > AI开发平台ModelArts > API参考 > DevServer管理
管理员和开发者权限分离 - AI开发平台ModelArts

将2创建的自定义策略授权给管理员用户组ModelArts_admin_group。在统一身份认证服务控制台的左侧菜单栏中，选择“用户组”。在用户组页面单击对应用户组名称ModelArts_admin_group操作列的“授权”，勾选策略“Policy1_IAM_OBS”和“Policy2_Allo

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践
创建DevServer - AI开发平台ModelArts

MA_STUDIO TENSOR_BOARD WEB_IDE extensions Map<String,String> 通过应用专属URL直接打开应用进入远程开发模式。 ssh_keys Array of strings SSH密钥对名称列表，允许设置多个密钥对实现同时对SSH实例的访问。

帮助中心 > AI开发平台ModelArts > API参考 > DevServer管理
动态挂载OBS并行文件系统 - AI开发平台ModelArts

在ModelArts运行态的Notebook容器中，采用动态挂载特性，将OBS对象存储模拟成本地文件系统。其本质是通过挂载工具，将对象协议转为POSIX文件协议。挂载后应用层可以在容器中正常操作OBS对象。动态挂载适用于哪些使用场景场景1：数据集预览和操作，将承载数据集的OBS挂载至Notebook中，可以像本地文件系统一样操作数据集。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 管理Notebook实例
剪枝 - AI开发平台ModelArts
剪枝 - AI开发平台ModelArts

同时其具备比较高的剪枝速度。使用FASP对大模型进行稀疏化剪枝，可以在几乎不影响推理精度情况下，可以有效提升推理性能（吞吐等）。本文主要应用FASP对LLM进行剪枝压缩。约束限制 FASP剪枝当前仅支持Llama系列、Llama2系列、Llama3系列、Qwen2系列的NLP模型。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用

总条数： 592

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

准备资源 - AI开发平台ModelArts

查看在线服务的事件 - AI开发平台ModelArts

准备资源 - AI开发平台ModelArts

分离部署推理服务 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

在ECS上构建自定义镜像并在Notebook中使用 - AI开发平台ModelArts

管理Workflow Execution - AI开发平台ModelArts

准备资源 - AI开发平台ModelArts

准备资源 - AI开发平台ModelArts

管理Workflow StepExecution - AI开发平台ModelArts

更新Workflow Execution - AI开发平台ModelArts

环境准备 - AI开发平台ModelArts

使用前必读 - AI开发平台ModelArts

创建算法 - AI开发平台ModelArts

查询用户所有DevServer实例列表 - AI开发平台ModelArts

实时同步用户所有DevServer实例状态 - AI开发平台ModelArts

管理员和开发者权限分离 - AI开发平台ModelArts

创建DevServer - AI开发平台ModelArts

动态挂载OBS并行文件系统 - AI开发平台ModelArts

剪枝 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线