搜索_华为云

部署推理服务 - AI开发平台ModelArts

口启动和OpenAI服务API接口启动2种方式。详细启动服务与请求方式参考：https://docs.vllm.ai/en/latest/getting_started/quickstart.html。以下服务启动介绍的是在线推理方式，离线推理请参见https://docs.vllm

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.907）
管理员和开发者权限分离 - AI开发平台ModelArts

台的左侧菜单栏中，选择“权限管理> 权限”。单击右上角“创建自定义策略”，在“策略名称”中填入“Policy1_IAM_OBS”，策略配置方式选择JSON视图，输入策略内容，单击“确定”。自定义策略“Policy1_IAM_OBS”的具体内容如下，赋予用户IAM和OBS操作权限。可以直接复制粘贴。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践
查询服务列表 - AI开发平台ModelArts

工作空间ID。获取方法请参见查询工作空间列表。未创建工作空间时默认值为“0”，存在创建并使用的工作空间，以实际取值为准。 infer_type 否 String 推理方式，默认不过滤推理方式。取值包含： real-time：在线服务 batch：批量服务 edge: 边缘服务 status 否 String 服务状态，默认不过滤服务状态，取值包含：

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
使用AWQ量化 - AI开发平台ModelArts

16的模型权重之后，通过autoAWQ工具进行量化。方式一：从开源社区下载发布的AWQ量化模型。 https://huggingface.co/models?sort=trending&search=QWEN+AWQ 方式二：使用AutoAWQ量化工具进行量化。 1、在容器中使

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.907） > 推理模型量化
查看授权列表 - AI开发平台ModelArts

String 指定排序字段。枚举值如下： user_name：IAM用户名称 create_time：创建时间 order 否 String 排序方式。枚举值如下： asc：递增排序 desc：递减排序 limit 否 Integer 指定每一页返回的最大条目数，默认为1000。取值范围[1，1000]。

帮助中心 > AI开发平台ModelArts > API参考 > 授权管理
使用AWQ量化 - AI开发平台ModelArts

16的模型权重之后，通过autoAWQ工具进行量化。方式一：从开源社区下载发布的AWQ量化模型。 https://huggingface.co/models?sort=trending&search=QWEN+AWQ 方式二：使用AutoAWQ量化工具进行量化。在容器中使用m

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.906） > 推理模型量化
ModelArts - AI开发平台ModelArts
ModelArts - AI开发平台ModelArts

OBS管理作业管理模型管理服务管理 02 价格 ModelArts服务的计费方式简单、灵活，您既可以选择按实际使用时长计费。也可以选择更经济的按包周期计费方式。计费项 AI全流程开发自动学习计费方式按需购买包年包月计费FAQ 如何查看ModelArts消费详情？训练作业如何收费？

帮助中心 > AI开发平台ModelArts > 成长地图
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

join(map(str, result))) 获取模型权重文件获取对应模型的权重文件，获取链接参考表1。权重文件下载有如下几种方式，但不仅限于以下方式：方法一：网页下载：通过单击表格中权重文件获取地址的访问链接，即可在模型主页的Files and Version中下载文件。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU训练指导（6.3.910） > 准备工作
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

口启动和OpenAI服务API接口启动2种方式。详细启动服务与请求方式参考：https://docs.vllm.ai/en/latest/getting_started/quickstart.html。以下服务启动介绍的是在线推理方式，离线推理请参见https://docs.vllm

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910）
使用AWQ量化工具转换权重 - AI开发平台ModelArts

16的模型权重之后，通过autoAWQ工具进行量化。方式一：从开源社区下载发布的AWQ量化模型。 https://huggingface.co/models?sort=trending&search=QWEN+AWQ 方式二：使用AutoAWQ量化工具进行量化。在Notebo

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906） > 推理模型量化
如何导入大文件到Notebook中？ - AI开发平台ModelArts

使用ModelArts SDK或Moxing接口从OBS下载文件请参见如何在Notebook中上传下载OBS文件？。文件夹将文件夹压缩成压缩包，上传方式与大文件相同。将文件上传至Notebook后，可在Terminal中解压压缩包。 unzip xxx.zip #在xxx.zip压缩包所在路径直接解压

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > 文件上传下载
创建模型失败，提示模型镜像构建任务超时，没有构建日志 - AI开发平台ModelArts

timed out”提示，不显示详细的构建日志。处理方法预先准备需要编译下载的依赖包，减少依赖包下载和编译的时间。可通过线下wheel包方式安装运行环境依赖。线下wheel包安装，需确保wheel包与模型文件放在同一目录。优化模型代码，提高构建模型镜像的编译效率。父主题：模型管理

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 模型管理
订阅Workflow - AI开发平台ModelArts

ts控制台。方式一：从Workflow详情页进入ModelArts控制台在Workflow详情页单击“运行”，在弹出来的对话框中选择、填写图1所示信息，单击“导入”跳转至ModelArts控制台的Workflow的详情页。图1 导入免费Workflow 方式二：从“我的Ga

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（旧版） > 订阅使用
使用AWQ量化工具转换权重 - AI开发平台ModelArts

16的模型权重之后，通过autoAWQ工具进行量化。方式一：从开源社区下载发布的AWQ量化模型。 https://huggingface.co/models?sort=trending&search=QWEN+AWQ 方式二：使用AutoAWQ量化工具进行量化。 1、运行“examples/quantize

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908） > 推理模型量化
精度问题处理 - AI开发平台ModelArts

# config.ini [ascend_context] precision_mode=enforce_fp32 # 使用fp32。其他方式需要实际分析算子层面的差异，需要联系华为工程师进行具体分析。父主题：模型精度调优

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导 > 模型精度调优
TensorFlow在OBS写入TensorBoard到达5GB时停止 - AI开发平台ModelArts

了OBS单次导入文件大小的上限，导致无法继续写入。处理方法如果在运行训练作业的过程中出现该问题，建议处理方法如下：推荐使用本地缓存的方式来解决，使用如下方法： import moxing.tensorflow as mox mox.cache() 父主题： OBS操作相关故障

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > OBS操作相关故障
非分离部署推理服务 - AI开发平台ModelArts

口启动和OpenAI服务API接口启动2种方式。详细启动服务与请求方式参考：https://docs.vllm.ai/en/latest/getting_started/quickstart.html。以下服务启动介绍的是在线推理方式，离线推理请参见https://docs.vllm

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.909） > 部署推理服务
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

口启动和OpenAI服务API接口启动2种方式。详细启动服务与请求方式参考：https://docs.vllm.ai/en/latest/getting_started/quickstart.html。以下服务启动介绍的是在线推理方式，离线推理请参见https://docs.vllm

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907）
创建Workflow模型注册节点 - AI开发平台ModelArts

主要包含六种场景的用例：基于JobStep的输出注册模型基于OBS数据注册模型使用模板方式注册模型使用自定义镜像注册模型使用自定义镜像+OBS的方式注册模型使用订阅模型+OBS的方式注册模型从训练作业中注册模型（模型输入来源JobStep的输出） import modelarts

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 创建Workflow节点
下载数据 - AI开发平台ModelArts
下载数据 - AI开发平台ModelArts

ModelArts数据管理模块在重构升级中，对未使用过数据管理的用户不可见。建议新用户选择将数据集下载至OBS使用。将数据集下载至OBS “下载方式”选择“对象存储服务（OBS）”。 “目标区域”选择您需要将该数据集下载到的区域位置，如“华北-北京四”。 “目标位置”选择OBS桶路径，

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（旧版） > 订阅使用

总条数： 745

上一页
1
...
17
18
19
...
38
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

部署推理服务 - AI开发平台ModelArts

管理员和开发者权限分离 - AI开发平台ModelArts

查询服务列表 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

查看授权列表 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

ModelArts - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

使用AWQ量化工具转换权重 - AI开发平台ModelArts

如何导入大文件到Notebook中？ - AI开发平台ModelArts

创建模型失败，提示模型镜像构建任务超时，没有构建日志 - AI开发平台ModelArts

订阅Workflow - AI开发平台ModelArts

使用AWQ量化工具转换权重 - AI开发平台ModelArts

精度问题处理 - AI开发平台ModelArts

TensorFlow在OBS写入TensorBoard到达5GB时停止 - AI开发平台ModelArts

非分离部署推理服务 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

创建Workflow模型注册节点 - AI开发平台ModelArts

下载数据 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线