搜索_华为云

使用llm-compressor工具量化 - AI开发平台ModelArts

mpressor量化模型权重，然后在NPU的机器上实现推理量化。具体操作如下：开始之前，请确保安装了以下库： git clone https://github.com/vllm-project/llm-compressor.git cd llm-compressor pip install

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.910） > 推理模型量化
使用llm-compressor工具量化 - AI开发平台ModelArts

mpressor量化模型权重，然后在NPU的机器上实现推理量化。具体操作如下：开始之前，请确保安装了以下库： git clone https://github.com/vllm-project/llm-compressor.git cd llm-compressor pip install

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911） > 推理模型量化
使用llm-compressor工具量化 - AI开发平台ModelArts

mpressor量化模型权重，然后在NPU的机器上实现推理量化。具体操作如下：开始之前，请确保安装了以下库： git clone https://github.com/vllm-project/llm-compressor.git cd llm-compressor pip install

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
在ModelArts中使用边缘节点部署边缘服务时能否使用http接口协议？ - AI开发平台ModelArts

在ModelArts中使用边缘节点部署边缘服务时能否使用http接口协议？系统默认使用https。如果您想使用http，可以采取以下两种方式：方式一：在部署边缘服务时添加如下环境变量： MODELARTS_SSL_ENABLED = false 图1 添加环境变量方式二：在

 帮助中心 > AI开发平台ModelArts > 常见问题 > Edge
安装VS Code软件 - AI开发平台ModelArts

安装VS Code软件 VS Code下载方式：下载地址: https://code.visualstudio.com/updates/v1_85 图1 VS Code的下载位置 VS Code版本要求：建议用户使用VS Code 1.85.2版本进行远程连接。 VS Code安装指导如下：

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过VS Code远程使用Notebook实例
ModelArts的Notebook有代理吗？如何关闭？ - AI开发平台ModelArts

ModelArts的Notebook有代理吗？如何关闭？ Notebook有代理。执行env|grep proxy命令查询Notebook代理。执行unset https_proxy unset http_proxy命令关闭代理。父主题： Standard Notebook

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
使用前必读 - AI开发平台ModelArts

见产品介绍。 ModelArts提供了REST（Representational State Transfer）风格API，支持您通过HTTPS请求调用，调用方法请参见如何调用API。同时ModelArts还提供多种编程语言的SDK供您使用，SDK的使用方法请参见ModelArts

帮助中心 > AI开发平台ModelArts > API参考
构造请求 - AI开发平台ModelArts
构造请求 - AI开发平台ModelArts

用户Token接口说明如何调用API，Token可以用于调用其他API时的鉴权。您还可以通过这个视频教程了解如何构造请求调用API：https://bbs.huaweicloud.com/videos/102987 。请求URI 请求URI由如下部分组成： {URI-scheme}

帮助中心 > AI开发平台ModelArts > API参考 > 如何调用API
创建工作空间 - AI开发平台ModelArts

创建工作空间。设置工作空间名称为“test-workspace”，授权类型为“internal”，授权的IAM用户名称为“test”。 POST https://{endpoint}/v1/{project_id}/workspaces { "name" : "test-workspace"

帮助中心 > AI开发平台ModelArts > API参考 > 工作空间管理
VS Code连接开发环境时报错Missing GLIBC，Missing required dependencies - AI开发平台ModelArts

27.so Error: Missing required dependencies. Please refer to our FAQ https://aka.ms/vscode-remote/faq/old-linux for additional information. 原因分析

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
在JupyterLab使用Git克隆代码仓 - AI开发平台ModelArts

面。图1所示图标，为JupyterLab的Git插件。图1 Git插件克隆GitHub的开源代码仓库 GitHub开源仓库地址：https://github.com/jupyterlab/extension-examplesitHub，单击，输入仓库地址，单击确定后即开始克

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过JupyterLab在线使用Notebook实例进行AI开发
上传算法至SFS - AI开发平台ModelArts

上传算法至SFS 下载Swin-Transformer代码。 git clone --recursive https://github.com/microsoft/Swin-Transformer.git 修改lr_scheduler.py文件，把第27行：t_mul=1. 注释掉。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 多机多卡
启动推理服务 - AI开发平台ModelArts

__name__=="__main__": main() 启动在线推理服务此处提供OpenAI服务API接口启动方式。详细启动服务与请求方式参考：https://docs.vllm.ai/en/latest/getting_started/quickstart.html。推荐通过OpenA

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理服务部署
集成在线服务API至生产环境中应用 - AI开发平台ModelArts

确保在线服务一直处于“运行中”状态，否则会导致生产环境应用不可用。集成方式 ModelArts在线服务提供的API是一个标准的Restful API，可使用HTTPS协议访问。ModelArts提供了SDK用于调用在线服务API，SDK调用方式请参见《SDK参考》>“场景1：部署在线服务Predictor的推理预测”。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理同步在线服务
服务韧性 - AI开发平台ModelArts
服务韧性 - AI开发平台ModelArts

服务韧性韧性特指安全韧性，即云服务受攻击后的韧性，不含可靠性、可用性。本章主要阐述ModelArts服务受入侵的检测响应能力、防抖动的能力、域名合理使用、内容安全检测等能力。安全防护套件覆盖和使用堡垒机，增强入侵检测和防御能力 ModelArts服务部署主机层、应用层、网络层

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
如何在ModelArts的Notebook中配置Conda源？ - AI开发平台ModelArts

#在myenv的环境中安装名字为numpy的package conda install -c https://conda.anaconda.org/anaconda numpy #使用源 https://conda.anaconda.org/anaconda 安装numpy conda

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard镜像相关
修改工作空间 - AI开发平台ModelArts

状态码：200 表5 响应Body参数参数参数类型描述 workspace_id String 工作空间ID。请求示例 PUT https://{endpoint}/v1/{project_id}/workspaces/ccd05d1a553b4e188ea878e7dcb85e47

帮助中心 > AI开发平台ModelArts > API参考 > 工作空间管理
修改工作空间配额 - AI开发平台ModelArts

工作空间ID，系统生成的32位UUID，不带橫线。默认的工作空间id为'0'。 unit_en String 数量单位(英文)。请求示例 PUT https://{endpoint}/v1/{project_id}/workspaces/ccd05d1a553b4e188ea878e7dcb85e47/quotas

帮助中心 > AI开发平台ModelArts > API参考 > 工作空间管理
创建和修改工作空间 - AI开发平台ModelArts

确认服务的部署区域，获取项目名称和ID、获取帐号名和ID和获取用户名和ID。操作步骤调用认证鉴权接口获取用户的Token。请求消息体： URI格式：POST https://{iam_endpoint}/v3/auth/tokens 请求消息头：Content-Type →application/json

帮助中心 > AI开发平台ModelArts > API参考 > 应用示例
查询工作流定时调度详情 - AI开发平台ModelArts

定时调度策略中的标记，失败时触发。 on_running String 定时调度策略中的标记，running时触发。请求示例查询调度信息 GET https://{endpoint}/v2/{project_id}/workflows/{workflow_id}/schedules/fa4a

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理

总条数： 688

上一页
1
2
3
4
5
...
35
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用llm-compressor工具量化 - AI开发平台ModelArts

使用llm-compressor工具量化 - AI开发平台ModelArts

使用llm-compressor工具量化 - AI开发平台ModelArts

在ModelArts中使用边缘节点部署边缘服务时能否使用http接口协议？ - AI开发平台ModelArts

安装VS Code软件 - AI开发平台ModelArts

ModelArts的Notebook有代理吗？如何关闭？ - AI开发平台ModelArts

使用前必读 - AI开发平台ModelArts

构造请求 - AI开发平台ModelArts

创建工作空间 - AI开发平台ModelArts

VS Code连接开发环境时报错Missing GLIBC，Missing required dependencies - AI开发平台ModelArts

在JupyterLab使用Git克隆代码仓 - AI开发平台ModelArts

上传算法至SFS - AI开发平台ModelArts

启动推理服务 - AI开发平台ModelArts

集成在线服务API至生产环境中应用 - AI开发平台ModelArts

服务韧性 - AI开发平台ModelArts

如何在ModelArts的Notebook中配置Conda源？ - AI开发平台ModelArts

修改工作空间 - AI开发平台ModelArts

修改工作空间配额 - AI开发平台ModelArts

创建和修改工作空间 - AI开发平台ModelArts

查询工作流定时调度详情 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线