搜索_华为云

使用AWQ量化工具转换权重 - AI开发平台ModelArts

5-72B-Chat-AWQ 参数说明： model：模型路径。 Step3 启动AWQ量化服务参考Step3 启动推理服务，在启动服务时添加如下命令。 --q awq 或者--quantization awq 父主题：推理模型量化

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
使用AWQ量化 - AI开发平台ModelArts

5-72B-Chat-AWQ 参数说明： model：模型路径。 Step3 启动AWQ量化服务参考Step6 启动推理服务，在启动服务时添加如下命令。 -q awq 或者--quantization awq 父主题：推理模型量化

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.910） > 推理模型量化
使用SmoothQuant量化 - AI开发平台ModelArts

启动smoothQuant量化服务。参考部署推理服务，使用量化后权重部署AWQ量化服务。注：Step3 创建服务启动脚本启动脚本中，服务启动命令需添加如下命令。 -q smoothquant 或者 --quantization smoothquant --dtype=float16 父主题：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910） > 推理模型量化
使用AWQ量化 - AI开发平台ModelArts

5-72B-Chat-AWQ 参数说明： model：模型路径。 Step3 启动AWQ量化服务参考Step6 启动推理服务，在启动服务时添加如下命令。 -q awq 或者--quantization awq 父主题：推理模型量化

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.908） > 推理模型量化
使用AWQ量化 - AI开发平台ModelArts

5-72B-Chat-AWQ 参数说明： model：模型路径。 Step3 启动AWQ量化服务参考Step6 启动推理服务，在启动服务时添加如下命令。 -q awq 或者--quantization awq 父主题：推理模型量化

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
更新团队标注验收任务状态 - AI开发平台ModelArts

__WORKFORCE_SAMPLED_REJECTED__：采样已驳回 __AUTO_ANNOTATION__：待确认 sample_time Long 样本时间，OBS最后修改时间。 sample_type Integer 样本类型。可选值如下： 0：图像 1：文本 2：语音 4：表格 6：视频 9：自由格式

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
创建算法 - AI开发平台ModelArts
创建算法 - AI开发平台ModelArts

RemoteConstraint 参数是否必选参数类型描述 data_type 否 String 数据输入类型，支持数据存储位置（OBS）、ModelArts数据集两种方式。 attributes 否 Array of Map<String,String> objects 数据输入为数据集时的相关属性。枚举值：

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
更新算法 - AI开发平台ModelArts
更新算法 - AI开发平台ModelArts

RemoteConstraint 参数是否必选参数类型描述 data_type 否 String 数据输入类型，支持数据存储位置（OBS）、ModelArts数据集两种方式。 attributes 否 Array of Map<String,String> objects 数据输入为数据集时的相关属性。枚举值：

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
使用PyCharm手动连接Notebook - AI开发平台ModelArts

Settings > Project：PythonProject > Python Interpreter”，单击设置图标，再单击“Add”，添加一个新的interpreter。选择“Existing server configuration”，在下拉菜单中选择上一步配置好的SSH

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过PyCharm远程使用Notebook实例
InternVL2基于LIte Server适配PyTorch NPU训练指导（6.3.912） - AI开发平台ModelArts

InternVL/internvl_chat/shell/internvl2.0/2nd_finetune/ 步骤六：增加适配代码表3 添加优化代码模型使用方法 internVL2-40B internVL2-40B模型需要执行下列步骤。 cd ${container_wo

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理
非分离部署推理服务 - AI开发平台ModelArts

对话场景下推荐使用prefix-caching特性。在推理服务启动脚本中添加此参数表示使用prefix-caching特性，不添加表示不使用。开启该特性后，如果模型长度>8192，则需要在启动推理服务前添加如下环境变量降低显存占用；否则在长序列的推理中会触发Out of Memory，导致推理服务不可用。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.910） > 部署推理服务
非分离部署推理服务 - AI开发平台ModelArts

对话场景下推荐使用prefix-caching特性。在推理服务启动脚本中添加此参数表示使用prefix-caching特性，不添加表示不使用。开启该特性后，如果模型长度>8192，则需要在启动推理服务前添加如下环境变量降低显存占用；否则在长序列的推理中会触发Out of Memory，导致推理服务不可用。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911） > 部署推理服务
托管模型到AI Gallery - AI开发平台ModelArts

迷信、违禁等相关敏感词，否则发布审核无法通过。创建完成后，跳转至模型详情页。上传模型文件在模型详情页，选择“模型文件”页签。单击“添加文件”，进入上传文件页面，选择本地的数据文件单击“点击上传”或拖动文件，单击“确认上传”启动上传。上传单个超过5GB的文件时，请使用Gallery

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery模型
修改训练作业优先级 - AI开发平台ModelArts

此时，该用户组下的所有用户均有权限通过Cloud Shell登录运行中的训练作业容器。如果没有用户组，也可以创建一个新的用户组，并通过“用户组管理”功能添加用户，并配置授权。如果指定的子用户没有在用户组中，也可以通过“用户组管理”功能增加用户。父主题：管理模型训练作业

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
托管数据集到AI Gallery - AI开发平台ModelArts

禁等相关敏感词，否则发布审核无法通过。创建完成后，跳转至数据集详情页。上传数据集文件在数据集详情页，选择“数据集文件”页签。单击“添加文件”，进入上传文件页面，选择本地的数据文件单击“点击上传”或拖动文件，单击“确认上传”启动上传。上传单个超过5GB的文件时，请使用Gallery

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery数据集
W4A16量化 - AI开发平台ModelArts
W4A16量化 - AI开发平台ModelArts

/home/ma-user/Qwen1.5-72B-Chat-AWQ 参数说明： model：模型路径。步骤三：启动量化服务参考启动在线推理服务，在启动服务时添加如下命令。 -q awq 或者--quantization awq 父主题：量化

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用 > 量化
图模式 - AI开发平台ModelArts
图模式 - AI开发平台ModelArts

型的PTA图模式启动不支持multi step。 PTA图模式参数配置如果要开启PTA图模式，请配置以下5个环境变量，并且启动服务时不要添加enforce-eager参数。 export INFER_MODE=PTA # 开启PTA模式，如果不使用图模式，请关闭该环境变量 export

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用
保存Notebook实例 - AI开发平台ModelArts

ook”，也会跳转到基于该自定义镜像创建Notebook的页面。镜像保存时，哪些目录的数据可以被保存可以保存的目录：包括容器构建时静态添加到镜像中的文件和目录，可以保存在镜像环境里。例如：安装的依赖包、“/home/ma-user”目录不会被保存的目录：容器启动时动态连接

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 管理Notebook实例
在Notebook中通过镜像保存功能制作自定义镜像 - AI开发平台ModelArts

ook”，也会跳转到基于该自定义镜像创建Notebook的页面。镜像保存时，哪些目录的数据可以被保存可以保存的目录：包括容器构建时静态添加到镜像中的文件和目录，可以保存在镜像环境里。例如：安装的依赖包、“/home/ma-user”目录不会被保存的目录：容器启动时动态连接

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于创建Notebook
部署图像分类服务 - AI开发平台ModelArts

单击“预测”进行测试，预测完成后，右侧“预测结果”区域输出标签名称“sunflowers”和检测的评分。如模型准确率不满足预期，可在“数据标注”页签中添加图片并进行标注，重新进行模型训练及模型部署。预测结果中的参数说明请参见表1。如果您对模型预测结果满意，可根据界面提示调用接口访问在线服务。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用自动学习实现图像分类

总条数： 1425

上一页
1
...
60
61
62
...
72
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用AWQ量化工具转换权重 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

使用SmoothQuant量化 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

更新团队标注验收任务状态 - AI开发平台ModelArts

创建算法 - AI开发平台ModelArts

更新算法 - AI开发平台ModelArts

使用PyCharm手动连接Notebook - AI开发平台ModelArts

InternVL2基于LIte Server适配PyTorch NPU训练指导（6.3.912） - AI开发平台ModelArts

非分离部署推理服务 - AI开发平台ModelArts

非分离部署推理服务 - AI开发平台ModelArts

托管模型到AI Gallery - AI开发平台ModelArts

修改训练作业优先级 - AI开发平台ModelArts

托管数据集到AI Gallery - AI开发平台ModelArts

W4A16量化 - AI开发平台ModelArts

图模式 - AI开发平台ModelArts

保存Notebook实例 - AI开发平台ModelArts

在Notebook中通过镜像保存功能制作自定义镜像 - AI开发平台ModelArts

部署图像分类服务 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线