搜索_华为云

使用GPTQ量化 - AI开发平台ModelArts

device_map="auto", quantization_config=gptq_config) 您还可以使用save_pretrain()方法在本地保存您的量化模型。如果模型是用device_map参数量化的，请确保在保存之前将整个模型移动到GPU或CPU。例如，要将模型保存在CPU上。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908） > 推理模型量化
使用GPTQ量化 - AI开发平台ModelArts

device_map="auto", quantization_config=gptq_config) 您还可以使用save_pretrain()方法在本地保存您的量化模型。如果模型是用device_map参数量化的，请确保在保存之前将整个模型移动到GPU或CPU。例如，要将模型保存在CPU上。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
准备图像分类数据 - AI开发平台ModelArts

登录OBS管理控制台，在ModelArts同一区域内创建桶。如果已存在可用的桶，需确保OBS桶与ModelArts在同一区域。参考上传文件，将本地数据上传至OBS桶中。如果您的数据较多，推荐OBS Browser+上传数据或上传文件夹。上传的数据需满足此类型自动学习项目的数据集要求。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用自动学习实现图像分类
修改工作空间配额 - AI开发平台ModelArts

请求参数表2 请求Header参数参数是否必选参数类型描述 X-Auth-Token 是 String 用户Token。通过调用IAM服务获取用户Token接口获取（响应消息头中X-Subject-Token的值）。表3 请求Body参数参数是否必选参数类型

 帮助中心 > AI开发平台ModelArts > API参考 > 工作空间管理
使用自定义镜像创建在线服务，如何修改默认端口 - AI开发平台ModelArts

登录ModelArts控制台，左侧菜单选择“AI应用管理 > AI应用”；单击“创建”，进入创建AI应用界面，元模型选择“从容器镜像中选择”，选择自定义镜像；配置“容器调用接口”和端口号，端口号与模型配置文件中的端口保持一致；图1 修改端口号设置完成后，单击“立即创建”，等待AI应用状态变为“正常”；重新部署在线服务。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署 > 模型管理 > 导入模型
在ModelArts控制台查看监控指标 - AI开发平台ModelArts

情况。具体请参见训练资源监控章节。在线服务：用户将模型部署为在线服务后，可以通过监控功能查看CPU、内存、GPU等资源使用统计信息和模型调用次数统计，具体参见查看服务详情章节。父主题： ModelArts Standard资源监控

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源监控
标注文本分类数据 - AI开发平台ModelArts

odelArts自动学习页面中，添加或删除数据。添加文件在“未标注”页签下，可单击页面左上角的“添加数据”，您可以在弹出对话框中，选择本地文件上传。上传文件格式需满足文本分类型的数据集要求。删除文本对象在“已标注”页签或“未标注”页签下，选中需要删除的文本对象，单击页面

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用自动学习实现文本分类
创建训练作业版本 - AI开发平台ModelArts

is_success Boolean 请求是否成功。 error_message String 调用失败时的错误信息。调用成功时无此字段。 error_code String 调用失败时的错误码，具体请参见错误码。调用成功时无此字段。 job_id Long 训练作业的ID。 job_name String

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
分离部署推理服务 - AI开发平台ModelArts

个local_ranktable_host.json文件用于确定服务入口实例。 ./save_dir 生成ranktable文件如下（假设本地主机ip为10.**.**.18）。 global_ranktable_10.**.**.18.json # global rank_table

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.910） > 部署推理服务
在JupyterLab中使用TensorBoard可视化作业 - AI开发平台ModelArts

也可以放到OBS并行文件系统中。 Summary数据上传到Notebook路径/home/ma-user/work/下的方式，请参见上传本地文件至JupyterLab。 Summary数据如果是通过OBS并行文件系统挂载到Notebook中，请将模型训练时产生的Summary文

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过JupyterLab在线使用Notebook实例进行AI开发
准备文本分类数据 - AI开发平台ModelArts

登录OBS管理控制台，在ModelArts同一区域内创建桶。如果已存在可用的桶，需确保OBS桶与ModelArts在同一区域。参考上传文件，将本地数据上传至OBS桶中。如果您的数据较多，推荐OBS Browser+上传数据或上传文件夹。上传的数据需满足此类型自动学习项目的数据集要求。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用自动学习实现文本分类
创建AI应用 - AI开发平台ModelArts

请求参数表2 请求Header参数参数是否必选参数类型描述 X-Auth-Token 是 String 用户Token。通过调用IAM服务获取用户Token接口获取（响应消息头中X-Subject-Token的值）。表3 请求Body参数参数是否必选参数类型

 帮助中心 > AI开发平台ModelArts > API参考 > AI应用管理
在JupyterLab使用Git克隆代码仓 - AI开发平台ModelArts

add命令。在左下方输入本次提交的Message，单击“Commit”，相当于执行了git commit命令。图8 提交修改内容此时，可以在“History”页签下看到本地提交已成功。图9 查看是否提交成功单击“push”按钮，相当于执行git push命令，即可提交代码到GitHub仓库中。提交成功后会提示“Successfully

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过JupyterLab在线使用Notebook实例进行AI开发
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

T_S=600 # PYTORCH_NPU_ALLOC_CONF优先设置为expandable_segments:True # 如果有涉及虚拟显存相关的报错，可设置为expandable_segments:False export PYTORCH_NPU_ALLOC_CONF=e

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910）
查询服务列表 - AI开发平台ModelArts

Integer 部署进度，当状态是deploying时，返回。 invocation_times Number 服务的总调用次数。 failed_times Number 服务调用失败次数。 is_shared Boolean 是否是订阅的服务。 shared_count Number 订阅的服务数。

帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
调整模型后，部署新版本AI应用能否保持原API接口不变？ - AI开发平台ModelArts

入“修改服务”页面。在选择模型及配置中，单击“增加模型版本进行灰度发布”添加新版本。图1 灰度发布您可以设置两个版本的流量占比，服务调用请求根据该比例分配。其他设置可参考参数说明。完成设置后，单击下一步。确认信息无误后，单击“提交”部署在线服务。父主题：在线服务

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署 > 部署上线 > 在线服务
部署推理服务 - AI开发平台ModelArts

T_S=600 # PYTORCH_NPU_ALLOC_CONF优先设置为expandable_segments:True # 如果有涉及虚拟显存相关的报错，可设置为expandable_segments:False export PYTORCH_NPU_ALLOC_CONF=e

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910）
删除服务 - AI开发平台ModelArts
删除服务 - AI开发平台ModelArts

请求参数表2 请求Header参数参数是否必选参数类型描述 X-Auth-Token 是 String 用户Token。通过调用IAM服务获取用户Token接口获取（响应消息头中X-Subject-Token的值）。响应参数无请求示例如下删除服务ID为xxxxxx的模型服务为例。

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
使用CodeLab免费体验Notebook - AI开发平台ModelArts

常用操作指导可参见JupyterLab操作指导：JupyterLab常用功能介绍。由于CodeLab的存储为系统默认路径，在使用“上传文件”或“下载文件至本地”时，只能使用JupyterLab页面提供的功能。如需使用大文件上传和下载的功能，建议您前往Notebook，创建一个收费的实例进行使用。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试
示例：创建DDP分布式训练（PyTorch+NPU） - AI开发平台ModelArts

a-user/modelarts/log/”目录下的“*.log”文件将会被自动上传至ModelArts训练作业的日志目录（OBS）。如果本地相应目录没有生成大小>0的日志文件，则对应的父级目录也不会上传。因此，PyTorch NPU的plog日志是按worker存储的，而不是按rank

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 分布式模型训练

总条数： 856

上一页
1
...
34
35
36
...
43
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用GPTQ量化 - AI开发平台ModelArts

使用GPTQ量化 - AI开发平台ModelArts

准备图像分类数据 - AI开发平台ModelArts

修改工作空间配额 - AI开发平台ModelArts

使用自定义镜像创建在线服务，如何修改默认端口 - AI开发平台ModelArts

在ModelArts控制台查看监控指标 - AI开发平台ModelArts

标注文本分类数据 - AI开发平台ModelArts

创建训练作业版本 - AI开发平台ModelArts

分离部署推理服务 - AI开发平台ModelArts

在JupyterLab中使用TensorBoard可视化作业 - AI开发平台ModelArts

准备文本分类数据 - AI开发平台ModelArts

创建AI应用 - AI开发平台ModelArts

在JupyterLab使用Git克隆代码仓 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

查询服务列表 - AI开发平台ModelArts

调整模型后，部署新版本AI应用能否保持原API接口不变？ - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

删除服务 - AI开发平台ModelArts

使用CodeLab免费体验Notebook - AI开发平台ModelArts

示例：创建DDP分布式训练（PyTorch+NPU） - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线