搜索_华为云

Standard权限管理 - AI开发平台ModelArts

Standard权限管理 ModelArts权限管理基本概念权限控制方式典型场景配置实践 FAQ

帮助中心 > AI开发平台ModelArts > 最佳实践
推理精度测试 - AI开发平台ModelArts

service_url：成功部署推理服务后的服务预测地址，示例：http://${docker_ip}:8080/generate。此处的${docker_ip}替换为宿主机实际的IP地址，端口号8080来自前面配置的服务端口。 few_shot：开启少量样本测试后添加示例样本的个数。默认为3，取值范围为0~5整数。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.904）
执行LoRA微调训练任务 - AI开发平台ModelArts

训练脚本中会自动执行训练前的权重转换操作和数据处理操作。如果想详细了解脚本执行训练权重转换操作和数据集预处理操作说明请分别参见训练中的权重转换说明和训练的数据集预处理说明。步骤二修改训练超参配置以Llama2-70b和Llama2-13b的LoRA微调为例，执行脚本为0_pl_lora_70b

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.909）
断点续训练 - AI开发平台ModelArts

续训练。当需要从训练中断的位置接续训练，只需要加载checkpoint，并用checkpoint信息初始化训练状态即可。用户需要在代码里加上reload ckpt的代码，用于读取前一次训练保存的预训练模型。断点续训练操作过程 Llama2-70B的断点续训脚本llama2.s

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > LLama2系列模型基于DevServer适配PyTorch NPU训练指导（6.3.904） > 预训练
管理AI Gallery数据集 - AI开发平台ModelArts

才支持管理数据集的可用范围。管理操作包含如何添加可使用资产的新用户、如何审批用户申请使用资产的请求。添加可使用资产的新用户。数据集发布成功后，如果数据集所有者要新增可使用资产的新用户，则可以在数据集详情页添加新用户。登录AI Gallery，单击右上角“我的Gallery”进入我的Gallery页面。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery数据集
SFT全参微调训练任务 - AI开发平台ModelArts

训练脚本中会自动执行训练前的权重转换操作和数据处理操作。如果想详细了解脚本执行训练权重转换操作和数据集预处理操作说明请分别参见训练中的权重转换说明和训练的数据集预处理说明。 Step2 修改训练超参配置以Llama2-70b和Llama2-13b的SFT微调为例，执行脚本为0_pl_sft_70b

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.907）
安全 - AI开发平台ModelArts
安全 - AI开发平台ModelArts

安全责任共担资产识别与管理身份认证与访问控制数据保护技术审计与日志服务韧性监控安全风险故障恢复更新管理认证证书安全边界

 帮助中心 > AI开发平台ModelArts > 产品介绍
系统容器异常退出 - AI开发平台ModelArts

OBS其他问题。请参考OBS服务端错误码或者采集request id后向OBS客服进行咨询。如果是空间不足。参考常见的磁盘空间不足的问题和解决办法章节处理。父主题：云上迁移适配故障

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
Notebook中快速使用MoXing - AI开发平台ModelArts

运行中”时，单击“操作”列中的“打开”，进入“JupyterLab Notebook”开发页面。在JupyterLab的“Launcher”页签下，以TensorFlow为例，您可以单击TensorFlow，创建一个用于编码的文件。图1 选择不同的AI引擎文件创建完成后，系

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 在Notebook中使用Moxing命令
昇腾云服务6.3.905版本说明 - AI开发平台ModelArts

昇腾云服务6.3.905版本说明本文档主要介绍昇腾云服务6.3.905版本配套的镜像地址、软件包获取方式和支持的特性能力。配套的基础镜像镜像地址获取方式镜像软件说明配套关系 PyTorch：西南-贵阳一 swr.cn-southwest-2.myhuaweicloud

帮助中心 > AI开发平台ModelArts > 服务公告 > 产品发布说明
资源池统计 - AI开发平台ModelArts

operationTime String 统计的时间。表4 statistics 参数参数类型描述 status status object 不同状态下的资源池统计信息。表5 status 参数参数类型描述 creating Integer 正在创建中的资源池数量。 created Integer

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
远程连接处于retry状态如何解决？ - AI开发平台ModelArts

Server on Host”，选择出问题的实例进行自动清除，然后重新进行连接。图1 清除异常的实例方法二（远端）：在VS Code的Terminal中删除“/home/ma-user/.vscode-server/bin/”下正在使用的文件，然后重新进行连接。 ssh -tt

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
远程连接处于retry状态如何解决？ - AI开发平台ModelArts

Server on Host”，选择出问题的实例进行自动清除，然后重新进行连接。图1 清除异常的实例方法二（远端）：在VS Code的Terminal中删除“/home/ma-user/.vscode-server/bin/”下正在使用的文件，然后重新进行连接。 ssh -tt

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > VS Code连接开发环境失败常见问题
环境配置故障 - AI开发平台ModelArts

numba ModuleNotFoundError: No module named 'numba' JupyterLab中文件保存失败，如何解决？父主题：开发环境

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境
使用AWQ量化工具转换权重 - AI开发平台ModelArts

per-channel Step1 模型量化可以在Huggingface开源社区获取AWQ量化后的模型权重；或者获取FP16/BF16的模型权重之后，通过autoAWQ工具进行量化。方式一：从开源社区下载发布的AWQ量化模型。 https://huggingface.co/models?so

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908） > 推理模型量化
使用MoXing时，如何进行增量训练？ - AI开发平台ModelArts

ExportKeys.TF_SERVING) 如果标签发生变化当数据集中的标签发生变化时，需要执行如下语句。此语句需在“mox.run”之前运行。语句中的“logits”，表示根据不同网络中分类层权重的变量名，配置不同的参数。此处填写其对应的关键字。 mox.set_flag('checkpoi

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > 更多功能咨询
执行预训练任务 - AI开发平台ModelArts

权重文件到工作环境和上传数据到指定目录章节完成。训练脚本中会自动执行训练前的权重转换操作和数据处理操作。如果想详细了解脚本执行训练权重转换操作和数据集预处理操作说明请分别参见训练中的权重转换说明和训练的数据集预处理说明。 Step2 修改训练超参配置以llama2-70b和l

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.908）
超过10分钟以上，如何解决？ - AI开发平台ModelArts

Connect: Connecting to instance xxx..."超过10分钟以上，如何解决？问题现象解决方法单击“Canel”，并回到ModelArts控制台界面再次单击界面上的“VS Code接入”按钮。父主题： VS Code连接开发环境失败常见问题

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > VS Code连接开发环境失败常见问题
创建训练任务 - AI开发平台ModelArts

单击“提交”，在“信息确认”页面，确认训练作业的参数信息，确认无误后单击“确定”。训练作业创建完成后，后台将自动完成容器镜像下载、代码目录下载、执行启动命令等动作。训练作业一般需要运行一段时间，根据您的训练业务逻辑和选择的资源不同，训练时长将持续几十分钟到几小时不等。训练作业执行成功后，日志信息如下所示。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 多机多卡
在开发环境中部署本地服务进行调试 - AI开发平台ModelArts

源规格；例如在一个modelarts.vm.cpu.2u的Notebook中，部署本地Predictor，其运行环境就是cpu.2u。部署在线服务Predictor，即将存储在OBS中的模型文件部署到线上服务管理模块提供的容器中运行，其环境规格（如CPU规格，GPU规格）由表3

帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理

总条数： 1133

上一页
1
...
44
45
46
...
57
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Standard权限管理 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

执行LoRA微调训练任务 - AI开发平台ModelArts

断点续训练 - AI开发平台ModelArts

管理AI Gallery数据集 - AI开发平台ModelArts

SFT全参微调训练任务 - AI开发平台ModelArts

安全 - AI开发平台ModelArts

系统容器异常退出 - AI开发平台ModelArts

Notebook中快速使用MoXing - AI开发平台ModelArts

昇腾云服务6.3.905版本说明 - AI开发平台ModelArts

资源池统计 - AI开发平台ModelArts

远程连接处于retry状态如何解决？ - AI开发平台ModelArts

远程连接处于retry状态如何解决？ - AI开发平台ModelArts

环境配置故障 - AI开发平台ModelArts

使用AWQ量化工具转换权重 - AI开发平台ModelArts

使用MoXing时，如何进行增量训练？ - AI开发平台ModelArts

执行预训练任务 - AI开发平台ModelArts

超过10分钟以上，如何解决？ - AI开发平台ModelArts

创建训练任务 - AI开发平台ModelArts

在开发环境中部署本地服务进行调试 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线