搜索_华为云

Git下载代码时报错 - AI开发平台ModelArts

Git下载代码时报错在执行scripts/install.sh安装命令或使用Dockerfile构建镜像时，如遇到git下载代码出现以下类似的报错信息，关闭git验证即可。报错信息： fatal: unable to access 'https://gitee.com/ascend/ModelLink

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.910） > 常见错误原因和解决方法
Git下载代码时报错 - AI开发平台ModelArts

Git下载代码时报错在执行scripts/install.sh安装命令或使用Dockerfile构建镜像时，如遇到git下载代码出现以下类似的报错信息，关闭git验证即可。报错信息： fatal: unable to access 'https://gitee.com/ascend/ModelLink

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.911） > 常见错误原因和解决方法
查看Notebook实例事件 - AI开发平台ModelArts

重要实例扩容完成（User %s updated storage size successfully）重要 UpdateKeyPair 配置实例密钥对（User %s updated the instance keypair to "{%s}"）重要更新实例密钥对（User

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 管理Notebook实例
预测API的域名停用公告 - AI开发平台ModelArts

预测API的域名停用公告华为云ModelArts将于2024年12月31日 00:00（北京时间）逐步停用预测API的域名huaweicloudapis.com，后续预测API切换使用新域名modelarts-infer.com。停用范围影响区域：华为云全部Region 停用影响

 帮助中心 > AI开发平台ModelArts > 服务公告 > 产品变更公告
断点续训和故障快恢说明 - AI开发平台ModelArts

断点续训和故障快恢说明相同点断点续训（Checkpointing）和故障快恢都是指训练中断后可从训练中一定间隔（${save-interval}）保存的模型（包括模型参数、优化器状态、训练迭代次数等）继续训练恢复，而不需要从头开始。不同点断点续训：可指定加载训练过程中生成

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.912） > 训练脚本说明
断点续训和故障快恢说明 - AI开发平台ModelArts

断点续训和故障快恢说明相同点断点续训（Checkpointing）和故障快恢都是指训练中断后可从训练中一定间隔（${save-interval}）保存的模型（包括模型参数、优化器状态、训练迭代次数等）继续训练恢复，而不需要从头开始。不同点断点续训：可指定加载训练过程中生成

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.912） > 训练脚本说明参考
断点续训和故障快恢说明 - AI开发平台ModelArts

断点续训和故障快恢说明相同点断点续训（Checkpointing）和故障快恢都是指训练中断后可从训练中一定间隔（${save-interval}）保存的模型（包括模型参数、优化器状态、训练迭代次数等）继续训练恢复，而不需要从头开始。不同点断点续训：可指定加载训练过程中生成

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.912） > 训练脚本说明参考
Ascend-vLLM介绍 - AI开发平台ModelArts

多lora挂载，多个不同微调模型共用一份权重同时部署。控制输出 Guided Decoding 通过特定模式控制模型输出。 Beam search 通过beamsearch输出多个候选结果。分离部署 PD分离部署全量、增量分离部署，提高资源利用率，提升体验。剪枝 FASP (Fast

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912）
自动学习训练作业失败 - AI开发平台ModelArts

BS桶，单击桶名称进入概览页。在左侧菜单栏选择“访问权限控制>桶ACLs”，检查当前账号是否具备读写权限，如果没有权限，请联系桶的拥有者配置权限。确保此OBS桶是非加密桶进入OBS管理控制台，选择当前自动学习项目使用的OBS桶，单击桶名称进入概览页。确保此OBS桶的加密功

 帮助中心 > AI开发平台ModelArts > 故障排除 > 自动学习 > 模型训练
数据准备使用流程 - AI开发平台ModelArts

数据准备使用流程 ModelArts是面向AI开发者的一站式开发平台，能够支撑开发者从数据到模型的全流程开发过程，包含数据处理、算法开发、模型训练、模型部署等操作。并且提供AI Gallery功能，能够在市场内与其他开发者分享数据、算法、模型等。为了能帮用户快速准备大量高质量的数据，Model

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理
故障恢复 - AI开发平台ModelArts
故障恢复 - AI开发平台ModelArts

期性检查任一检查项出现故障时，隔离故障硬件并重新下发训练作业。针对于分布式场景，容错检查会检查本次训练作业的全部计算节点。推理部署故障恢复用户部署的在线推理服务运行过程中，如发生硬件故障导致推理实例故障，ModelArts会自动检测到并迁移受影响实例到其它可用节点，实例启动后

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
断点续训和故障快恢说明 - AI开发平台ModelArts

断点续训和故障快恢说明相同点断点续训（Checkpointing）和故障快恢都是指训练中断后可从训练中一定间隔（${save-interval}）保存的模型（包括模型参数、优化器状态、训练迭代次数等）继续训练恢复，而不需要从头开始。不同点断点续训：可指定加载训练过程中生成

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.912） > 训练脚本说明
查询AI应用列表 - AI开发平台ModelArts

模型来源的类型，仅当模型为自动学习部署过来时有值，取值为auto。 model_id String 模型id。 model_source String 模型来源。auto：自动学习；algos：预置算法；custom：自定义。 install_type Array of strings 模型支持的部署类型列表。

帮助中心 > AI开发平台ModelArts > API参考 > AI应用管理
W8A8量化 - AI开发平台ModelArts
W8A8量化 - AI开发平台ModelArts

W8A8量化什么是W8A8量化 W8A8量化方案能降低模型显存以及需要部署的卡数。也能同时降低首token时延和增量推理时延。约束限制支持SmoothQuant（W8A8）量化的模型列表请参见支持的模型列表。激活量化支持动态per-token和静态per-tensor，支持非对称量化。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用 > 量化
查询推理VPC访问通道信息的API - AI开发平台ModelArts

查询推理VPC访问通道信息的API 功能介绍该接口用于查询推理VPC访问通道。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI GET /v1/{project_i

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
批量添加样本 - AI开发平台ModelArts

String 表格数据集，HDFS路径。例如/datasets/demo。 ip 否 String 用户GaussDB(DWS)集群的IP地址。 port 否 String 用户GaussDB(DWS)集群的端口。 queue_name 否 String 表格数据集，DLI队列名。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
在ModelArts控制台查看监控指标 - AI开发平台ModelArts

训练作业：用户在运行训练作业时，可以查看多个计算节点的CPU、GPU、NPU资源使用情况。具体请参见训练资源监控章节。在线服务：用户将模型部署为在线服务后，可以通过监控功能查看CPU、内存、GPU等资源使用统计信息和模型调用次数统计，具体参见查看服务详情章节。父主题： ModelArts

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源监控
查看ModelArts相关审计日志 - AI开发平台ModelArts

查看ModelArts相关审计日志在您开启了云审计服务后，系统会记录ModelArts的相关操作，且控制台保存最近7天的操作记录。本节介绍如何在云审计服务管理控制台查看最近7天的操作记录。操作步骤登录云审计服务管理控制台。在管理控制台左上角单击图标，选择区域。在左侧导航

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用CTS审计ModelArts服务
资源选择推荐 - AI开发平台ModelArts

桶（存放代码）”，采用分布式训练。表1 不同场景所需服务及购买推荐场景 OBS SFS SWR DEW ModelArts VPC ECS EVS 单机单卡按需购买。（并行文件系统） × 免费。免费。包月购买。免费。 × 按需购买。单机多卡 × 包月购买。（HPC型500G）

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练
批量更新团队标注样本的标签 - AI开发平台ModelArts

样本用处。可选值如下： TRAIN：训练 EVAL：验证 TEST：测试 INFERENCE：推理 source 否 String 样本数据源地址，通过调用样本列表接口获取。 worker_id 否 String 团队标注的成员ID。表4 SampleLabel 参数是否必选参数类型

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）

总条数： 2092

上一页
1
...
78
79
80
...
105
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Git下载代码时报错 - AI开发平台ModelArts

Git下载代码时报错 - AI开发平台ModelArts

查看Notebook实例事件 - AI开发平台ModelArts

预测API的域名停用公告 - AI开发平台ModelArts

断点续训和故障快恢说明 - AI开发平台ModelArts

断点续训和故障快恢说明 - AI开发平台ModelArts

断点续训和故障快恢说明 - AI开发平台ModelArts

Ascend-vLLM介绍 - AI开发平台ModelArts

自动学习训练作业失败 - AI开发平台ModelArts

数据准备使用流程 - AI开发平台ModelArts

故障恢复 - AI开发平台ModelArts

断点续训和故障快恢说明 - AI开发平台ModelArts

查询AI应用列表 - AI开发平台ModelArts

W8A8量化 - AI开发平台ModelArts

查询推理VPC访问通道信息的API - AI开发平台ModelArts

批量添加样本 - AI开发平台ModelArts

在ModelArts控制台查看监控指标 - AI开发平台ModelArts

查看ModelArts相关审计日志 - AI开发平台ModelArts

资源选择推荐 - AI开发平台ModelArts

批量更新团队标注样本的标签 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线