搜索_华为云

推理前的权重合并转换 - AI开发平台ModelArts

推理前的权重合并转换模型训练完成后，训练的产物包括模型的权重、优化器状态、loss等信息。这些内容可用于断点续训、模型评测或推理任务等。在进行模型评测或推理任务前，需要将训练后生成的多个权重文件合并，并转换成Huggingface格式的权重文件。权重文件的合并转换操作都要求

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > Baichuan2-13B模型基于DevServer适配PyTorch NPU训练指导（6.3.904）
OBS复制过程中提示“BrokenPipeError: Broken pipe” - AI开发平台ModelArts

[Errno xx] Broken pipe”。原因分析出现该问题的可能原因如下：在大规模分布式作业上，每个节点都在拷贝同一个桶的文件，导致OBS桶限流。 OBS Client连接数过多，进程/线程之间的轮询，导致一个OBS Client与服务端连接30S内无响应，超过超时时间，服务端断开了连接。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > OBS操作相关故障
导入AI应用提示单个模型文件超过5G限制 - AI开发平台ModelArts

在导入AI应用时，提示单个模型文件大小超过5G限制。原因分析在不使用动态加载的情况下，系统对单个模型文件的限制大小为5G，超过时无法进行导入。处理方法精简模型文件后，重新导入。使用动态加载功能进行导入。图1 使用动态加载父主题： AI应用管理

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > AI应用管理
使用PyCharm ToolKit创建并调试训练作业 - AI开发平台ModelArts

训练作业的简要描述。 Algorithm Source 训练算法来源，分为“常用框架”和“自定义镜像”两种，二者选一项即可。常用框架指使用ModelArts训练管理中支持的常用AI引擎，当前支持的引擎列表请参见训练管理支持的常用框架。如果您使用的AI引擎为支持列表之外的，建议使用自定义镜像的方式创建训练作业。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 创建调试训练作业
配置Workflow的输入输出目录 - AI开发平台ModelArts

配置Workflow的输入输出目录功能介绍统一存储主要用于工作流的目录管理，帮助用户统一管理一个工作流中的所有存储路径，主要分为以下两个功能：输入目录管理：开发者在编辑开发工作流时可以对所有数据的存储路径做统一管理，规定用户按照自己的目录规划来存放数据，而存储的根目录可以根据用

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考
查询训练作业详情 - AI开发平台ModelArts

command String 自定义镜像训练作业的自定义镜像的容器的启动命令。例如python train.py。 parameters Array of Parameter objects 训练作业的运行参数。 policies policies object 作业支持的策略。 inputs

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
重建、停止或删除训练作业 - AI开发平台ModelArts

练作业设置的参数，您仅需在原来的基础上进行修改即可重新创建训练作业。停止训练作业在训练作业列表中，针对“创建中”、“等待中”、“运行中”的训练作业，您可以单击“操作”列的“终止”，停止正在运行中的训练作业。训练作业停止后，ModelArts将停止计费。运行结束的训练作业，

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
ModelArts平台是否支持多模型导入 - AI开发平台ModelArts

ModelArts平台从对象存储服务（OBS）中导入模型包适用于单模型场景。如果有多模型复合场景，推荐使用自定义镜像方式，通过从容器镜像（SWR）中选择元模型的方式创建AI应用部署服务。制作自定义镜像请参考从0-1制作自定义镜像并创建AI应用。父主题：导入模型

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署 > 模型管理 > 导入模型
安全边界 - AI开发平台ModelArts
安全边界 - AI开发平台ModelArts

云基础架构的可用性。而云服务客户则需要负责保护自己的数据和应用程序，以及遵守相关的合规性要求。具体而言，云服务提供商应该提供以下服务和功能：建立和维护安全的基础设施，包括网络、服务器和存储设备等。提供安全的底层基础平台，保证底层环境的运行时安全。提供安全的身份验证和访问控

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
升级Standard专属资源池驱动 - AI开发平台ModelArts

当专属资源池中的节点含有GPU/Ascend资源时，用户基于自己的业务，可能会有自定义GPU/Ascend驱动的需求，ModelArts面向此类客户提供了自助升级专属资源池GPU/Ascend驱动的能力。驱动升级有两种升级方式：安全升级、强制升级。安全升级：不影响正在运行的业务，开

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理 > 管理Standard专属资源池
ModelArts Standard的WebSocket在线服务全流程开发 - AI开发平台ModelArts

键字，检查自定义镜像的端口和ws跟wss的配置是否正确。连接成功后结果如下：图5 连接成功优先验证自定义镜像提供的websocket服务的情况，不同的工具实现的websocket服务会有不同，可能出现连接建立后维持不住，可能出现请求一次后连接就中断需要重新连接的情况，Mod

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
终止训练作业 - AI开发平台ModelArts

command String 自定义镜像训练作业的自定义镜像的容器的启动命令。例如python train.py。 parameters Array of Parameter objects 训练作业的运行参数。 policies policies object 作业支持的策略。 inputs

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
在线服务处于运行中状态时，如何填写推理请求的request header和request body - AI开发平台ModelArts

Body： body的组装和模型强相关，不同来源的模型body的组装方式不同。模型为从容器镜像中导入的：需要按照自定义镜像的要求组织，请咨询该镜像的制作人。模型为从对象存储(OBS)导入的：此时对body的要求会在推理代码中体现，具体在推理代码的_preprocess方法中，该方法将输入的http

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署 > 部署上线 > 在线服务
如何禁止Ubuntu 20.04内核自动升级？ - AI开发平台ModelArts

场景描述在Ubuntu 20.04每次内核升级后，系统需要重新启动以加载新内核。如果您已经安装了自动更新功能，则系统将自动下载和安装可用的更新，这可能导致系统在不经意间被重启；如果使用的软件依赖于特定版本的内核，那么当系统自动更新到新的内核版本时，可能会出现兼容性问题。在使用Ubuntu20

帮助中心 > AI开发平台ModelArts > 常见问题 > Lite Server
调用MaaS部署的模型服务 - AI开发平台ModelArts

temperature 否 1.0 Float 控制采样的随机性的浮点数。较低的值使模型更加确定性，较高的值使模型更加随机。“0”表示贪婪采样。 stop 否 None None/Str/List 用于停止生成的字符串列表。返回的输出将不包含停止字符串。例如，设置为["你"，"好"

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
终止训练作业 - AI开发平台ModelArts

String 自动化搜索作业的yaml配置路径，需要提供一个OBS路径。 autosearch_framework_path String 自动化搜索作业的框架代码目录，需要提供一个OBS路径。 command String 自定义镜像训练作业的自定义镜像的容器的启动命令。可填code_dir。

帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业
资源池创建失败的原因与解决方法？ - AI开发平台ModelArts

查看创建失败的资源池。单击“操作记录”中失败状态的报错信息。图1 查看报错信息解决方法 ModelArts权限管理的委托权限不足，导致创建失败？解决方法请参见ModelArts创建委托授权。申请的资源中包含受限购买的资源规格，导致购买失败？当前modelarts.bm

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Cluster
查看模型评估结果 - AI开发平台ModelArts

由于最终JSON体中需要填写的是图片文件的真实路径，也就是OBS对应的路径，所以在复制到本地做完分析和评估操作后，需要将原来的本地数据集路径映射到OBS路径，然后将新的list送入analysis接口。如果使用的是OBS路径作为输入的data_url，则只需要替换本地路径的字符串即可。 1

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
如何关闭Mox的warmup - AI开发平台ModelArts

如何关闭Mox的warmup 问题现象训练作业mox的Tensorflow版本在运行的时候，会先执行“50steps” 4次，然后才会开始正式运行。 warmup即先用一个小的学习率训练几个epoch（warmup），由于网络的参数是随机初始化的，如果一开始就采用较大的学习率会出现数值不稳定的问题，这是使用warm

帮助中心 > AI开发平台ModelArts > 故障排除 > MoXing
训练前卡死 - AI开发平台ModelArts

解决方案1 检查代码，检查是否有参数中未传入“master_ip”和“rank”参数等问题。问题现象2 分布式训练的日志中，发现有的节点含有GDR信息，而有的节点无GDR信息，导致卡死的原因可能为GDR。 # 节点A日志 modelarts-job-a7305e27-d1cf-4c71

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 训练作业卡死

总条数： 870

上一页
1
...
13
14
15
...
44
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

推理前的权重合并转换 - AI开发平台ModelArts

OBS复制过程中提示“BrokenPipeError: Broken pipe” - AI开发平台ModelArts

导入AI应用提示单个模型文件超过5G限制 - AI开发平台ModelArts

使用PyCharm ToolKit创建并调试训练作业 - AI开发平台ModelArts

配置Workflow的输入输出目录 - AI开发平台ModelArts

查询训练作业详情 - AI开发平台ModelArts

重建、停止或删除训练作业 - AI开发平台ModelArts

ModelArts平台是否支持多模型导入 - AI开发平台ModelArts

安全边界 - AI开发平台ModelArts

升级Standard专属资源池驱动 - AI开发平台ModelArts

ModelArts Standard的WebSocket在线服务全流程开发 - AI开发平台ModelArts

终止训练作业 - AI开发平台ModelArts

在线服务处于运行中状态时，如何填写推理请求的request header和request body - AI开发平台ModelArts

如何禁止Ubuntu 20.04内核自动升级？ - AI开发平台ModelArts

调用MaaS部署的模型服务 - AI开发平台ModelArts

终止训练作业 - AI开发平台ModelArts

资源池创建失败的原因与解决方法？ - AI开发平台ModelArts

查看模型评估结果 - AI开发平台ModelArts

如何关闭Mox的warmup - AI开发平台ModelArts

训练前卡死 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线