搜索_华为云

ModelArts Standard推理服务支持VPC直连的高速访问通道配置 - AI开发平台ModelArts

只有专属资源池部署的服务才支持VPC直连的高速访问通道。 VPC直连的高速访问通道，目前只支持访问在线服务。因流量限控，获取在线服务的IP和端口号次数有限制，每个主账号租户调用次数不超过2000次/分钟，每个子账号租户不超过20次/分钟。目前仅支持自定义镜像导入模型，部署的服务支持高速访问通道。操作步骤使用V

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
通过VPC高速访问通道的方式访问在线服务 - AI开发平台ModelArts

只有专属资源池部署的服务才支持VPC直连的高速访问通道。 VPC直连的高速访问通道，目前只支持访问在线服务。因流量限控，获取在线服务的IP和端口号次数有限制，每个主账号租户调用次数不超过2000次/分钟，每个子账号租户不超过20次/分钟。目前仅支持自定义镜像导入模型，部署的服务支持高速访问通道。操作步骤使用V

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的访问通道
使用AI Gallery的订阅算法实现花卉识别 - AI开发平台ModelArts

定”，完成训练作业创建。进入“训练管理 > 训练作业”页面，等待训练作业完成。训练作业运行需要几分钟时间，请耐心等待。根据经验，选择样例数据集，使用GPU资源运行，预计3分钟左右可完成。当训练作业的状态变更为“已完成”时，表示已运行结束。您可以单击训练作业名称，进入详情页

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例
约束与限制 - AI开发平台ModelArts

算法。训练作业卡死检测目前仅支持资源类型为GPU的训练作业。仅使用新版专属资源池训练时才支持设置训练作业优先级。公共资源池和旧版专属资源池均不支持设置训练作业优先级。仅支持PyTorch和MindSpore框架的分布式训练和调测，如果MindSpore要进行多机分布式训练调试，则每台机器上都必须有8张卡。

帮助中心 > AI开发平台ModelArts > 产品介绍
VS Code连接开发环境失败故障处理 - AI开发平台ModelArts

Code Server locally"超过10分钟以上，如何解决？连接远端开发环境时，一直处于"Setting up SSH Host xxx: Copying VS Code Server to host with scp"超过10分钟以上，如何解决？远程连接处于retry状态如何解决？

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境
查询资源实时利用率 - AI开发平台ModelArts

String UTC时间，格式yyyy-MM-dd'T'HH:mm:ss'Z'。 window String 统计间隔，1s表示1秒，1m表示1分钟，1h为1小时。表6 Capacity 参数参数类型描述 value Value object 资源量。 maxValue Value

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
使用AWQ量化 - AI开发平台ModelArts

split="validation") 运行“examples/quantize.py”文件进行模型量化，量化时间和模型大小有关，预计30分钟~3小时。 pip install transformers sentencepiece #安装量化工具依赖 export ASCEND_

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.906） > 推理模型量化
配置Workflow的输入输出目录 - AI开发平台ModelArts

配置Workflow的输入输出目录功能介绍统一存储主要用于工作流的目录管理，帮助用户统一管理一个工作流中的所有存储路径，主要分为以下两个功能：输入目录管理：开发者在编辑开发工作流时可以对所有数据的存储路径做统一管理，规定用户按照自己的目录规划来存放数据，而存储的根目录可以根

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考
使用AWQ量化工具转换权重 - AI开发平台ModelArts

split="validation") 运行“examples/quantize.py”文件进行模型量化，量化时间和模型大小有关，预计30分钟~3小时。 pip install transformers sentencepiece #安装量化工具依赖 export ASCEND_

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906） > 推理模型量化
查看ModelArts模型详情 - AI开发平台ModelArts

可以查看模型的apis定义详情，以及模型的入参和出参。运行时依赖查看模型对环境的依赖。当构建任务失败后可以编辑运行时依赖，保存修改后将触发镜像重新构建。事件展示模型创建过程中的关键操作进展。事件保存周期为3个月，3个月后自动清理数据。查看模型的事件类型和事件信息，请参见查看ModelArts模型事件

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理ModelArts模型
推理性能测试 - AI开发平台ModelArts

enchmark的并发数（parallel-num参数）或动态benchmark的请求频率（request-rate参数）较高，会触发推理平台的流控，请在ModelArts Standard“在线服务”详情页修改服务流量限制。同步请求时，平台每次请求预测的时间不能超过60秒。例

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910）
推理性能测试 - AI开发平台ModelArts

enchmark的并发数（parallel-num参数）或动态benchmark的请求频率（request-rate参数）较高，会触发推理平台的流控，请在ModelArts Standard“在线服务”详情页修改服务流量限制。同步请求时，平台每次请求预测的时间不能超过60秒。例

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）
推理性能测试 - AI开发平台ModelArts

enchmark的并发数（parallel-num参数）或动态benchmark的请求频率（request-rate参数）较高，会触发推理平台的流控，请在ModelArts Standard“在线服务”详情页修改服务流量限制。同步请求时，平台每次请求预测的时间不能超过60秒。例

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908）
推理性能测试 - AI开发平台ModelArts

enchmark的并发数（parallel-num参数）或动态benchmark的请求频率（request-rate参数）较高，会触发推理平台的流控，请在ModelArts Standard“在线服务”详情页修改服务流量限制。同步请求时，平台每次请求预测的时间不能超过60秒。例

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909）
使用AWQ量化 - AI开发平台ModelArts

toAWQ bash build.sh 运行“examples/quantize.py”文件进行模型量化，量化时间和模型大小有关，预计30分钟~3小时。 pip install transformers==4.41.0 # AutoAWQ未适配transformers 4.42以上

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
使用AWQ量化 - AI开发平台ModelArts

toAWQ bash build.sh 运行“examples/quantize.py”文件进行模型量化，量化时间和模型大小有关，预计30分钟~3小时。 pip install transformers==4.41.0 # AutoAWQ未适配transformers 4.42以上

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911） > 推理模型量化
训练作业重调度 - AI开发平台ModelArts

训练作业重调度当训练作业发生故障恢复时（例如进程级恢复、POD级重调度、JOB级重调度等），作业详情页面中会出现“故障恢复详情”页签，里面记录了训练作业的启停情况。在ModelArts管理控制台的左侧导航栏中选择“模型训练 > 训练作业”。在训练作业列表中，单击作业名称进入训练作业详情页面。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 模型训练高可靠性
使用AWQ量化 - AI开发平台ModelArts

toAWQ bash build.sh 运行“examples/quantize.py”文件进行模型量化，量化时间和模型大小有关，预计30分钟~3小时。 pip install transformers==4.41.0 # AutoAWQ未适配transformers 4.42以上

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910） > 推理模型量化
查询服务监控信息 - AI开发平台ModelArts

service_instance_count Integer 服务实例数量。 req_count_per_min Long 服务分钟调用量，这里指当前时间上一分钟的服务调用总量。表5 Monitor 参数参数类型描述 failed_times Integer 模型实例调用失败次数，在线服务字段。

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
使用ModelArts Standard一键完成商超商品识别模型部署 - AI开发平台ModelArts

参数后，单击“提交”启动在线服务的部署。任务提交成功后，单击“查看任务详情”，等待服务状态变为“运行中”时，表示服务部署成功。预计时长4分钟左右。步骤4：预测结果在线服务部署完成后，单击“预测”页签。在“预测”页签，单击“上传”，上传一个测试图片，单击“预测”查看预测结果。此处提供一个样例图片供预测使用。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例

总条数： 358

上一页
1
...
4
5
6
...
18
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

ModelArts Standard推理服务支持VPC直连的高速访问通道配置 - AI开发平台ModelArts

通过VPC高速访问通道的方式访问在线服务 - AI开发平台ModelArts

使用AI Gallery的订阅算法实现花卉识别 - AI开发平台ModelArts

约束与限制 - AI开发平台ModelArts

VS Code连接开发环境失败故障处理 - AI开发平台ModelArts

查询资源实时利用率 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

配置Workflow的输入输出目录 - AI开发平台ModelArts

使用AWQ量化工具转换权重 - AI开发平台ModelArts

查看ModelArts模型详情 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

训练作业重调度 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

查询服务监控信息 - AI开发平台ModelArts

使用ModelArts Standard一键完成商超商品识别模型部署 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线