检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
设备成员获取结果 订阅终端设备成员信息获取结果。 Topic $hw/events/node/{node_id}/membership/get/result 参数 类型 说明 node_id String 节点ID 使用方式 使用MQTT客户端订阅该Topic,与设备成员获取配对使用。
设备孪生获取结果 订阅设备孪生获取结果。 Topic $hw/events/device/{device_id}/twin/get/result 参数 类型 说明 device_id String 设备ID 使用方式 使用MQTT客户端订阅该Topic,与设备孪生获取配对使用。 参数说明
设备孪生更新结果 订阅设备孪生更新结果。 Topic $hw/events/device/{device_id}/twin/update/result 参数 类型 说明 device_id String 终端设备ID 使用方式 使用MQTT客户端订阅该Topic,与设备孪生更新配对使用。
通过日志检索进行问题定位 通过对已接入的实时日志进行检索定位业务异常问题。 前提条件 已完成数据接入。 已创建导流任务。 操作步骤 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 > 监控服务(ServiceInsight)”。 选择左侧导航栏的“日志 >
Pytorch1.0引擎提示“RuntimeError: std::exception” 问题现象 在使用pytorch1.0镜像时,必现如下报错: “RuntimeError: std::exception” 原因分析 pytorch1.0镜像中的libmkldnn软连接与原生torch的冲突,具体可参看文档。
训练作业的日志出现detect failed(昇腾预检失败) 问题现象 训练启动的日志出现如下相关错误: time="2023-05-27T07:07:08Z" level=error msg="detect failed, error: dsmi-checker detect failed
运行训练代码,出现dead kernel,并导致实例崩溃 在Notebook实例中运行训练代码,如果数据量太大或者训练层数太多,亦或者其他原因,导致出现“内存不够”问题,最终导致该容器实例崩溃。 出现此问题后,系统将自动重启Notebook,来修复实例崩溃的问题。此时只是解决了崩
如何处理使用opencv.imshow造成的内核崩溃? 问题现象 当在Notebook中使用opencv.imshow后,会造成Notebook崩溃。 原因分析 opencv的cv2.imshow在jupyter这样的client/server环境下存在问题。 而matplotlib不存在这个问题。
在Notebook中使用tensorboard命令打开日志文件报错Permission denied 问题现象 在Notebook的Terminal中执行tensorboard --logdir ./命令,报错[Errno 13] Permission denied……。 原因分析
TensorFlow-1.8作业连接OBS时反复出现提示错误 问题现象 基于TensorFlow-1.8启动训练作业,并在代码中使用“tf.gfile”模块连接OBS,启动训练作业后会频繁打印如下日志信息: Connection has been released. Continuing
创建训练作业提示错误码ModelArts.2763 问题现象 创建训练作业时,提示ModelArts.2763 : 选择的支持实例无效,请检查请求中信息的合法性。 原因分析 用户选择的训练规格资源和算法不匹配。 例如:算法支持的是GPU规格,创建训练作业时选择了ASCEND规格的资源类型。
日志提示“Please set the train_url to an empty obs directory” 问题现象 日志提示“Please set the train_url to an empty obs directory”。 原因分析 对于不支持断点训练的模型,若选
本地开发工具说明 本地开发工具包含了微服务引擎2.x的本地轻量化版本,提供用于本地开发的轻量服务中心、配置中心,和简单易用的界面。 使用说明请参考本地开发工具压缩包中的README.md文件。 表1 本地引擎资源配额限制 功能 资源 最大配额 微服务管理 微服务版本数量(个) 10
如何针对本次企业诊断打分 以“运营人员”身份账号登录“数字化诊断后台管理系统” 找到【状态】为【评估完成】的企业工单,点击该企业的【工单号】 点击上方诊断流程中的【评价意见】 填写完成后,点击【提交】即可 父主题: 运营人员业务旅程
重建、停止或删除训练作业 另存为算法 当您需要修改训练作业的算法时,可以在训练作业详情页面右上角,单击“另存为算法”。 在“创建算法”页面中,会自动填充上一次训练作业的算法参数配置,您可以根据业务需求在原来算法配置基础上进行修改。 订阅算法不支持另存为算法。 重建训练作业 当对创
设置无条件自动重启 背景信息 训练过程中可能会碰到预期外的情况导致训练失败,且无法及时重启训练作业,导致训练周期长,而无条件自动重启可以避免这类问题。无条件自动重启是指当训练作业失败时,不管什么原因系统都会自动重启训练作业,提高训练成功率和提升作业的稳定性。为了避免无效重启浪费算
训练日志失败分析 在ModelArts Standard中训练作业遇到问题时,可首先查看日志,多数场景下的问题可以通过日志报错信息直接定位。 ModelArts Standard提供了训练作业失败定位与分析功能,如果训练作业运行失败,ModelArts会自动识别导致作业失败的原因
训练作业卡死检测 什么是训练作业卡死检测 训练作业在运行中可能会因为某些未知原因导致作业卡死,如果不能及时发现,就会导致无法及时释放资源,从而造成极大的资源浪费。为了节省训练资源成本,提高使用体验,ModelArts提供了卡死检测功能,能自动识别作业是否卡死,并在日志详情界面上展
获取应用配置 功能介绍 通过此API获取应用配置信息。 调试 您可以在API Explorer中调试该接口。 URI GET /v2/{project_id}/cas/applications/{application_id}/configuration 表1 路径参数 参数 是否必选