正在生成
详细信息:
检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
AI推理加速型系列:搭载自研昇腾310芯片,为AI推理业务加速。 AI加速型实例总览 AI推理加速增强I型Ai1s AI推理加速I型Ai1 表1 AI加速型实例特点 规格名称 计算 磁盘类型 网络 Ai1s CPU/内存配比:1:4/1:2 vCPU数量范围:2-32 处理器:第二代英特尔®
操作 说明 修改提示语 在“我的提示语 > 我创建的”页面的提示语列表中,单击“操作”列“修改”。 参照表1,修改提示语的基础配置参数。 优化提示语 在“我的提示语 > 我创建的”页面的提示语列表中,单击“操作”列“优化”。 参照表2,配置提示语的调优参数。 删除提示语 单个删除:在“我的提示语
变更弹性云服务规格时,提示系统繁忙,无法成功提交? 问题描述 对已关机的弹性云服务器进行变更规格操作时,提示系统繁忙,无法正常提交变更规格操作。 处理方法 查看当前弹性云服务器所属订单和资源。 如果发现现有订单所属资源已进入保留期,则无法变更规格,需要先续订,才可以进行变更规格操作。
ai_watchdog_ftask_status 表1 ai_watchdog_ftask_status参数 参数 类型 描述 name text 喂狗任务名。 timeout_threshold int 喂狗任务超时阈值。 register_time timestamp 喂狗任务注册时间。
S和SFS。 PersistentVolumeClaim(PVC) Kubernetes提供PVC专门用于持久化存储的申请,PVC可以让您无需关心底层存储资源如何创建、释放等动作,而只需要申明您需要何种类型的存储资源、多大的存储空间。 在实际使用中,您可以通过Pod中的Volum
训练过程中无法找到so文件 问题现象 ModelArts训练作业运行时,日志中遇到如下报错,导致训练失败: libcudart.so.9.0 cannot open shared object file no such file or directory 原因分析 编译生成s
为什么HBase无法写入数据? 问题现象 HBase无法写入数据,导致应用侧业务数据无法及时更新。 原因分析 Zookeeper连接数过多。 处理方法 建议业务代码连接同一个CloudTable HBase集群时,多线程创建并复用同一个Connection,不必每个线程都创建各自
ai_watchdog_monitor_status 表1 ai_watchdog_monitor_status参数说明 参数 类型 描述 metric_name text metric指标名称: tps:TPS。 tps_hourly:每小时的TPS均值。 shared_used_mem:共享内存使用量(MB)。
GPU裸金属服务器无法Ping通如何解决 问题现象 在华为云使用GPU裸金属服务器时, 服务器绑定EIP(华为云弹性IP服务)后,出现无法ping通弹性公网IP现象。 原因分析 查看当前GPU裸金属服务器的安全组的入方向规则的配置,发现仅开通了TCP协议的22端口。 ping命令
ai_watchdog_ftask_status 表1 ai_watchdog_ftask_status参数 参数 类型 描述 name text 喂狗任务名。 timeout_threshold int 喂狗任务超时阈值。 register_time timestamp 喂狗任务注册时间。
ai_watchdog_monitor_status 表1 ai_watchdog_monitor_status参数说明 参数 类型 描述 metric_name text metric指标名称: tps:TPS。 tps_hourly:每小时的TPS均值。 shared_used_mem:共享内存使用量(MB)。
ai_watchdog_monitor_status 表1 ai_watchdog_monitor_status参数说明 参数 类型 描述 metric_name text metric指标名称: tps:TPS。 tps_hourly:每小时的TPS均值。 shared_used_mem:共享内存使用量(MB)。
等待网络删除完成后,删除全局配置。 图7 删除全局配置 打开资源编排服务 RFS资源栈,找到该解决方案创建的资源栈,单击资源栈名称最右侧“删除”按钮,在弹出的“删除资源栈”提示框输入“Delete”,单击“确定”进行解决方案卸载。 图8 解决方案删除 图9 删除确认 父主题: 实施步骤
执行Kafka Topic创建操作时发现无法创建提示“NoNode for /brokers/ids” 问题背景与现象 在使用Kafka客户端命令创建Topic时,发现Topic无法被创建。 kafka-topics.sh --create --replication-factor
编辑Profile时,提示此产品已锁定,无法编辑? 当该产品下已经存在注册设备时,Profile无法编辑,需要将注册设备删除后再进行编辑。 父主题: 产品模型/Profile(联通用户专用)
达到50G,只有默认的10GB,导致作业训练失败。 实际存储空间足够,却依旧报错“No Space left on device”。 同一目录下创建较多文件,为了加快文件检索速度,内核会创建一个索引表,短时间内创建较多文件时,会导致索引表达到上限,进而报错。 触发条件和下面的因素有关:
足。 磁盘配额不足。 处理方法 查看虚拟机所使用的存储空间,再查看回收站文件占用内存,根据实际删除回收站里不需要的大文件。 在Notebook实例详情页,查看实例的存储容量。 执行如下命令,排查虚拟机所使用的存储空间,一般接近存储容量,请排查回收站占用内存。 cd /home/ma-user/work
用户创建AI应用时构建镜像或导入文件失败 问题现象 用户创建AI应用时,构建镜像失败,失败日志中提示下载obs文件失败(Get object size from OBS failed!)。 图1 下载obs文件失败 用户创建AI应用时,事件提示:复制模型文件失败,请检查OBS权限是否正常(Failed
日志提示“ Network is unreachable” 问题现象 在使用pytorch时,将torchvision.models中的pretrained置为了True,日志中出现如下报错: ‘OSError: [Errno 101] Network is unreachable’
实施步骤 准备工作 快速部署 开始使用 快速卸载