检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
应用场景 大数据、AI计算 当前主流的大数据、AI训练和推理等应用(如Tensorflow、Caffe)均采用容器化方式运行,并需要大量GPU、高性能网络和存储等硬件加速能力,并且都是任务型计算,需要快速申请大量资源,计算任务完成后快速释放。 云容器实例提供如下特性,能够很好的支持这类场景。
您可以使用弹性文件服务作为容器的持久化存储,在创建任务负载的时候挂载到容器上。 弹性云服务器 弹性云服务器(Elastic Cloud Server)是一种可随时自助获取、可弹性伸缩的云服务器,帮助用户打造可靠、安全、灵活、高效的应用环境。 云容器实例通过ECS将数据导入到SFS,进而供容器业务使用。 NAT网关
Server服务的Pod里使用一个Init Container,去检查数据库是否准备好,直到数据库可以连接,Init Container才结束退出,然后Web Server容器被启动,发起正式的数据库连接请求。 初始化配置:比如集群里检测所有已经存在的成员节点,为主容器准备好集群的配置信息,这样主容器起来后就能用这个配置信息加入集群。
Precondition Failed 未满足前提条件,服务器未满足请求者在请求中设置的其中一个前提条件。 413 Request Entity Too Large 由于请求的实体过大,服务器无法处理,因此拒绝请求。为防止客户端的连续请求,服务器可能会关闭连接。如果只是服务器暂时无法处理,则
- 最大无效实例数)。 替换升级:先删除旧实例,再创建新实例。升级过程中业务会中断。 客户端DNS配置:负载支持替换域名解析配置和追加域名解析配置,参数设置请参见客户端DNS配置。 配置完成后,单击“下一步:规格确认”,单击“提交”,单击“返回无状态负载列表”。 在负载列表中,待负
此种问题的解决方案是:重新创建工作负载,并配置正确的启动命令。 排查项三:工作负载配置的健康检查执行失败 工作负载如果配置liveness型(工作负载存活探针)健康检查,当健康检查失败次数超过阈值时,会重启实例中的容器。在工作负载详情页面查看事件,如果K8S事件中出现“Liveness probe failed:
/persistentvolumeclaims/{name} 表1 Path参数 参数 是否必选 参数类型 描述 namespace Yes String 命名空间。 name Yes String persistentvolumeclaims名称 表2 Query参数 参数 是否必选
xx,说明已经就绪。 需要为pod配置以下annotation使超时时间(timeoutSeconds)生效: cci.io/httpget-probe-timeout-enable:"true" 具体请参见Liveness Probe高级配置样例。 Exec:probe执行容器
PersistentVolumeClaim Object 详情请参见表175。 PersistentVolume Object 详情请参见表184。 StorageInfo Object 详情请参见表199。 响应示例 [ { "persistentVolumeClaim": {
}/extended-persistentvolumeclaims 表1 Path参数 参数 参数类型 描述 namespace String 命名空间。 请求消息 请求参数 表2 PersistentVolumeClaim v1 数据结构说明 参数 是否必选 参数类型 描述 apiVersion
"restartPolicy": "OnFailure", "template": { "spec": { "containers": [
过Virtual Kubelet弹到CCI时,会被vk-webhook拦截。如无法改变Pod spec.volumes中配置的HostPath,当前可通过配置Annotation的形式,允许让使用HostPath的Pod弹性到CCI上,但是VK在校验时需要去掉Pod中的HostP
"cleanPodPolicy": "Running", "jobMode": "MXTrain", "mxReplicaSpecs": { "Scheduler": { "replicas":
创建TFJob。 TFJob即Tensorflow任务,是基于Tensorflow开源框架的kubernetes自定义资源类型,有多种角色可以配置,能够帮助我们更简单地实现Tensorflow的单机或分布式训练。Tensorflow开源框架的信息详见:https://www.tensorflow
从负载开始创建到公网可以正常访问可需要1分钟到3分钟的时间,在此时间内网络路由尚未完成配置,请稍作等待。 负载创建3分钟以后仍然无法访问。在“工作负载 -> 查看您创建的负载详情-> 选择访问配置 -> 选择访问事件”,查看访问事件,查看是否有告警事件。如下两种情况为无法访问公网的事件。
数据保护技术 云容器实例同时具备容器级别的启动速度和虚拟机级别的安全隔离能力,提供更好的容器体验。 原生支持Kata Container 基于Kata的内核虚拟化技术,为您提供全面的安全隔离与防护 自有硬件虚拟化加速技术,让您获得更高性能的安全容器 图1 通过Kata容器实现多租户容器强隔离
容器内存分配失败的累积计数 container_memory_failcnt 容器内存使用达到限制的次数 container_memory_cache 容器总页缓存内存(单位:字节) container_memory_mapped_file 容器内存映射文件的大小(单位:字节) container_me
Pod 什么是Pod Pod是Kubernetes创建或部署的最小单位。一个Pod封装一个或多个容器(container)、存储资源(volume)、一个独立的网络IP以及管理控制容器运行方式的策略选项。 Pod使用主要分为两种方式: Pod中运行一个容器。这是Kubernete
within a shell. container 否 String Container in which to execute the command. Defaults to only container if there is only one container in the pod
within a shell. container 否 String Container in which to execute the command. Defaults to only container if there is only one container in the pod