检查pod资源使用，pod资源限制

原标题：检查pod资源使用，pod资源限制

导读：

k8s中Pod状态及问题排查方法含义：调度器未能将 Pod 调度到可用节点。可能原因：节点资源不足或 Pod 依赖的资源未准备好。排查ਬ...

k8s中Pod 状态及问题 排查 方法

含义：调度器未能将 pod 调度到可用节点。可能原因：节点资源不足或 POD 依赖的资源未准备好。排查方法：检查节点资源使用情况及资源预留情况，确保集群有足够的 CPU 和其他资源。CrashLoopBackoff 状态：含义：容器在启动后立即崩溃或退出。可能原因：容器配置错误、应用程序错误、内存不足或权限问题。

解决方法：仔细检查Pod的yaml配置文件，确保语法正确且配置合理。可以使用kubectl describe pod 命令查看Pod的详细信息，以获取更多关于错误的信息。总结：Pod状态一直处于Pending通常是由于资源不足、调度问题、镜像拉取问题、权限问题或配置错误等原因导致的。

如果原因是Pod无法安装请求的卷，请确保清单适当地指定其详细信息并确保Pod可以访问存储卷。或者，如果该节点没有足够的资源，则手动从该节点删除Pod，以便将Pod调度到另一个节点上。否则，可以扩展节点资源容量。如果使用NodeSelector安排Pod在Kubernetes集群中的特定节点上运行，就会发生这种情况。

要排查镜像拉取问题，可使用kubectl describe pod命令检查pod事件，寻找“Failed to pull image”或“ImagePullBackOff”事件，表明镜像拉取存在问题。资源不足时，使用kubectl describe node命令检查节点资源状态。检查持久卷（PVC）状态，确保其STATUS为“Bound”，表明存储供应无问题。

调度问题是最常见的原因。如果节点没有足够的资源满足 Pod 的请求（包括有效请求和实际使用的资源），或者节点处于不可调度状态，如因压力或人为原因被封锁，Pod 将被挂起。查看调度事件可以帮助我们理解问题所在，如使用 `kubectl describe pod` 查看详细信息。

K8S故障检查-Pod处于ContainerCreating状态

1、常见导致pod长时间处于“ContainerCreating”状态的原因包括镜像拉取问题、资源不足、持久卷问题、网络问题以及安全上下文或Docker/运行时问题。要排查镜像拉取问题，可使用kubectl describe pod命令检查pod事件，寻找“Failed to pull image”或“ImagePullBackOff”事件，表明镜像拉取存在问题。

2、面对k8s应用卡在ContainerCreating状态的困扰，我通过kubectl describe po命令获取到了关键的日志信息。

3、ContainerCreating：这种情况表示容器正在创建中，常见于配置问题导致的容器创建失败。例如，当使用docker服务时，可能会遇到节点上的kube-proxy、kubelet或docker服务重启后容器仍无法创建的情况。解决这类问题，通常需要检查服务的运行状态，确认资源是否充足，或者是否存在网络、存储配置问题。

4、一个pod的完整创建，通常会伴随着各种事件的产生，k8s种事件的种类总共只有4种：PodStatus 有一组PodConditions。PodCondition中的ConditionStatus，它代表了当前pod是否处于某一个阶段（PodScheduled，Ready，Initialized，Unschedulable），“true” 表示处于，“false”表示不处于。

5、如果创建Pod时状态为ContainerCreating，检查是否需要升级runc版本并重新配置源后重新安装。初始化集群时出现错误，检查crio.conf配置文件，确保配置正确。遇到fs.may_detach_mounts相关错误，调整sysctl配置并重启相关服务。安装与配置kubeovn：修改 install.sh脚本以适应集群环境。

6、在集群部署过程中，可能会遇到问题。例如，如果创建pod时状态为containercreating，检查是否需要升级runc版本并配置源，然后重新安装。初始化集群时出现错误，可能需要编辑crio.conf来解决。另外，遇到fs.may_detach_mounts相关错误，可能是sysctl配置问题，需要调整相关设置后重启CRIO服务。

Node工作 负载 异常,一部分pod状态为Terminating

1、总结：当Node工作负载异常，一部分Pod状态为Terminating时，应首先检查节点状态和集群资源情况，然后尝试使用自动或手动方法删除Terminating状态的Pod。同时，考虑优化发布策略以减少服务中断的风险。

2、Pod删除过程中，如果节点异常，kubernetes会通过kube-Controller-manager和kubelet的驱逐机制调整工作负载。kube-controller-manager负责大范围驱逐，而kubelet则处理细粒度的资源管理。Terminating状态的Pod，可以通过kubectl命令删除，或在资源压力下，kubelet直接驱逐。

3、pod可能运行在因为某种原因发生故障的节点。

pod检查是什么 意思?

1、Pod检查是指检查Podfile.lock文件中列举的所有依赖项的版本是否与新版本匹配的过程。以下是关于Pod检查的详细解释：目的：确保应用程序的所有依赖项都能与新版本的 CocoaPods 兼容。避免依赖项之间的冲突，确保项目的稳定性和流畅性。执行方式：使用终端进入项目目录。键入“pod check”命令，并按下回车键。

2、Pod检查（Pod check）是指检查Podfile.lock文件中列举的所有依赖项的版本是否与新版本匹配的过程。Podfile.lock记录了项目所使用的每个 CocoaPod 版本和它们的依赖关系。Pod check的目的是确保应用程序的所有依赖项都能与新版本的 cocoapods 兼容，并且不出现任何冲突。

3、Pod健康检查是Kubernetes生态系统中确保容器健康运行的关键机制，主要包括存活探测和就绪探测。存活探测：目的：监控容器内部应用程序的健康状态，确保应用程序在异常情况下能被及时重启。实现方式：命令执行：通过执行容器内部的自定义命令，判断应用程序的健康状态。

4、在Kubernetes的生态系统中，Pod健康检查机制是确保容器健康运行的关键。默认情况下，kubelet依据容器运行状态来判断健康，但这不足以监控容器内部应用程序的健康状况，比如程序假死。由此引入了健康检查机制，它通过存活探测（livenessProbe）和就绪探测（readinessProbe）来监控容器的健康状态。

5、生理生化指标的检查是了解植物生长状况的重要手段。其中，检测可溶性糖和可溶性蛋白的含量能够反映植物的营养状况。超氧物歧化酶（SOD）活力的测定有助于评估植物抗氧化能力，这是植物抵御环境压力如干旱、盐害和病害的关键因素。

6、探测的目的：用来维持 pod的健壮性，当pod挂掉之后，deployment会生成新的pod，但如果pod是正常运行的，但pod里面出了问题，此时deployment是监测不到的。

云 原生之K8S中Pod健康检测、服务可用性检查详解

通过容器的IP地址和端口号执行TCP检查，如果能够建立TCP连接，则表明容器健康。资源文件定义访问8080端口，但是8080端口未开放，所以访问会超时，不能建立连接，命中检测，重启Pod 用于判断容器服务是否可用（Ready状态），达到Ready状态的Pod才可以接收请求。

健康检测接口用于检测应用的健康状态，在K8S中，使用Readiness和Liveness分别来探测应用是否就绪和是否存活，如果未就绪或者未存活，K8S会采取相应的措施来确保应用可用。如果我们应用未定义好相应的健康检测接口，K8S就无法判断应用是否正常可用，整个应用对我们来说就是黑匣子，也就谈不上应用稳定性了。

Kubernetes控制器负责保持资源对象状态与期望状态一致。其工作流程包括监听API服务器、获取资源状态、处理资源变更，通过线程安全机制确保稳定性。扩缩容 Kubernetes通过部署、运维机制实现自动扩缩容。强调了健康检查、错误处理和弹性的重要性，确保应用高可用。

使用kubectl进行应用部署的命令详解如下：准备阶段：在部署应用前，需要创建相关资源文件，这通常包括创建yaml文件来定义资源，如Replication Controller、Deployment或DaemonSet。具体命令应用： diff：此命令用于展示当前版本与目标版本之间的差异，仅针对yaml文件进行比较，帮助开发者了解更改的内容。

K8s的核心功能与概念主要功能：包括容器应用的部署、维护、滚动升级，负载均衡与服务发现，集群调度，自动伸缩，广泛的存储支持，以及插件机制以增强系统的可扩展性。核心概念： Container：轻量级虚拟化技术，通过命名空间隔离运行环境，并通过镜像封装应用，解决开发到生产环境一致性问题。

CSI核心流程K8s在创建、挂载和卸载CSI存储卷时，经历以下阶段：创建卷（ProVisioning）：管理员创建Storageclass，指定CSI插件。当用户创建PVC并指定StorageClass时，K8s为PVC添加特定注解。外部Provisioner根据注解创建PV。

搭建一个k8s单机版,yaml已经创建好,但pod状态一直处于pend

1、资源不足：原因：如果集群中的资源不足，Pod可能无法被调度到任何节点上，从而处于Pending状态。解决方法：检查集群的资源使用情况，确保有足够的资源可供Pod使用。可以考虑增加节点或调整Pod的资源请求和限制。调度问题：原因：调度器可能由于某些原因无法找到合适的节点来部署Pod。

2、假设一位机器学习研究人员想要在PyTorch环境中使用基于python的GPU进行测试，她请求她的工程团队提供一个带有两个GPU的Jupyter笔记本，以及她所有的库。然而，工程团队告诉她这需要三天时间，包括获取GPU、创建堆栈以及授予对JupyterHub的访问权限。

3、针对k8s 10版本中coreDNS一直处于pending状态的问题，本文提供了一系列解决方案。首先，需要注意的是，当使用kubeadm init后，关闭cni可以解决部分问题。在进行kubeadm init操作前，应该在其他节点上也执行此操作，确保整个系统的一致性。对于kube-flAnnel.yml文件的修改，是一种推荐的解决方案。

4、当创建Pod时，该Pod保持Pending状态。

5、在Kubernetes（K8s）中，当pod状态显示为“ContainerCreating”，这意味着pod已经由调度器分配至特定节点，该节点的kubelet正在创建容器。在此阶段，系统会进行容器创建操作。一旦所有容器启动并运行，pod状态将从“ContainerCreating”转变为“Running”。

标签：状态 Pod 节点