猫头虎分享云原生疑难杂Bug：FailedScheduling —— “No nodes are available that match all of the following predic-CSDN博客

猫头虎分享云原生疑难杂Bug：FailedScheduling 🚨 —— “No nodes are available that match all of the following predicates: Insufficient memory” 🛠️全面解决方案

今天猫头虎带您解决一个开发中经常遇到的云原生调度问题：FailedScheduling 🚀

最近有粉丝提问：「猫哥，我在使用 Kubernetes 部署 Pod 的时候，遇到了 FailedScheduling 的错误，提示 Insufficient memory，这个问题该如何解决呢？」 🤔

别急！本文将以真实开发中遇到的问题为背景，逐步拆解这个 Bug 的原因、解决方法，并提供详细的操作步骤、代码案例，还会通过表格总结最佳实践，帮助大家彻底掌握这类问题的解决技巧。📝

猫头虎是谁？

大家好，我是猫头虎，猫头虎技术团队创始人，也被大家称为猫哥。我目前是COC北京城市开发者社区主理人、COC西安城市开发者社区主理人，以及云原生开发者社区主理人，在多个技术领域如云原生、前端、后端、运维和AI都具备丰富经验。

我的博客内容涵盖广泛，主要分享技术教程、Bug解决方案、开发工具使用方法、前沿科技资讯、产品评测、产品使用体验，以及产品优缺点分析、横向对比、技术沙龙参会体验等。我的分享聚焦于云服务产品评测、AI产品对比、开发板性能测试和技术报告。

目前，我活跃在CSDN、51CTO、腾讯云、阿里云开发者社区、知乎、微信公众号、视频号、抖音、B站、小红书等平台，全网粉丝已超过30万。我所有平台的IP名称统一为猫头虎或猫头虎技术团队。

我希望通过我的分享，帮助大家更好地掌握和使用各种技术产品，提升开发效率与体验。

作者名片 ✍️

博主：猫头虎
全网搜索关键词：猫头虎
作者微信号：Libin9iOak
作者公众号：猫头虎技术团队
更新日期：2024年10月10日
🌟 欢迎来到猫头虎的博客 — 探索技术的无限可能！

加入我们AI共创团队 🌐

猫头虎AI共创社群矩阵列表：
- 点我进入共创社群矩阵入口
- 点我进入新矩阵备用链接入口

加入猫头虎的共创圈，一起探索编程世界的无限可能！ 🚀

部分专栏链接：

🔗 精选专栏：

《面试题大全》 — 面试准备的宝典！
《IDEA开发秘籍》 — 提升你的IDEA技能！
《100天精通鸿蒙》 — 从Web/安卓到鸿蒙大师！
《100天精通Golang（基础入门篇）》 — 踏入Go语言世界的第一步！
《100天精通Go语言（精品VIP版）》 — 踏入Go语言世界的第二步！

文章目录

**猫头虎分享云原生疑难杂Bug**：FailedScheduling 🚨 —— “No nodes are available that match all of the following predicates: Insufficient memory” 🛠️全面解决方案

📌 问题背景

FailedScheduling 是 Kubernetes 中的一个常见错误，通常表明 调度器无法为 Pod 分配合适的节点。
此次错误主要原因是资源限制（例如：Insufficient memory），这是调度 Pod 时资源不足导致的。

🚩 错误提示

Warning  FailedScheduling  pod_name  0/3 nodes are available: 
Insufficient memory.

这个问题不仅会影响服务的正常运行，还会导致部署失败，对生产环境影响极大。接下来，我们分步骤解决这个问题。💡

🐾 原因分析

1️⃣ 调度器资源评估不足

Kubernetes 调度器根据 Pod 的 资源需求（requests 和 limits）决定在哪个节点上运行。当节点内存不足时，Pod 无法调度。

2️⃣ 节点资源耗尽

集群中的节点可能已经超负荷，无法满足新增 Pod 的资源需求。

3️⃣ 资源配额限制

Namespace 设置了资源配额，导致 Pod 的申请超出允许的范围。

🛠️ 解决方法

1️⃣ 检查 Pod 资源请求

首先检查 Pod 的 requests 和 limits 设置，确保它们在合理范围内。

resources:
  requests:
    memory: "512Mi"
    cpu: "500m"
  limits:
    memory: "1Gi"
    cpu: "1"

操作命令：

kubectl describe pod <pod_name>

提示：Pod 的 requests 应符合集群资源实际情况，避免过高或过低。

2️⃣ 增加节点资源

如果节点资源不足，可以尝试水平扩展节点。

新增节点操作：

登录云服务商平台。
增加集群节点数量。
确认新节点加入集群：
```
kubectl get nodes
```

3️⃣ 调整资源配额

检查 Namespace 的 ResourceQuota 设置：

查看命令：

kubectl get resourcequota -n <namespace>

修改配额：

apiVersion: v1
kind: ResourceQuota
metadata:
  name: memory-quota
  namespace: default
spec:
  hard:
    requests.memory: "4Gi"
    limits.memory: "8Gi"

提示：适当调整配额，确保 Pod 能够获得足够的资源。

4️⃣ 启用资源回收

利用 Kubernetes 的 Eviction 机制，自动清理未使用的 Pod，释放节点资源。

设置阈值：

修改 kubelet 的配置文件：

evictionHard:
  memory.available: "200Mi"

重启 Kubelet：

systemctl restart kubelet

📋 常见问题 Q&A

Q1: 如何避免反复调度失败？

设置合理的资源请求值，并监控节点资源，预防性扩容。

Q2: 资源请求如何自动调整？

可以使用 HPA（Horizontal Pod Autoscaler）动态调整。

Q3: 资源不足时是否有临时解决办法？

建议尝试关闭非必要 Pod，或将部分服务转移到其他集群。

📊 总结表格

问题原因	解决方案	操作难度
资源请求过高	降低 Pod 的 `requests` 和 `limits`	⭐⭐
节点资源不足	增加节点或清理未使用资源	⭐⭐⭐
配额限制	调整 Namespace 的资源配额	⭐⭐
内存使用过高的Pod	配置 Eviction 阈值	⭐⭐⭐