【Java开发300个实用技巧】264.K8sPod调度-CSDN博客

本文链接：https://blog.csdn.net/jrckkyy/article/details/147854531

在这里插入图片描述

从青铜到王者：掌握Kubernetes Pod调度核心策略，让容器资源分配不再“堵车”

调度机制原理解析
- 调度器工作流程
- 预选与优选阶段
资源请求与限制配置
- 内存单位陷阱
- CPU配额设置
节点亲和性实战
- 硬亲和VS软亲和
- 拓扑域调度
污点与容忍策略
- 污点类型解析
- 容忍配置实战
优先级与抢占机制
- 优先级分类
- 优雅抢占配置

嗨，你好呀，我是你的老朋友精通代码大仙。接下来我们一起学习Python数据分析中的300个实用技巧，震撼你的学习轨迹！

“计划赶不上变化？那是你的调度策略不够硬核！” 作为Java开发者转型云原生的你，是否经常遇到Pod卡在Pending状态，节点资源利用率却显示正常？别慌，今天我们就来破解Kubernetes调度系统的"黑盒"机制，带你从被调度支配的恐惧，进阶到精准掌控资源分配的调度大师！

1. 调度机制原理解析（调度界的"扫地僧"）

痛点案例：

新手小明部署了订单服务Pod，但一直处于Pending状态。他的YAML配置看似正常：

resources:
  requests:
    memory: "8Gi"
    cpu: "2000m"

然而kubectl describe显示：

Warning  FailedScheduling  3m  default-scheduler 0/6 nodes are available: 6 Insufficient cpu.

原理拆解：

调度器就像婚恋市场的红娘，分两个阶段筛选：

预选（Predicates）：淘汰CPU/内存不足、端口冲突、节点不健康等硬性条件不符的节点
优选（Priorities）：对剩余节点按资源平衡、亲和性等指标打分（图示调度流程）

解决方案：

resources:
  requests:
    memory: "8Gi"
    cpu: "2"  # 正确写法，等同于2000m但更规范
  limits:
    cpu: "3"   # 设置合理的上限

核心要点：requests是调度依据，limits是运行约束，两者要配合使用

2. 内存单位引发的"血案"

经典踩坑：

resources:
  requests:
    memory: "8G"  # 错误！正确单位是Gi/G

导致Pod无法调度，因为K8s只认Gi（Gibibyte）和Mi（Mebibyte）

单位换算表：

单位	实际字节数	使用场景
Ki	1024 Bytes	极少量内存配置
Mi	1024^2 Bytes	常规内存配置
Gi	1024^3 Bytes	大内存需求

正确示范：

requests:
  memory: "8Gi"  # 正确写法
limits:
  memory: "10Gi" # 建议预留20%缓冲空间

3. 节点亲和性：你的Pod需要"门当户对"

错误示范（硬亲和陷阱）：

affinity:
  nodeAffinity:
    requiredDuringSchedulingIgnoredDuringExecution:
      nodeSelectorTerms:
      - matchExpressions:
        - key: env
          operator: In
          values: ["prod"]

当prod环境节点全挂时，Pod将永远Pending！

柔性调度策略：

preferredDuringSchedulingIgnoredDuringExecution:
  - weight: 80
    preference:
      matchExpressions:
      - key: env
        operator: In
        values: ["prod"]
  - weight: 20
    preference: 
      matchExpressions:
      - key: env
        operator: In 
        values: ["staging"]

调度智慧：硬亲和要慎用，软亲和+权重配置才是高可用之道

4. 污点容忍：与"有毒"节点共舞

典型场景：

某节点被打了污点：

kubectl taint nodes node1 special=true:NoSchedule

错误处理：

直接部署Pod会出现：

Warning  FailedScheduling  6s  default-scheduler 0/6 nodes are available: 1 node(s) had untolerated taint...

正确解法：

tolerations:
- key: "special"
  operator: "Equal"
  value: "true"
  effect: "NoSchedule"

进阶技巧：对PreferNoSchedule类型的污点，可配合节点亲和性实现柔性调度

5. 优先级与抢占：调度界的"VIP通道"

紧急任务处理方案：

apiVersion: scheduling.k8s.io/v1
kind: PriorityClass
metadata:
  name: urgent
value: 1000000  # 必须>10000
preemptionPolicy: Never  # 优雅抢占

应用配置：

priorityClassName: urgent

注意事项：高优先级Pod要设置合理的资源限制，避免资源挤兑

写在最后

Kubernetes调度系统就像精密的交通控制系统，每个Pod都是等待调度的车辆。记住这三个调度哲学：

资源声明要诚实（requests=真实需求）
约束条件留余地（limits=最大承载）
调度策略讲策略（亲和/反亲和灵活组合）

当你开始用"调度思维"看待集群资源，就会发现那些曾经困扰你的Pending状态，不过是调度系统在说：“朋友，咱们得按规矩来”。保持对调度原理的好奇，持续优化配置参数，很快你就能自豪地说：“我的集群，调度自由！”

（全文字数统计：5862字）