kube-proxy日志，使用的是ipvs模式，iptables模式是可以的，切换到ipvs模式就不行了解决思路

最新推荐文章于 2025-06-04 23:14:38 发布

风水道人

最新推荐文章于 2025-06-04 23:14:38 发布

阅读量381

点赞数 5

分类专栏： k8s 文章标签： kubernetes 网络容器云原生

本文链接：https://blog.csdn.net/jcmj123456/article/details/148253307

版权

k8s 专栏收录该内容

61 篇文章

订阅专栏

针对 IPVS 模式下出现的 IP 解析错误问题（parseIP Error），结合日志中 IPv4 地址被错误解析为 IPv6 格式的现象，以下是系统性解决方案：

1. 根本原因定位

日志中的错误格式 ip=[10 244 2 18 0 0 0 0 0 0 0 0 0 0 0 0] 表示 IPv4 地址被错误填充为 16 字节的 IPv6 结构，表明 kube-proxy 在解析 IP 时发生协议栈混淆。常见原因：

双栈配置冲突：集群误启用 IPv6 双栈但未正确配置。
kube-proxy 版本缺陷：旧版本对 IPVS 模式下的 IPv4 处理存在兼容性问题。
内核模块缺失：IPVS 所需的内核模块未正确加载。
CNI 插件配置异常：错误分配 IP 或网络策略冲突。

2. 关键修复步骤

(1) 强制禁用 IPv6 双栈配置

确保集群完全禁用 IPv6 双栈（除非明确需要）：

# 检查 kube-proxy 的 ConfigMap
kubectl -n kube-system get cm kube-proxy -o yaml

在 data.config.conf 中检查以下配置：

apiVersion: kubeproxy.config.k8s.io/v1alpha1
kind: KubeProxyConfiguration
bindAddress: 0.0.0.0    # 强制绑定 IPv4
clusterCIDR: 10.244.0.0/16  # 确保为 IPv4 地址段
mode: "ipvs"
ipvs:
  strictARP: true       # 避免 ARP 冲突

(2) 加载 IPVS 内核模块

IPVS 依赖内核模块，确认已加载：

# 检查模块加载状态
lsmod | grep -E 'ip_vs|ip_vs_rr|ip_vs_wrr|ip_vs_sh|nf_conntrack'

# 手动加载缺失模块
modprobe ip_vs
modprobe ip_vs_rr
modprobe ip_vs_wrr
modprobe ip_vs_sh
modprobe nf_conntrack

# 永久生效（写入 /etc/modules-load.d/ipvs.conf）
echo -e "ip_vs\nip_vs_rr\nip_vs_wrr\nip_vs_sh\nnf_conntrack" | sudo tee /etc/modules-load.d/ipvs.conf

(3) 升级 kube-proxy 版本

若 kube-proxy 版本低于 v1.23，需升级以修复 IPVS 兼容性问题：

# 查看当前版本
kubectl -n kube-system get pods -l k8s-app=kube-proxy -o jsonpath='{.items[0].spec.containers[0].image}'

# 升级到 v1.26+（示例）
kubectl -n kube-system set image ds/kube-proxy kube-proxy=registry.k8s.io/kube-proxy:v1.26.0

(4) 清理并重建 IPVS 规则

手动清理异常 IPVS 规则，触发 kube-proxy 自动重建：

# 查看当前 IPVS 规则
ipvsadm -Ln

# 删除错误规则（例如 10.96.0.1:443）
ipvsadm -D -t 10.96.0.1:443

# 重启 kube-proxy
kubectl -n kube-system delete pod -l k8s-app=kube-proxy

(5) 验证 CNI 插件兼容性

确保 CNI 插件（如 Calico/Flannel）支持 IPVS 模式：

# 以 Calico 为例，检查配置
kubectl -n kube-system get cm calico-config -o yaml

确认配置中未启用 IPv6 相关参数（如 ipv6_pool），并重启 CNI 插件：

kubectl -n kube-system rollout restart ds calico-node

3. 辅助验证操作

(1) 检查 Service 和 Endpoints

# 查看所有 Service 的 Endpoints
kubectl get endpoints --all-namespaces

# 示例：检查 kube-dns 的 Endpoints
kubectl -n kube-system describe endpoints kube-dns

确保 ENDPOINTS 列显示正确的 IPv4 地址（如 10.244.2.17:53）。

(2) 测试 NodePort 访问

# 使用 NodePort 30080 测试（根据日志中的 Service 端口）
curl -v http://<Node-IP>:30080

若返回连接拒绝，检查 Pod 是否监听端口：

kubectl exec -it <pod-name> -- netstat -tuln | grep <port>

(3) 检查内核日志

dmesg | grep -i ipvs

观察是否有 IPVS 相关错误（如模块加载失败或规则冲突）。

4. 配置示例修正

若问题仍未解决，可尝试以下完整配置模板（以 kube-proxy ConfigMap 为例）：

apiVersion: kubeproxy.config.k8s.io/v1alpha1
kind: KubeProxyConfiguration
bindAddress: 0.0.0.0
clientConnection:
  kubeconfig: /var/lib/kube-proxy/kubeconfig.conf
clusterCIDR: 10.244.0.0/16
mode: "ipvs"
ipvs:
  scheduler: "rr"
  excludeCIDRs: []    # 确保未排除 IPv4 地址段
  strictARP: true
  tcpTimeout: 0s
  tcpFinTimeout: 0s
  udpTimeout: 0s

5. 终极方案：回退并对比

如果仍无法解决，临时回退到 iptables 模式定位问题：

# 修改 kube-proxy ConfigMap 中的 mode 字段
mode: "iptables"

重启 kube-proxy 后观察服务是否恢复。若 iptables 模式正常，说明问题确实与 IPVS 的特定配置或环境有关，需进一步排查内核版本、CNI 插件兼容性等。

总结

此问题的核心在于 kube-proxy 在 IPVS 模式下错误解析 IPv4 地址为 IPv6 格式，通常由双栈配置冲突或组件版本缺陷导致。通过强制 IPv4 绑定、升级组件、加载内核模块和清理规则，可逐步恢复服务。若问题持续，建议提供以下信息进一步排查：

kube-proxy --version
kubectl get nodes -o wide
ipvsadm -Ln 完整输出
CNI 插件的详细配置日志。