1. Kubernetes理论介绍
1.1 应用部署方式演变
在部署应用程序的方式上,主要经历了三个时代:
-
传统部署:互联网早期,直接将应用程序部署在物理机上
优点:简单,不需要其它技术的参与
缺点:不能为应用程序定义资源使用边界,很难合理地分配计算资源,而且程序之间容易产生影响
-
虚拟化部署:可以在一台物理机上运行多个虚拟机,每个虚拟机都是独立的一个环境
优点:程序环境不会相互产生影响,提供了一定程度的安全性
缺点:增加了操作系统,浪费了部分资源
-
容器化部署:与虚拟化类似,但是共享了操作系统
优点:
容器之间可以共享操作系统
每个容器拥有自己的文件系统、CPU、内存、进程空间等
运行应用程序所需要的资源都被容器包装,并和底层基础架构解耦
容器化的应用程序可以跨云服务商、跨Linux操作系统发行版进行部署
缺点:
隔离性差:容器属于进程之间的隔离,隔离性较弱
安全性差:容器共享宿主机内核,如果宿主机操作系统存在漏洞,容器可能受到威胁
容器化部署方式给带来很多的便利,但也会出现一些问题,比如说:
- 一个容器故障停机了,怎么样让另外一个容器立刻启动去替补停机的容器
- 当并发访问量变大的时候,怎么样做到横向扩展容器数量
这些容器管理的问题统称为容器编排问题,为了解决这些容器编排问题,就产生了一些容器编排的软件:
- Swarm:Docker官方的容器编排工具
- Mesos:Apache的一个资源统一管控的工具,需要和Marathon结合使用
- Kubernetes:Google开源的的容器编排工具
1.2 kubernetes简介
kubernetes,是谷歌于2014年9月发布的一个开源的容器集群管理系统,简称k8s,2015年7月发布第一个正式版本。
官方地址:https://kubernetes.io/zh-cn/
kubernetes的本质是一组容器服务器集群,用于容器化应用程序的部署,扩展和管理。目的是让部署容器化应用简单而且高效。主要提供了以下功能:
- 资源调度:按照预定的调度策略将Pod调度到相应的node节点上
- 自我修复:一旦某一个容器崩溃,能够迅速启动新的容器,保证预期的副本数量
- 弹性伸缩:可以根据需要,自动对集群中正在运行的容器数量进行调整
- 服务发现:服务可以通过自动发现的形式找到它所依赖的服务
- 负载均衡:如果一个服务启动了多个容器,能够自动实现请求的负载均衡
- 滚动更新:更新服务不中断,一次更新一个Pod,而不是同时删除整个服务
- 存储编排:可以根据容器自身的需求自动创建存储卷,也可以挂载外部存储系统,比如NFS,GlusterFS,Ceph,也可以是公有云
- 批处理:提供一次性任务和周期性任务,满足批量数据处理和分析的场景
1.3 kubernetes组件
一个kubernetes集群主要是由控制节点(master)、工作节点(node)构成,每个节点上都会安装不同的组件。
master:集群的控制平面,负责集群的决策 ( 管理节点 )
kube-apiserver : k8s的中心,管理集群的入口。接收用户输入的命令,提供各种资源的认证、授权、API注册和发现等机制;
kube-scheduler : 负责集群资源调度,按照预定的调度策略将Pod调度到相应的node节点上;
kube-controller-manager:是一个控制器管理器,负责维护集群的状态,比如Pod副本期望数量、故障检测、自动扩展、滚动更新等;
Node Controller(节点控制器):用于监视和管理集群中的节点,包括节点的注册、健康状态的监测和维护;
Replication Controller (副本控制器):负责保证集群中一个资源对象RC (Replication Controller) 所关联的Pod数量;
Endpoints Controller (端点控制器) :连接Service和Pod,负责监听 Service 和对应的Pod副本的变化;可以理解端点是一个服务暴露出来的访问点,如果需要访问一个服务,则必须知道它的endpoint;
Service Account & Token Controllers ( 服务帐户和令牌控制器) :为新的命名空间创建默认帐户和API访问令牌;
Namespace Controller(命名空间控制器):管理命名空间的生命周期;
Service Controller(服务控制器):属于 K8S 集群与外部的云平台之间的一个接口控制器;
Etcd:是一个分布式键值存储系统,负责存储集群中各种资源对象的信息;
node:集群的数据平面,负责为容器提供运行环境 ( 工作节点 )
Kubelet : 真正运行容器的组件,运行在每个node节点上,与 master 节点通信,负责维护容器的生命周期,即创建、更新、销毁容器;
Kube-proxy : 实现pod网络代理,负责提供集群内部的服务发现和负载均衡;
Container runtime:提供容器的运行环境。Kubernetes 支持许多容器运行环境,例如containerd、Docker CE、CRI-O 和其他实现 Kubernetes CRI (容器运行环境接口)的运行时。
1.4 启动pod的流程
以部署一个nginx服务为例
- 首先要明确,一旦kubernetes环境启动之后,master节点 和 node节点 都会将自身的信息存储到etcd数据库中;
- 一个nginx服务的安装请求会首先被发送到master节点的apiServer组件;
- apiServer组件会调用scheduler组件来决定到底应该把这个服务安装到哪个node节点上;
- 此时,scheduler组件会从etcd中读取各个node节点的信息,然后按照一定的算法进行选择,并将结果告知apiServer;
- apiServer通知controller-manager去调度Node节点安装nginx服务;
- kubelet接收到指令后,会通知docker,然后由docker来启动一个nginx的pod,pod是kubernetes的最小操作单元,容器必须跑在pod中;
- 至此,一个nginx服务就运行了,通过kube-proxy给pod分配网络资源,包括服务的发布以及负载均衡的配置等;
这样,外界用户就可以访问集群中的nginx服务了。
1.5 kubernetes概念
Master:集群控制节点,每个集群至少需要一个master节点负责集群的管理
Node:工作负载节点,由master分配容器到node工作节点上,负责容器的运行
Pod:kubernetes的最小控制单元,容器都是运行在pod中的,一个pod中可以有一个或者多个容器,pod中的容器共享网络、存储等资源;
kube-controller-manager:负责管理各种控制器,监控集群状态,以及确保集群中的实际状态与期望状态保持一致
-
ReplicaSet:副本控制器,确保预期的pod副本数量
-
Deployment:无状态应用部署(数据不会在本地持久化存储),是一种资源对象,用于管理Pod和ReplicaSet,通过控制ReplicaSet来控制Pod,并支持滚动升级、版本回退
-
StatefulSet:有状态应用部署(数据在本地持久化存储)
-
DaemonSet:确保所有Node都运行同一个pod副本,一般用于守护进程类的任务
-
Horizontal Pod Autoscaler(HPA):可以根据集群负载自动调整Pod的数量,实现削峰填谷
-
Job:它创建出来的Pod只要完成任务就立即退出,用于执行一次性任务
-
CronJob:它创建的Pod会周期性的执行,用于执行周期性的任务
RS、Deployment、DaemonSet都是面向无状态的服务,它们所管理的Pod的IP、名字,启停顺序等都是随机的。
StatefulSet管理有状态的服务,它所管理的Pod拥有固定的Pod名称,启停顺序,比如MySQL、MongoDB集群等。
Service:是应用服务的抽象,pod对外服务的统一入口,可以维护同一类的多个pod。
Label:给某个资源对象添加标识,用来对它们进行区分和选择。Label可以附加到各种资源对象上,例如node,pod,service等;
NameSpace:命名空间,用来隔离pod的运行环境。
CoreDNS: Kubernetes 集群中用于域名解析(DNS)的服务。作用是将 Pod 名称和 Service 名称解析为相应的 IP 地址,从而实现在集群内部进行服务发现和网络通信。
Dashboard: 是一个用于可视化管理和监控 Kubernetes 集群的 Web 用户界面。
总结:整理不易,如果对你有帮助,请记得点赞,关注,收藏。更多kubernetes相关知识持续分享中。