k8s 基础

简介

K8S（Kubernetes缩写）是容器编排引擎，用于实现自动化运维管理容器。
核心功能：

自动调度：根据容器消耗情况与节点负载情况，自动分配容器到节点上。
自动修复：通过健康检查发现节点问题，自动转移到其他节点完成修复。
自动扩容收缩：预定义负载指标，自动动态扩容与收缩。
服务发现与负载均衡：容器是动态创建，故需要有名字服务和负载均衡。

概念

Pod（容器组）
- 是调度的基本单元，用于存放一组容器及容器的共享资源。
- 共享资源包括：存储、网络（主机名、IP地址）等。
- Pod 单词是豌豆荚，形象表达了容器组的概念。
ReplicaSet（复制集）：
- 用于确保 Pod 的副本数量和状态稳定性。
- 只有两个信息，副本数和 Pod 模板。
- 一般通过 Deployment 来创建 ReplicaSet。
Deployment（部署）：
- 是对应用部署的抽象，在 ReplicaSet 基础上增加滚动升级和回滚。
- 其定义中比 ReplicaSet 增加了滚动更新策略。
- 当用户修改副本数（Scale）时，会与 ReplicaSet 交互，实现扩容。
- 当用户修改 Pod 模版时就会触发滚动更新。
- 滚动更新时会创建一个新的 ReplicaSet，周期性创建新Pod和删除旧Pod。
- Deployment下，所有Pod是完全一样的，也没有顺序。
StatefulSet（有状态集）：
- StatefulSet 是有状态的 Pod 集合。
- 可确保 Pod 的有序创建和更新。
- 可确保每一个 Pod 有稳定的DNS名称。
- 可为每一个 Pod 创建单独的 PVC。
- 适合部署数据库、队列等有主从节点和持久化存储的服务。
Service（服务）：
- Pod 是动态创建且副本数不定，通过 Service 为其提供稳定的访问方式。
- 其定义中包含具体的外部访问方式及其关联的 Pod 选择器。
- 当关联到多组 Pod 时，负载均衡算法默认是轮询，只支持 4 层负载均衡。
- K8S 内置了DNS 服务器，在集群中可以通过 DNS 来访问服务。
- 可以将 Service 映射到外部服务上，通过 DNS。
Namespace（命名空间）：
- 集群内实现逻辑隔离，在同一个物理集群内实现多个虚拟集群。
- 每个资源必须属于一个Namespace，并且在其内部唯一。
Label（标签）：
- 是附加在资源对象上的键值对。
- 对资源进行命名和分类，便于管理和查找。
- 用于引用和筛选资源，如 service 中用来筛选 Pod。
Ingress（入口）：
- 是集群的外部服务入口，用于将外部请求转发到内部服务上。
- 是 7 层的负载均衡器，是对反向代理的抽象，类似 nginx。
PersistentVolume（PV，持久卷）：
- 是对实际物理存储系统的抽象。
- 是物理集群层面的资源，不属于任何命名空间。
- PV 有多种存储方式，如临时目录、主机目录、共享目录。
PersistentVolumeClaim（PVC，持久卷声明）：
- 是用户对存储请求的抽象。
- PVC 与 PV 的关系类似于接口与实现类的关系。
- 请求信息包含存储大小、访问模式等。
- PVC 会绑定和消耗 PV。
- PVC 必须与 Pod 在同一命名空间下才可以被指定使用。
DaemonSet
- 确保在每一个节点上都运行一个 Pod。
- 用于部署守护进程，如监控或日志收集器。
- 集群本身的 kube-proxy 就是一个 DaemonSet 部署。
ConfigMap
- 是一种资源，用于存储 KV 配置信息。
- 可以作为环境变量、命令行参数或挂载到容器中使用。
Secret
- 是一种资源，用于存储敏感信息，如密码、API 密钥等。
- 可以作为环境变量、命令行参数或挂载到容器中使用。

架构原理

架构图及解析

K8S集群：一组虚拟机或物理机，运行了 K8S 的集群。
Master（主节点）：负责集群的管理和调度。
Worker（工作节点）：部署用户容器，提供计算资源。
ETCD：所有资源及状态数据存储的位置。
APIServer：
- 提供 RESTFul API，是集群控制的入口。
- 接口基本是对资源的增删改查和变化监听。
Scheduler（调度器）：
- 监听 APIServer 变化。
- 负责决定将 Pod 放在哪个节点上运行。
- 会充分考虑集群的拓扑结构、节点负载和亲和性。
Controller Manager（控制器）：
- 管理资源，确保集群处于预期状态。
- 每种资源都有对应的控制器。
kubelet：
- 在 Worker 上负责 Pod 的全生命周期管理，同时上报状态到 APIServer。
- CRI：容器运行时接口，cri-dockerd是 docker 的CRI实现。
- CNI：容器网络接口，Flannel是其实现。
- CSI：容器存储接口。
kube-proxy：
- 负责服务转发和负载均衡的实现，对应 service 的功能。
- 以 DaemonSet 方式运行在每个 Worker 上。
- 默认使用 iptables 模式，利用iptables实现转发和四层负载均衡。
- 新版本支持 ipvs，解决iptables线性查找规则的问哦。
- 如果内核版本不够，会降级到 userspace 模式，固定端口进 proxy 进行转发。
kubectl
- 提供命令行工具，调用 APIserver 接口。

网络模型

K8S 的网络原则：
- 提供简单一致的网络视图和使用体验，屏蔽宿主机环境和网络拓扑的复杂度。
K8S 的网络特征：
- 每个 Pod 有一个独立 IP。
- 所有 Pod 通过 IP 直接访问其他 Pod，不管是不是在同一节点上。
- Pod 看自己的 IP 和任意 Pod 或节点看自己的 IP 是一样的。
- Pod 内的容器通过 localhost 访问其他容器。
K8S 网络模型的实现要求：
- Pod 与任意节点的 Pod 通信无需 NAT。
- Node 与 Pod 相互通信无需 NAT。
K8S 网络模型的实现原理：
- Pod 内容器共享同个网络命名空间，通过回环虚拟网卡访问内部容器。
- 相同 Node 的 Pod 之间通过 cni0 网桥进行通信。
- 不同 Node 的 Pod 之间通过网络插件进行通信。
- flannel 插件实现了一个覆盖网络，将 TCP数据包装在另外一网络包里进行路由转发和通信。

Pod 原理

Pod 状态：
- Pending：APIServer 已经创建，Pod 内还有至少一个容器没有创建，包括下载镜像的过程。
- Running：Pod 内所有容器均已创建，至少有一个处于运行中。
- Succeeded：Pod 内所有容器均已成功退出，且不会重启。
- Failed：Pod 内所有容器均已退出，但至少有一个容器退出时状态非 0。
- Unknown：无法取得该 Pod 状态，可能由于网络原因。
Pod 重启策略：
- Always：默认策略，当容器退出后总是重启。
- OnFailure：退出状态码非 0 时才重启。
- Never：只要退出就不重启。
Pod 的镜像拉取策略：
- IfNotPresent：默认值，如果本地有镜像，则直接使用，否则从仓库拉取。
- Always：总是重新拉取，每次创建 Pod 都会重新拉取。
- Never：永远不自动拉取，如果 Node 不存在则启动失败。
Pod 的探针方式：
- httpGet：发 HTTP 请求返回 200-400 为成功
- exec：在容器内执行 shell 命令，根据命令退出状态 0 为健康。
- TCPSocket：与容器的 IP 端口建立TCP 连接，能建立为成功。
Pod 的探针类型：
- 存活探针（LivenessProbe），用于检测容器健康情况，如果失败 kubelet 会杀掉容器根据容器重启策略决定是否重启。
- 就绪探针（ReadinessProbe），用于检测容器是否准备好接受流量，可以用于确保程序启动后的数据加载，如果失败 service 不会转发请求。
- 启动探针（StartupProbe），适用于初始化时间较长的程序，一旦满足条件后不再执行。存在目的是暂时屏蔽其他探针。
直接创建 Pod 的过程：
- 用户通过kubectl或api提交 Pod 信息到 APIServer。
- APIServer验证用户权限，创建 Pod 信息到 ETCD 则返回确认。
- APIServer反馈 ETCD 中Pod的变化，其他组件监听变化。
- 调度器发现了未分配节点的 Pod，为其分配最佳的节点，结果更新到 APIServer。
- Node 上的 kubelet 监听到变化，检查是否存在，不存在则创建。
- 如果需要挂载外部存储，则通过 CSI挂载外部存储。
- 通过 CNI 配置网络，然后启动容器，完成后反馈 APIServer。
通过 Deployment 创建Pod 过程：
- kubectl apply 一个 Deployment。
- APIServer验证用户权限，创建Deployment 信息到 ETCD 则返回确认。
- Deployment 控制器监听到变化会创建ReplicaSet。
- ReplicaSet 控制器监听到变化则会按照其模板创建 Pod。
- 未分配节点的 Pod，后续过程与直接创建 Pod 的过程一样。
- Deployment 创建的Pod，ReplicaSet 控制器会持续关注确保数量。
Pod 的容器类型：
- 应用容器：运行业务引用程序，多个时并行启动。
- Init 容器：可以有多个，在应用容器启动前串行启动。
- Pause 容器：在 pod 内第一个启动，用于设置网络，生命周期与 Pod 相同。
- SideCar 容器：只是一种设计模式，把业务无关的功能剥离出来通过辅助容器实现。
Pod 的亲和性调度：
- 确保 Pod 运行在特定类型的节点上，如 SSD存储节点或 GPU 节点。

命令行

#查看帮助，中文文档: http://docs.kubernetes.org.cn/683.html
kubectl --help

#查看k8s版本
kubectl version

#查看资源清单及简写
kubectl api-resources

#查看集群信息
kubeclt cluster-info

#通过 yaml 创建资源如果存在会返回错误，不建议使用
kubectl create -f xx.yaml

#通过 yaml 创建或更新资源，如果存在则更新
kubectl apply -f xx.yaml

# 查看资源信息，格式：
# kubectl get <resource> [-o wide|json|yaml] [-n namespace]
kubectl get nodes #查看节点
kubectl get cs #查看各组件状态
kubectl get all -A #查看所有命名空间下的所有资源
kubectl get pod -A -w -o wide #查看所有命名空间下的Pod，实时更新，显示详细信息
kubectl get all -n kubernetes-dashboard #查看命名空间下所有的资源
kubectl get svc -n kubernetes-dashboard #查看命名空间下的服务
kubectl get deploy nginx -o=yaml --export > nginx.yaml #将 deployment 输出到文件


# 描述资源的详细信息
kubectl describe deploy kubernetes-dashboard -n kubernetes-dashboard

helm

helm是一个包管理工具，可以用来管理kubernetes应用。
helm是舵轮的意思，kubernetes 是舵手。
文档：https://helm.sh/zh/docs/

helm 安装

curl -fsSL -o get_helm.sh https://raw.githubusercontent.com/helm/helm/main/scripts/get-helm-3
chmod 700 get_helm.sh
./get_helm.sh

k8s 基础

TTS

k8s 基础

简介

概念

架构原理

架构图及解析

网络模型

Pod 原理

命令行

helm

helm 安装