DOIK] Kafka & Strimzi Operator (1) - 설치

2022-06-23

🍭 Kafka & Strimzi Operator

1) Kafka란?

비동기식, 스트리밍 플랫폼, 데이터허브 느낌….

무슨 말인지???? 일단 아래부터 이해해 보자!

메시지이벤트차이

메시지 브로커 : 메시지 전송 → 처리 → 삭제
이벤트 브로커 : 메시지 브로커와 유사하지만, 삭제는 없이! 데이터 베이스에 저장하듯이 이벤트 브로커의 큐에 저장!
- 이벤트 하나만 보관하여 인덱스를 통해 개별 액세스 관리
- 필요한 시간 동안에는 이벤트 보존 가능
- 장점👍
  1. 한번 일어난 이벤트 데이터를 브로커에 저장함으로 단일 진실 공급원(Single Source of Truth, SSOT)으로 사용 가능
    (* SSOT : 집약 데이터의 축척은 한곳에서 담당하고 데이터의 활용은 참조 형식으로 다수 사용하는 형태)
  2. 장애 발생 시 장애 발생 시점부터 다시 처리 가능
  3. 많은 양의 실시간 스트림 데이터를 효과적으로 처리 가능

스트림데이터기존데이터

기존 데이터 : 데이터 수집 → 처리 및 구조화 → 구축

💡 keypoint : 시간의 경과에 따라 데이터 일괄 처리
스트림 데이터 : 실시간 이동 데이터의 이용/저장/보강/분석

💡 keypoint : 저장(Storage) & 처리(Processing)

이벤트스트림처리

이벤트 처리 : 시간별로 정렬된 개별 이벤트를 한 번에 하나씩 확인
이벤트 스트림 처리 : 대량 이벤트를 실시간으로 함께 처리

2) Strimzi Operator란?

Strimzi 는 Kubernetes 환경에서 Kafka 운영 관리에 도움을 주는 Operator 다.

Untitled

Stimzi Operator가 배포하는 구성 요소는 다음과 같다.
- Apache ZooKeeper : kafka의 metadata 저장. broker의 health check 담당. 컨트롤러 선택 가능
- Kafka Connect : kafka 클러스터와 다른 시스템 간의 스트리밍 데이터를 연결
- Kafka MirrorMaker : 두 개의 kafka 클러스터 간의 데이터 복제
- Kafka Bridge : HTTP 기반 클라이언트를 kafka 클러스터와 통합하기 위한 API 제공
- Kafka Exporter : 데이터 분석을 위해 prometheus 메트릭으로 추출

📣 kafka에서 자주 사용하는 용어 알기

Untitled (1)

Producer : 데이터를 topic에 담는 역할 (Client)
Consumer : topic에 담긴 데이터를 꺼내감 (Client)
Broker : kafka 애플리케이션이 설치된 서버 또는 노드. mysql 서버와 동일한 역할
Topic : 데이터가 들어가는 공간. 각 이름은 kafka 내에서 고유함
Partition
- 병렬 처리 및 고성능을 얻기 위해 하나의 topic을 여러 개로 나눔 (데이터 분산 처리)
- partition은 늘릴 수 있지만 줄일 수는 없음
- 해시 값을 지정하면 원하는 파티션으로 데이터를 전송할 수 있지만 그렇지 않으면 Round-Robin 방식으로 데이터가 전송됨

💡 Tip ) kafka의 순서 보장

topic partition 1개만 사용
레코드의 메시지 키 사용

3) Strimzi Operator & Kafka 클러스터 생성 실습

kafka 실습구성도 오늘 설치할 kafka의 실습 구성도다.

(1) Strimzi Cluster Operator 설치

namespace 생성

 (🚴|DOIK-Lab:default) root@k8s-m:~# kubectl create namespace kafka
 	namespace/kafka created

repo 추가

 (🚴|DOIK-Lab:default) root@k8s-m:~# helm repo add strimzi https://strimzi.io/charts/
 	"strimzi" has been added to your repositories
 (🚴|DOIK-Lab:default) root@k8s-m:~# helm show values strimzi/strimzi-kafka-operator

Control Plane에 Operator Pod 설치

 (🚴|DOIK-Lab:default) root@k8s-m:~# printf 'tolerations: [{key: node-role.kubernetes.io/master, operator: Exists, effect: NoSchedule}]\n' | \
 helm install kafka-operator strimzi/strimzi-kafka-operator --version 0.29.0 --namespace kafka \
   --set nodeSelector."kubernetes\.io/hostname"=k8s-m --values /dev/stdin

deployment, pod 리소스 확인

 (🚴|DOIK-Lab:default) root@k8s-m:~# kubectl get deploy,pod -n kafka
 	NAME                                       READY   to UP-TO-DATE   AVAILABLE   AGE
 	deployment.apps/strimzi-cluster-operator   1/1     1            1           3m54s
    	
 	NAME                                            READY   STATUS    RESTARTS   AGE
 	pod/strimzi-cluster-operator-555b78d767-tzft6   1/1     Running   0          3m54s

crd 확인

 (🚴|DOIK-Lab:default) root@k8s-m:~# kubectl get crd
 	NAME                                  CREATED AT
 	kafkabridges.kafka.strimzi.io         2022-06-23T14:16:37Z
 	kafkaconnectors.kafka.strimzi.io      2022-06-23T14:16:37Z
 	kafkaconnects.kafka.strimzi.io        2022-06-23T14:16:37Z
 	kafkamirrormaker2s.kafka.strimzi.io   2022-06-23T14:16:37Z
 	kafkamirrormakers.kafka.strimzi.io    2022-06-23T14:16:37Z
 	kafkarebalances.kafka.strimzi.io      2022-06-23T14:16:37Z
 	kafkas.kafka.strimzi.io               2022-06-23T14:16:36Z
 	kafkatopics.kafka.strimzi.io          2022-06-23T14:16:37Z
 	kafkausers.kafka.strimzi.io           2022-06-23T14:16:37Z
 	strimzipodsets.core.strimzi.io        2022-06-23T14:16:37Z

삭제

 helm uninstall kafka-operator -n kafka && kubectl delete ns kafka

(2) Kafka 클러스터 배포

kafka.yaml 내용 확인 (3.2.0 버전 설치)

 (🚴|DOIK-Lab:default) root@k8s-m:~# cat kafka.yaml
    
 	───────┬───────────────────────────────────────────────────────────────────
 	       │ File: kafka.yaml
 	───────┼───────────────────────────────────────────────────────────────────
 │ apiVersion: kafka.strimzi.io/v1beta2
 │ kind: Kafka
 │ metadata:
 │   name: my-cluster
 │ spec:
 │   kafka:
 │     #version: 3.1.1
 │     replicas: 3
 │     listeners:
 │       - name: plain
 │         port: 9092
 │         type: internal
 │         tls: false
 │       - name: tls
 │         port: 9093
 │         type: internal
 │         tls: false
 │       - name: external
 │         port: 9094
 │         type: nodeport
 │         tls: false
 │     storage:
 │       type: jbod
 │       volumes:
 │       - id: 0
 │         type: persistent-claim
 │         size: 10Gi
 │         deleteClaim: true
 │     config:
 │       offsets.topic.replication.factor: 3
 │       transaction.state.log.replication.factor: 3
 │       transaction.state.log.min.isr: 2
 │       default.replication.factor: 3
 │       min.insync.replicas: 2
 │       #inter.broker.protocol.version: "3.1.1"
 │     template:
 │       pod:
 │         affinity:
 │           podAntiAffinity:
 │             requiredDuringSchedulingIgnoredDuringExecution:
 │               - labelSelector:
 │                   matchExpressions:
 │                     - key: app.kubernetes.io/name
 │                       operator: In
 │                       values:
 │                         - kafka
 │                 topologyKey: "kubernetes.io/hostname"
 │   zookeeper:
 │     replicas: 3
 │     storage:
 │       type: persistent-claim
 │       size: 10Gi
 │       deleteClaim: true
 │     template:
 │       pod:
 │         affinity:
 │           podAntiAffinity:
 │             requiredDuringSchedulingIgnoredDuringExecution:
 │               - labelSelector:
 │                   matchExpressions:
 │                     - key: app.kubernetes.io/name
 │                       operator: In
 │                       values:
 │                         - zookeeper
 │                 topologyKey: "kubernetes.io/hostname"
 │   entityOperator:
 │     topicOperator: {}
 │     userOperator: {}
 	───────┴───────────────────────────────────────────────────────────────────

”배포 시 requiredDuringSchedulingIgnoredDuringExecution 지원 , preferredDuringSchedulingIgnoredDuringExecution 미지원…(상당한 삽질…)”

💡 가시다님이 위와 같이 말씀하신게 궁금해서 이 옵션 값에 대해 찾아 보았는데 같은 이슈를 가진 케이스가 있었다.

좀 더 찾아 보니 아래 두 가지 글을 발견했다. 아래와 같은 이유로 requiredDuringSchedulingIgnoredDuringExecution를 사용하는 게 아닐까 조심스레 추측해 본다.

2.7.1.1. Use pod anti-affinity to avoid critical applications sharing nodes

Use pod anti-affinity to ensure that critical applications are never scheduled on the same disk. When running a Kafka cluster, it is recommended to use pod anti-affinity to ensure that the Kafka brokers do not share nodes with other workloads, such as databases.

However, the preferredDuringSchedulingIgnoredDuringExecution rule does not guarantee that the brokers will be spread. Depending on your exact OpenShift and Kafka configurations, you should add additional affinity rules or configure topologySpreadConstraints for both ZooKeeper and Kafka to make sure the nodes are properly distributed accross as many racks as possible

링크 참고 1 링크 참고 2

podAffinity & podAntiAffinity
- node에서 이미 실행 중인 pod 레이블을 기반으로 podAffinity는 동일한 label을 가진 pod가 동일 영역에 스케줄링되게 해 주는 설정 값이고 반대로 podAntiAffinity는 HA 구성할 때와 같이 동일한 label을 pod가 서로 다른 영역에 스케줄링되게 해 주는 설정 값이다.
  (영역 : node, rack, cloud provider zone or region과 같은 topology domain)
  (pod : LabelSelector에 영향받음)
requiredDuringSchedulingIgnoredDuringExecution & preferredDuringSchedulingIgnoredDuringExecution
- required(hard affinity) : 반드시 조건에 맞아야 해당 영역에만 배포됨
- preferred(soft affinity) : 되도록 조건에 맞는다면 해당 영역에 배포됨 (우선시하되 필수는 아니고 weight 옵션을 통해 우선순위 설정 가능)
- 즉, 위 매니페스트 파일에 의하면 kafka 또는 zookeeper는 app.kubernetes.io/name=kafka 또는 app.kubernetes.io/name=zookeeper인 조건 하나만 충족한다면 동일한 label의 pod끼리는 반드시 다른 node에 스케줄되어야 한다는 것을 의미한다. ⇒ 고가용성✨

클러스터 배포

 (🚴|DOIK-Lab:default) root@k8s-m:~# kubectl apply -f kafka.yaml -n kafka
 	kafka.kafka.strimzi.io/my-cluster created

배포된 클러스터 확인

 (🚴|DOIK-Lab:default) root@k8s-m:~# kubectl get kafka -n kafka
 	NAME         DESIRED KAFKA REPLICAS   DESIRED ZK REPLICAS   READY   WARNINGS
 	my-cluster   3                        3                     True

statefulset으로 설치된 kafka, zookeeper 리소스 확인

 (🚴|DOIK-Lab:default) root@k8s-m:~# kubectl get sts -n kafka -owide
 	NAME                   READY   AGE   CONTAINERS   IMAGES
 	my-cluster-kafka       3/3     11m   kafka        quay.io/strimzi/kafka:0.29.0-kafka-3.2.0
 	my-cluster-zookeeper   3/3     12m   zookeeper    quay.io/strimzi/kafka:0.29.0-kafka-3.2.0

kafkatopics crd 확인

 (🚴|DOIK-Lab:default) root@k8s-m:~# kubectl get kafkatopics -n kafka
 	NAME                                                                                               CLUSTER      PARTITIONS   REPLICATION FACTOR   READY
 	consumer-offsets---84e7a678d08f4bd226872e5cdd4eb527fadc1c6a                                        my-cluster   50           3                    True
 	strimzi-store-topic---effb8e3e057afce1ecf67c3f5d8e4e3ff177fc55                                     my-cluster   1            3                    True
 	strimzi-topic-operator-kstreams-topic-store-changelog---b75e702040b99be8a9263134de3507fc0cc4017b   my-cluster   1            3                    True

service와 configmap 확인

 (🚴|DOIK-Lab:default) root@k8s-m:~#  kubectl get svc,configmap -n kafka
 	NAME                                          TYPE        CLUSTER-IP     EXTERNAL-IP   PORT(S)                               AGE
 	service/my-cluster-kafka-0                    NodePort    10.200.1.247   <none>        9094:31250/TCP                        5h38m
 	service/my-cluster-kafka-1                    NodePort    10.200.1.11    <none>        9094:32516/TCP                        5h38m
 	service/my-cluster-kafka-2                    NodePort    10.200.1.12    <none>        9094:30658/TCP                        5h38m
 	service/my-cluster-kafka-bootstrap            ClusterIP   10.200.1.133   <none>        9091/TCP,9092/TCP,9093/TCP            5h38m
 	service/my-cluster-kafka-brokers              ClusterIP   None           <none>        9090/TCP,9091/TCP,9092/TCP,9093/TCP   5h38m
 	service/my-cluster-kafka-external-bootstrap   NodePort    10.200.1.115   <none>        9094:31094/TCP                        5h38m
 	service/my-cluster-zookeeper-client           ClusterIP   10.200.1.35    <none>        2181/TCP                              5h39m
 	service/my-cluster-zookeeper-nodes            ClusterIP   None           <none>        2181/TCP,2888/TCP,3888/TCP            5h39m
    	
 	NAME                                                DATA   AGE
 	configmap/kube-root-ca.crt                          1      6h27m
 	configmap/my-cluster-entity-topic-operator-config   1      5h37m
 	configmap/my-cluster-entity-user-operator-config    1      5h37m
 	configmap/my-cluster-kafka-config                   5      5h38m
 	configmap/my-cluster-zookeeper-config               2      5h39m
 	configmap/strimzi-cluster-operator                  1      5h52m

📚 참고 자료

Share on

Twitter Facebook LinkedIn

[Database/Kubernetes/DOIK] Kafka & Strimzi Operator (1) - 설치

🍭 Kafka & Strimzi Operator

1) Kafka란?

2) Strimzi Operator란?

📣 kafka에서 자주 사용하는 용어 알기

3) Strimzi Operator & Kafka 클러스터 생성 실습

(1) Strimzi Cluster Operator 설치

(2) Kafka 클러스터 배포

📚 참고 자료

Share on

You may also enjoy

[CI/CD]3주차 - Argo Rollout + K8S(Kind)

[CI/CD]3주차 - Jenkins CI + Argo CD + K8S(Kind)

[CI/CD]3주차 - Jenkins CI + K8S(Kind)

[CI/CD]3주차 - 실습 환경 구성