이 포스팅은 kubernetes에 Prometheus Operator 설치하려고 하다가 생긴 트러블 슈팅에 관한 내용이다!

1. Custom Resource 생성하기 전에 Custom Resource Definition 설치 필요🌟

(🍉 |DOIK-Lab:default) root@k8s-m:~# k apply -f kube-prometheus/manifests/
	//...중략...
	resource mapping not found for name: "prometheus-adapter" namespace: "monitoring" from "kube-prometheus/manifests/prometheusAdapter-serviceMonitor.yaml": no matches for kind "ServiceMonitor" in version "monitoring.coreos.com/v1"
	ensure CRDs are installed first
	resource mapping not found for name: "prometheus-operator-rules" namespace: "monitoring" from "kube-prometheus/manifests/prometheusOperator-prometheusRule.yaml": no matches for kind "PrometheusRule" in version "monitoring.coreos.com/v1"
	ensure CRDs are installed first
	resource mapping not found for name: "prometheus-operator" namespace: "monitoring" from "kube-prometheus/manifests/prometheusOperator-serviceMonitor.yaml": no matches for kind "ServiceMonitor" in version "monitoring.coreos.com/v1"
	ensure CRDs are installed first

Custom Resource로 Prometheus Operator를 생성하기 위해 작업 진행하는데 에러 발생!

구글링해 보니 아래 링크와 같이 CRD를 먼저 설치해야 한다고 한다. 개념이 부족하니 사소한 트러블슈팅까지 하게 된다….(반성😥)

참고 링크 ) ServiceMonitor not found in monitoring.coreos.com/v1

Custom Resource Definition으로 객체들의 Spec을 정의하고 Custom Resource는 그 정의한 값으로 객체들의 실제 상태 데이터를 조합하고 관리한다.

(🍉 |DOIK-Lab:default) root@k8s-m:~/kube-prometheus/manifests# kubectl apply -f https://raw.githubusercontent.com/prometheus-operator/prometheus-operator/main/bundle.yaml
	customresourcedefinition.apiextensions.k8s.io/alertmanagerconfigs.monitoring.coreos.com created
	customresourcedefinition.apiextensions.k8s.io/alertmanagers.monitoring.coreos.com created
	customresourcedefinition.apiextensions.k8s.io/podmonitors.monitoring.coreos.com created
	customresourcedefinition.apiextensions.k8s.io/probes.monitoring.coreos.com created
	customresourcedefinition.apiextensions.k8s.io/prometheusrules.monitoring.coreos.com created
	customresourcedefinition.apiextensions.k8s.io/servicemonitors.monitoring.coreos.com created
	customresourcedefinition.apiextensions.k8s.io/thanosrulers.monitoring.coreos.com created
	clusterrolebinding.rbac.authorization.k8s.io/prometheus-operator created
	clusterrole.rbac.authorization.k8s.io/prometheus-operator created
	deployment.apps/prometheus-operator created
	serviceaccount/prometheus-operator created
	service/prometheus-operator created
	The CustomResourceDefinition "prometheuses.monitoring.coreos.com" is invalid: metadata.annotations: Too long: must have at most 262144 bytes

CRD는 하나빼고 다 생성완료!

하지만 아직도 사소한 에러 발생… 끝나지 않은 트러블슈팅이다 ㅎㅎ

2. Custom Resource Definition is invalid?!!

(🍉 |DOIK-Lab:default) root@k8s-m:~# kubectl apply -f https://raw.githubusercontent.com/prometheus-operator/prometheus-operator/main/bundle.yaml
	The CustomResourceDefinition "prometheuses.monitoring.coreos.com" is invalid: metadata.annotations: Too long: must have at most 262144 bytes

이 에러 메세지를 구글링해 보니 다른 사람들도 흔히 겪는 이슈였다

이럴 땐 apply 대신 replace로 입력해 줘야 하는데 이때, --force를 줘서 강제로 만들어 주자!

하지만 CRD를 삭제하고 다시 생성하는 거라,

CRD를 삭제하면 모든 CR 인스턴스도 삭제되므로 클러스터에 치명적일 수 있다는 주의 사항이 있다.

참고 링크 ) https://github.com/argoproj/argo-cd/issues/820

(🍉 |DOIK-Lab:default) root@k8s-m:~# kubectl replace -f https://raw.githubusercontent.com/prometheus-operator/prometheus-operator/main/bundle.yaml --force
	customresourcedefinition.apiextensions.k8s.io "alertmanagerconfigs.monitoring.coreos.com" deleted
	customresourcedefinition.apiextensions.k8s.io "alertmanagers.monitoring.coreos.com" deleted
	customresourcedefinition.apiextensions.k8s.io "podmonitors.monitoring.coreos.com" deleted
	customresourcedefinition.apiextensions.k8s.io "probes.monitoring.coreos.com" deleted
	customresourcedefinition.apiextensions.k8s.io "prometheusrules.monitoring.coreos.com" deleted
	customresourcedefinition.apiextensions.k8s.io "servicemonitors.monitoring.coreos.com" deleted
	customresourcedefinition.apiextensions.k8s.io "thanosrulers.monitoring.coreos.com" deleted
	clusterrolebinding.rbac.authorization.k8s.io "prometheus-operator" deleted
	clusterrole.rbac.authorization.k8s.io "prometheus-operator" deleted
	deployment.apps "prometheus-operator" deleted
	serviceaccount "prometheus-operator" deleted
	service "prometheus-operator" deleted
	customresourcedefinition.apiextensions.k8s.io/alertmanagerconfigs.monitoring.coreos.com replaced
	customresourcedefinition.apiextensions.k8s.io/alertmanagers.monitoring.coreos.com replaced
	customresourcedefinition.apiextensions.k8s.io/podmonitors.monitoring.coreos.com replaced
	customresourcedefinition.apiextensions.k8s.io/probes.monitoring.coreos.com replaced
	customresourcedefinition.apiextensions.k8s.io/prometheuses.monitoring.coreos.com replaced
	customresourcedefinition.apiextensions.k8s.io/prometheusrules.monitoring.coreos.com replaced
	customresourcedefinition.apiextensions.k8s.io/servicemonitors.monitoring.coreos.com replaced
	customresourcedefinition.apiextensions.k8s.io/thanosrulers.monitoring.coreos.com replaced
	clusterrolebinding.rbac.authorization.k8s.io/prometheus-operator replaced
	clusterrole.rbac.authorization.k8s.io/prometheus-operator replaced
	deployment.apps/prometheus-operator replaced
	serviceaccount/prometheus-operator replaced
	service/prometheus-operator replaced

일단 성공ㅎㅎ

(🍉 |DOIK-Lab:default) root@k8s-m:~# kubectl apply -f kube-prometheus/manifests/
	//...중략...
	Warning: resource clusterrolebindings/prometheus-operator is missing the kubectl.kubernetes.io/last-applied-configuration annotation which is required by kubectl apply. kubectl apply should only be used on resources created declaratively by either kubectl create --save-config or kubectl apply. The missing annotation will be patched automatically.

annotation이 없다는 경고 사항이 뜬다..!
추후 문제가 생긴다면 다시 트러블슈팅해야 겠다~



+) 내용 보강 ⇒ Server-Side Apply

(🚴|DOIK-Lab:default) root@k8s-m:~# kubectl apply -f https://raw.githubusercontent.com/prometheus-operator/prometheus-operator/main/bundle.yaml --server-side
	customresourcedefinition.apiextensions.k8s.io/alertmanagerconfigs.monitoring.coreos.com serverside-applied
	customresourcedefinition.apiextensions.k8s.io/alertmanagers.monitoring.coreos.com serverside-applied
	customresourcedefinition.apiextensions.k8s.io/podmonitors.monitoring.coreos.com serverside-applied
	customresourcedefinition.apiextensions.k8s.io/probes.monitoring.coreos.com serverside-applied
	customresourcedefinition.apiextensions.k8s.io/prometheuses.monitoring.coreos.com serverside-applied
	customresourcedefinition.apiextensions.k8s.io/prometheusrules.monitoring.coreos.com serverside-applied
	customresourcedefinition.apiextensions.k8s.io/servicemonitors.monitoring.coreos.com serverside-applied
	customresourcedefinition.apiextensions.k8s.io/thanosrulers.monitoring.coreos.com serverside-applied
	clusterrolebinding.rbac.authorization.k8s.io/prometheus-operator serverside-applied
	clusterrole.rbac.authorization.k8s.io/prometheus-operator serverside-applied
	deployment.apps/prometheus-operator serverside-applied
	serviceaccount/prometheus-operator serverside-applied
	service/prometheus-operator serverside-applied

링크 참고 : Server-Side Apply

여러 사용자는 오브젝트 하나를 공유하며 사용할 수 있다. 오브젝트의 필드는 field management(metadata.managedFields) 메커니즘에 의해 관리되는데, 필드 값이 변경되면 field manager도 변경을 수행하려는 관리자로 바뀌게 된다.

이 때 --server-side 옵션을 사용하게 되면 kubectl에 의해 last-applied에서 관리하는 annotation을 비교하여 사용자의 필드 관리를 추적한다.

Server Side Apply선언적 설정을 통해 사용자와 컨트롤러가 리소스를 관리할 수 있게 해준다.


마무리였지만 마무리 아닌…

--force이나 --force-conflicts 옵션으로 강제로 덮어씀으로써 필드 값을 변경할 수 있지만, 이는 manageFields의 다른 모든 관리자 항목에서 필드가 제거된다고 하여 리소스 손실의 위험이 있을 수 있으니 Server Side Apply를 활용하도록 하자!

++ 추가로 알게된 점!!ㄴ(ㅇ0ㅇ)ㄱ

kubectl apply말고 create로 리소스를 생성하게 되면 에러는 발생하지 않았다.
create는 존재하지 않는 리소스를 새로 생성해 주는 것이고 apply는 부분적인 spec을 적용하여 리소스를 다시 구성해 주는 명령어라 에러가 발생하지 않은 것으로 예상된다..