// about
About Me
한밭대학교 컴퓨터공학과 학부생이고, SRE(Site Reliability Engineer)를 지향합니다. 서비스를 안정적으로 관측하고, 장애 원인을 추적하고, 운영을 자동화하는 일을 합니다.
관심 분야
Monitoring & Observability
메트릭 수집·시각화와 오탐 없는 알림 체계 설계
Incident Response
로그 기반 장애 원인 추적과 포스트모템 기록
Network & Security
WireGuard·OPNsense 기반 사설 VPN 오버레이 네트워크 구성·운영
Automation
Ansible 기반 운영 자동화로 toil 감소
낭만인프라 활동
전체 보기 →Ansible become 타임아웃 인시던트 대응 (Ubuntu 26.04 sudo-rs)
3일간 패치 자동화가 실패하던 신규 서버 2대(16대 중) 복구, 26.04 표준 셋업 절차에 sudo 전환 단계를 반영해 재발 방지
모니터링 파이프라인 구축
NoData 분기 처리로 잘못 울리던 알림(오탐)을 사실상 제거해 알림 신뢰도 확보
장애 분석 & 트러블슈팅
기술 스택
Monitoring
PrometheusGrafanaNetdataZabbix
Network & Security
OPNsenseWireGuard
Cloud
AWSNaver Cloud Platform
Automation
DockerAnsibleNginx
Languages
PythonJavaScript/TypeScriptJava
Database
PostgreSQLMySQLRedis
학습 중 / 관심 기술
KubernetesSLO/SLI 기반 신뢰성 운영ArgoCD