Nếu bạn làm DevOps/SRE, kiểu gì cũng gặp những tình huống đau đầu giống nhau: lỗi chỉ xuất hiện ở production, alert kêu cả đêm, hoặc pipeline lúc xanh lúc đỏ.
Bài này chia sẻ kinh nghiệm thực chiến cho chủ đề secret rotation trong bối cảnh Incident response / On-call — theo format: triệu chứng → nguyên nhân gốc → cách xử lý → checklist.
Tình huống hôm nay (case thực tế)
Trong hệ thống Incident response / On-call, bạn gặp vấn đề secret rotation ở production. Điều khó chịu là nó không xảy ra ổn định: có ngày bình thường, có ngày lại bùng lên đúng giờ cao điểm.
Vấn đề nhiều người gặp
Triệu chứng “khó chịu”: lúc có lúc không.
Khó tái hiện (reproduce) ở local/staging.
Debug tốn thời gian vì thiếu dữ liệu (logs/metrics/traces).
Nguyên nhân gốc (root causes) thường g?
Discussion
Start the conversation
Your voice can be the first to spark an engaging conversation.