Mari kita bicara tentang logging terpusat

Artikel ini merupakan kelanjutan dari teks tentang pemantauan . Di sini saya mengusulkan untuk berbicara dengan Anda tentang peran log dalam menilai status situs yang diamati, melihat apa yang dapat mereka berikan kepada kami, dan juga mengajukan pertanyaan - "apakah mungkin untuk memisahkan log dari metrik?"





Sepanjang jalan, saya akan kembali ke beberapa tesis yang diungkapkan dalam publikasi sebelumnya, jadi saya sarankan agar Anda membiasakan diri dengan hal itu terlebih dahulu.





Jadi mari kita bicara tentang penebangan.





Ngomong-ngomong, apa yang benar: logging atau logging? Secara pribadi, saya condong ke opsi kedua, hanya karena loGGing, tetapi saya perhatikan bahwa kebanyakan orang lebih suka yang pertama. Dan kau?






Tanya jawab

Sebelum memulai artikel baru, saya ingin kembali ke artikel sebelumnya. Beberapa topik diangkat dalam komentar, yang menurut saya patut diberi sedikit saran.





Kumpulkan semuanya atau hanya jumlah minimum?

Di sini posisi saya adalah Anda perlu mengumpulkan semua metrik yang dapat diberikan oleh objek. Seperti yang dicatat @BugM, mereka ada di database, mereka tidak meminta makanan, mereka tidak mengganggu siapa pun. Tetapi jika Anda tidak memilikinya, tetapi Anda tiba-tiba membutuhkannya, terutama untuk, katakanlah, bulan lalu, maka tidak ada yang bisa dilakukan.





: « – , , , ».





ML, . , , () . , , ( ML), .





, , ?

. , , :





… ,





, , . , . , .





@sizziff .





«» , 150%, , , :





Insinyur dibanjiri dengan peringatan
,

@Dr_Wut :





— , — spf. , , . — .





, , - , – , .





- -

.





- – «» , (, …). – .





- - – , - . , – BI-.





.





.






, , , , , , , .





, , . :





– ; , :





2019-04-23 00:39:10,092  INFO  DatabaseConnector – Connection estabilished
      
      



. – . /, , , .





– ; , . API. , , Nginx:





66.249.65.62 - - [06/Nov/2014:19:12:14 +0600] "GET /?q=%E0%A6%A6%E0%A7%8B%E0%A7%9F%E0%A6%BE HTTP/1.1" 200 4356 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
      
      



. , .





– , .





: , , , , – , , , , . , , , , , .





, « ?».





– , , .





– , database_error_count. , , - , , ( ) . :





2019-04-27 00:39:10,092  ERROR  DatabaseConnector – Error connecting to database MSSQLDB – connection refused on port 1433
      
      



– .





, . , , «» , , , , , , .





, . -, , , , … !





– HTTP- , , , , , , :





, , , . Observability – .





? ? ? ? , .





:





  • (99% - API - - , - )





  • (- API)





  • ( )





. .





, HTTP – .





. :





  1. DMZ (trace ID) ; !





  2. , , -, , -,





, trace ID , – .





, :





– , :









  • ;









, – Pull Push.





Pull – ( , , ), , //- . – ; – , .





Push – / / . , , .





, , ( , ), .





– plain text, jsonl, logsft, . – , .





– , .





:





@timestamp<time>:      
application<string>:  ,    ;      
host<string>:         ,    
log_type<string>:     ; application|access|.... (     application )
trace_id<string>:      ( )
      
      



.





, :





message<string>:           
generic_message<string>:    
level<string>:              
level_value<int>:           
logger_name<string>:      ,   ( )
thread_name<string>:      ,   ( )
stack_trace<string>:      ;     -      ( )
      
      



:





status_code<int>:              
elapsed_time<int>:          ,      
requested_resource<string>:  
method<string>:              
      
      



.





, .





:





  • – NoSQL , , . , , –





  • – , - , . , ,





, , «EMERGENCY», , , , , . , «FATAL» - .





, «generic_message». .





– ( , ).





– , . :





:





Error on AMQP connection <0.12956.79> (127.0.0.1:52879 -> 127.0.0.1:5672, state: starting):
      
      



, :





Error on AMQP connection <{connection_id}> ({remote_host} -> {destination_host}, state: {connection_state}):
      
      



.





? :





  • ; , , . ,





  • ; «session_id»





  • , ( , ), ( )





. .





, . Elasticsearch, , , Loki . , - https://habr.com/ru/company/badoo/blog/507718/.





, , .





:

























, ( , ).





:





  1. - , ERROR





  2. – , ( , )





  3. , – , , ,





:





Pengguna pemantau bergerak dari atas ke bawah, menganalisis insiden tersebut
,

, :





  • ;





  • , ; , ,





, ?





, – , , . .





, , , – .





Mungkin nanti artikel lain akan muncul, dengan contoh penggunaan teknologi dan praktik tertentu, di mana kami akan mencoba menerapkan apa yang telah dijelaskan sebelumnya dan melihat cara kerjanya.








All Articles