Artikel ini merupakan kelanjutan dari teks tentang pemantauan . Di sini saya mengusulkan untuk berbicara dengan Anda tentang peran log dalam menilai status situs yang diamati, melihat apa yang dapat mereka berikan kepada kami, dan juga mengajukan pertanyaan - "apakah mungkin untuk memisahkan log dari metrik?"
Sepanjang jalan, saya akan kembali ke beberapa tesis yang diungkapkan dalam publikasi sebelumnya, jadi saya sarankan agar Anda membiasakan diri dengan hal itu terlebih dahulu.
Jadi mari kita bicara tentang penebangan.
Ngomong-ngomong, apa yang benar: logging atau logging? Secara pribadi, saya condong ke opsi kedua, hanya karena loGGing, tetapi saya perhatikan bahwa kebanyakan orang lebih suka yang pertama. Dan kau?
Tanya jawab
Sebelum memulai artikel baru, saya ingin kembali ke artikel sebelumnya. Beberapa topik diangkat dalam komentar, yang menurut saya patut diberi sedikit saran.
Kumpulkan semuanya atau hanya jumlah minimum?
Di sini posisi saya adalah Anda perlu mengumpulkan semua metrik yang dapat diberikan oleh objek. Seperti yang dicatat @BugM, mereka ada di database, mereka tidak meminta makanan, mereka tidak mengganggu siapa pun. Tetapi jika Anda tidak memilikinya, tetapi Anda tiba-tiba membutuhkannya, terutama untuk, katakanlah, bulan lalu, maka tidak ada yang bisa dilakukan.
ML, . , , () . , , ( ML), .
, , ?
. , , :
… ,
, , . , . , .
@sizziff .
«» , 150%, , , :
@Dr_Wut :
— , — spf. , , . — .
, , - , – , .
- -
.
- – «» , (, …). – .
- - – , - . , – BI-.
.
.
, , , , , , , .
, , . :
– ; , :
2019-04-23 00:39:10,092 INFO DatabaseConnector – Connection estabilished
. – . /, , , .
– ; , . API. , , Nginx:
66.249.65.62 - - [06/Nov/2014:19:12:14 +0600] "GET /?q=%E0%A6%A6%E0%A7%8B%E0%A7%9F%E0%A6%BE HTTP/1.1" 200 4356 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
– . , .
– , .
: , , , , – , , , , . , , , , , .
, « ?».
– , , .
– , database_error_count. , , - , , ( ) . :
2019-04-27 00:39:10,092 ERROR DatabaseConnector – Error connecting to database MSSQLDB – connection refused on port 1433
– .
, . , , «» , , , , , , .
, . -, , , , … !
– HTTP- , , , , , , :
, , , . Observability – .
? ? ? ? , .
:
(99% - API - - , - )
(- API)
( )
. .
, HTTP – .
. :
DMZ (trace ID) ; !
, , -, , -,
, trace ID , – .
, :
– , :
;
, – Pull Push.
Pull – ( , , ), , //- . – ; – , .
Push – / / . , , .
, , ( , ), .
– plain text, jsonl, logsft, . – , .
– , .
:
@timestamp<time>:
application<string>: , ;
host<string>: ,
log_type<string>: ; application|access|.... ( application )
trace_id<string>: ( )
.
, :
message<string>:
generic_message<string>:
level<string>:
level_value<int>:
logger_name<string>: , ( )
thread_name<string>: , ( )
stack_trace<string>: ; - ( )
:
status_code<int>:
elapsed_time<int>: ,
requested_resource<string>:
method<string>:
.
, .
:
– NoSQL , , . , , –
– , - , . , ,
, , «EMERGENCY», , , , , . , «FATAL» - .
, «generic_message». .
– ( , ).
– , . :
:
Error on AMQP connection <0.12956.79> (127.0.0.1:52879 -> 127.0.0.1:5672, state: starting):
, :
Error on AMQP connection <{connection_id}> ({remote_host} -> {destination_host}, state: {connection_state}):
.
? :
; , , . ,
; «session_id»
, ( , ), ( )
. .
, . Elasticsearch, , , Loki . , - https://habr.com/ru/company/badoo/blog/507718/.
, , .
:
, ( , ).
:
- , ERROR
– , ( , )
, – , , ,
:
, :
;
, ; , ,
, ?
, – , , . .
, , , – .
Mungkin nanti artikel lain akan muncul, dengan contoh penggunaan teknologi dan praktik tertentu, di mana kami akan mencoba menerapkan apa yang telah dijelaskan sebelumnya dan melihat cara kerjanya.