فرز عنوان IP uniq في من سجل Apache




bash sorting (4)

إذا لم يكن فرز النتائج متوقعًا ، فربما يرجع ذلك إلى مشكلة محلية.

| LC_ALL=C sort -rn

awk '{array[$1]++}END{ for (ip in array) print array[ip] " " ip}' <path/to/apache/*.log> | LC_ALL=C sort -rn

فرز الفرز لا فرز كما هو متوقع (المسافة واللغة)

https://www.commandlinefu.com/commands/view/9744/sort-ip-by-count-quickly-with-awk-from-apache-logs

أحاول استخراج عناوين IP من سجل أباتشي ، وحسابها ، وفرزها.

ولأي سبب من الأسباب ، فإن الجزء الفرز هو فظيع.

هذا هو الأمر:

cat access.* | awk '{ print $1 }' | sort | uniq -c | sort -n

مثال الإخراج:

  16789 65.X.X.X
  19448 65.X.X.X
   1995 138.X.X.X
   2407 213.X.X.X
   2728 213.X.X.X
   5478 188.X.X.X
   6496 176.X.X.X
  11332 130.X.X.X

لا أفهم لماذا لا يتم فرز هذه القيم حقاً. لقد حاولت أيضًا إزالة الفراغات في بداية السطر ( sed 's/^[\t ]*//g' ) واستخدام sort -n -t" " -k1 ، والتي لا تغير أي شيء.

أي تلميح؟


قد يكون هذا متأخرًا ، ولكن استخدام الرقم الرقمي في الفئة الأولى سيعطيك النتيجة المرجوة ،

cat access.log | awk '{print $1}' | sort -n | uniq -c | sort -nr | head -20

انتاج:

 29877 93.xxx.xxx.xxx
  17538 80.xxx.xxx.xxx
   5895 198.xxx.xxx.xxx
   3042 37.xxx.xxx.xxx
   2956 208.xxx.xxx.xxx
   2613 94.xxx.xxx.xxx
   2572 89.xxx.xxx.xxx
   2268 94.xxx.xxx.xxx
   1896 89.xxx.xxx.xxx
   1584 46.xxx.xxx.xxx
   1402 208.xxx.xxx.xxx
   1273 93.xxx.xxx.xxx
   1054 208.xxx.xxx.xxx
    860 162.xxx.xxx.xxx
    830 208.xxx.xxx.xxx
    606 162.xxx.xxx.xxx
    545 94.xxx.xxx.xxx
    480 37.xxx.xxx.xxx
    446 162.xxx.xxx.xxx
    398 162.xxx.xxx.xxx

لماذا استخدام cat | awk cat | awk ؟ ما عليك سوى استخدام awk :

awk '{ print $1 }' /var/log/*access*log | sort -n | uniq -c | sort -nr | head -20

هذا يجب أن يعمل

cat access.* | awk '{ print $1 }' | sort | awk '{print $1 " " $2;}' | sort -n

لا أستطيع رؤية مشكلة.

السيطرة على الحروف في الملفات؟

نظام الملفات الكامل (ملفات مؤقت)؟







logging