Re: Статистика
Пользователь:
recived (IP-адрес скрыт)
Дата: 23, December, 2011 10:23
Пока не сообразил. Есть 3 базы данных разные. В них есть файлы которые скачивают пользователи. Вот нужно подсчитать, сколько раз выкачивали файлы из конкретной БД, поддельно, помесячно. Также нужно вытащить статистику поисковых запросов в ирбисе, сколько всего было запросов, какие были это запросы, а также все это еще можно было вытаскивать по отдельным БД. По арм не читал еще доки, но на данный момент сделал тупо грепом логов. Исходя из ниже, правильно ли считается статистика?
1. Собираю все логи за прошедший месяц (irbislog_copy_01.xx.xxxx.log - irbislog_copy_31.xx.xxxx.log)
- При скачке файлов в логи типа
DateTime=30.11.2011 10:06:28&I21DBN=BASEONE&C21COM=2&Z21ID=120480&P21DBN=PRAVO&RemoteHost=777.777.77.77&DownloadFile=E:\irbis_2008_1\server\IRBIS64\DATAI\PRAVO\fulltext/p3434.pdf
Где DBN=BASEONE - это база.
.pdf - запрос на скачку файла.
Тем самым грепаю логи:
#cat *log | grep .pdf | grep DBN=BASEONE | wc -l
Итог: Получил количество скачанных файлов из БД BASEONE за 1 месяц (По логам)
Количество поисковых слов и запросов:
- В логах оседают такие строчки:
DateTime=30.11.2011 2:21:10&I21DBN=IKNBU&C21COM=S&S21STN=1&S21CNR=20&S21All=(<.>S=ЛЕСН$<.>+<.>S=ПРАВ$<.>+<.>S=КОММЕНТАРИ$<.>+<.>S=РОССИЙСК$<.>+<.>S=ФЕДЕРАЦИ$<.>)&S21AllTrm=S=ЛЕСН|S=ПРАВ|S=КОММЕНТАРИ|S=РОССИЙСК|S=ФЕДЕРАЦИ|&S21FMT=fullw&S21REF=10&P21DBN=IKNBU&S21COLORTERMS=0&S21P03=S=&S21STR=Лесное право - Комментарий - Российская Федерация&RemoteHost=777.77.777.777
Где S21STR это текст поисковый запроса
Грепаем:
#cat *log | grep S21STR= | grep DBN=IKNBU > 1.log && sed 's/.*RemoteHost=\(.*\)$/\1/g' 1.log > ip.log && sed 's/.*&S21STR=\(.*\)$/\1/g' 1.log | sed 's/&RemoteHost=.*\(.*\)$/\1/g' > search.log
В итоге получаем 2 файла. ip.log и search.log. Подсчитываем количество всего запросов. #wc -l search.log и на выходе получаем всего запросов.
Вот верный ли подсчет?
Редактировано 2 раз. Последний раз 23.12.2011 10:25 пользователем recived.