今天在linux上查看百度蜘蛛最近抓取了网站情况,于是就去nginx日志目录下查看,发现都大部分的日志已经自动归档打包成.gz文件了,无法使用普通的cat 进行输出查看

$  ls
access.log        access.log.13.gz  access.log.5.gz  error.log        error.log.13.gz  error.log.5.gz
access.log.1      access.log.14.gz  access.log.6.gz  error.log.1      error.log.14.gz  error.log.6.gz
access.log.10.gz  access.log.2.gz   access.log.7.gz  error.log.10.gz  error.log.2.gz   error.log.7.gz
access.log.11.gz  access.log.3.gz   access.log.8.gz  error.log.11.gz  error.log.3.gz   error.log.8.gz
access.log.12.gz  access.log.4.gz   access.log.9.gz  error.log.12.gz  error.log.4.gz   error.log.9.gz

通过cat命令无法正常查看,看到的都是乱码

$ cat access.log.2.gz
�WP^�=ks���WP��{gv.�~J-R�)�q3��3��
h@6 �$b;�u�#���6Ʃ0�h�W�W�a�%LF%�LV��?9s����)�5��        ��+Ք�W����Ç��)���WU�'�_�        �>�)��O��%�}@���qT�҄���dh�"(�0_��~}��Q�V~��IR�Pa��8�ǕS|�����4�#�+��U���iE���*���n<h�Ag�[�4���ލ��vfv�A<�� 6I��pn@M8�DSД� ...

通过网络查询,发现可以使用zcat 进行查看,特此记录下

$ zcat access.log.12.gz |grep Baiduspider
220.181.108.161 - - [11/Feb/2020:12:24:32 +0800] "GET /favicon.ico HTTP/1.1" 301 194 "-" "Mozilla/5.0 (compatible;Baiduspider/2.0; +http://www.baidu.com/search/spider.html)"
220.181.108.95 - - [11/Feb/2020:12:24:32 +0800] "GET /favicon.ico HTTP/1.1" 200 5 "-" "Mozilla/5.0 (compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html)"