下面是Seoer惜缘的服务器日志,提供有力的帮助

  • 栏目:软件 时间:2020-04-24 23:41
<返回列表

一般服务器的日志,都是在wwwlogs文件下,宝塔也不例外。

 iis默认的日志文件在C:WINDOWSsystem32LogFiles中,下面是Seoer惜缘的服务器日志,通过查看,就可以了解搜索引擎蜘蛛爬行经过,如:

最近整理公司服务器,对nginx复习了一遍。记录下,备忘。
一个合理有效的访问日志记录,将对维护服务器,网站稳定运行,提供有力的帮助

图片 1

2008-08-19 00:09:12 W3SVC962713505 203.171.226.111 GET /index.html - 80

variable 用到的变量

工欲善其事必先利其器,日志格式里各个变量都是啥玩意呀?

下载日志到本地,可以使用拉格好

log_format 访问日志格式定制

知道了以上的变量,该来定制属于自己的日志格式了.这段代码写在`http{}`里

log_format xxlog '$remote_addr [$time_local] "$request" $status <$body_bytes_sent>  "$http_user_agent" $http_x_forwarded_for';

这里需要注意一点,$http_x_forwarded_for不是默认就有的,在有中转服务器(CDN 服务器)设置的
比如我这业务需要是由A服务器反向代理到B服务器那么我在转发时,就需要带着原始IP:`$remote_addr`

proxy_set_header X-Forwarded-For $remote_addr;
proxy_pass 192.168.1.2:8081;

图片 2

(+) 200 0 64

access_log 设置日志文件名、位置、格式

一般写在`http{server{}}`里,可对不同server指定

access_log 地址 采用格式;
access_log /home/wwwlogs/web_access.log xxlog;

图片 3

1、203.171.226.111就是搜索引擎蜘蛛防问的网站ip,
2、61.135.168.39 Baiduspider代表,百度搜索引擎蜘蛛的ip是61.135.168.39,
3、代码中的/index.html 就代表搜索引擎蜘蛛防问的网页
4、2008-08-19 00:09:12代表搜索引擎蜘蛛爬行的日期与时间
5、代码中的200就代表搜索引擎蜘蛛爬行后返回HTTP状态代码,代码中可以了解蜘蛛爬行后的反映,代码如下:
6、W3SVC962713505代表网站日志所在的文件夹

一些日志心得脚本

程序员最擅长干嘛?偷懒呀!偷懒靠什么,脚本呀!
grep "07/Dec/2016" ./web_access.log|wc -l
grep "07/Dec/2016" ./web_access.log|grep "192.168.1.2"

理论上来说,下面蓝色的蜘蛛权重,属于高权重的,低权重的有用另外的颜色标注。

7、 baiduspider常见问题解答网页

!/bin/bash

base_path='/home/wwwlogs'
log_path=$(date -d yesterday +"%Y%m")
day=$(date -d yesterday +"%d")
mkdir -p $base_path/$log_path
mv $base_path/web_access.log $base_path/$log_path/web_access_$day.log
/usr/local/nginx/sbin/nginx -s reopen

Crontab 编辑定时任务,这里为2点1分
crontab -e
01 02 * * * /xxx/xxx/nginx_split.sh

左侧有些更具体的信息:

2xx 成功

图片 4

200 正常;请求已完成。

222.186.42.51是对方ip;

201 正常;紧接 POST 命令。

05/Jul/2018:08:43:31是ip访问时间;

202 正常;已接受用于处理,但处理尚未完成。

Mozilla/5.0 (compatible; Baiduspider/2.0; +

203 正常;部分信息 — 返回的信息只是一部分。

如果你不知道日志中是否包含假的百度蜘蛛,可以使用如下工具检测:

204 正常;无响应 — 已接收请求,但不存在要回送的信息。

3xx 重定向

301 已移动 — 请求的数据具有新的位置且更改是永久的。

302 已找到 — 请求的数据临时具有不同 URI。

303 请参阅其它 — 可在另一 URI 下找到对请求的响应,且应使用 GET 方法检索此响应。

304 未修改 — 未按预期修改文档。

305 使用代理 — 必须通过位置字段中提供的代理来访问请求的资源。

306 未使用 — 不再使用;保留此代码以便将来使用。

4xx 客户机中出现的错误

400 错误请求 — 请求中有语法问题,或不能满足请求。

401 未授权 — 未授权客户机访问数据。

402 需要付款 — 表示计费系统已有效。

403 禁止 — 即使有授权也不需要访问。

404 找不到 — 服务器找不到给定的资源;文档不存在。

407 代理认证请求 — 客户机首先必须使用代理认证自身。

410 请求的网页不存在(永久);

415 介质类型不受支持 — 服务器拒绝服务请求,因为不支持请求实体的格式。

5xx 服务器中出现的错误

500 内部错误 — 因为意外情况,服务器不能完成请求。

501 未执行 — 服务器不支持请求的工具。

502 错误网关 — 服务器接收到来自上游服务器的无效响应。

503 无法获得服务 — 由于临时过载或维护,服务器无法处理请求。

上一篇:没有了 下一篇:没有了

更多阅读

下面是Seoer惜缘的服务器日志,提供有力

软件 2020-04-24
一般服务器的日志,都是在wwwlogs文件下,宝塔也不例外。  iis默认的日志文件在C:WINDOWSsystem...
查看全文

-- 更加标准的 lang 属性写法 ,说明是

软件 2020-04-23
说明是智能摘要? MetaProperty=og标签是什么呢? !DOCTYPE html 其实就是告诉搜索引擎,这个页面是...
查看全文

然后得到被选中的元素,让选中和右键功

软件 2020-04-23
有些网站会禁止用户复制或选中网页上的内容,有时候想复制下东西的确麻烦。无奈只能手动...
查看全文

友情链接: 网站地图

Copyright © 2015-2019 http://www.koi-bumi.com. 韦德体育有限公司 版权所有