纪念一下:一个有意思的ip爬虫于20171102终止访问

[openGPS.cn] 季雨林 2017/11/5 0:19:49

        发文纪念一个非常有意思的事,虽说无果,但是过程值得记录进档案里。一直在防御爬虫,但是有个非常特别的爬虫,我一直在留意着,甚至放行了。统计数据里:这个爬虫第一次访问是【2016-10-05 20:25:18】,第一次爬光我单日配额是【2016-10-30 19:34:23】,最后一次访问是【2017-11-02 16:16:40】。由于客户端ip非常分散,推测这是个客户端爬虫,另外根据其突然停止访问,查询ip大部分属于民用宽带性质,可以推测这是个iPhone手机上运行的app。仅有的数据分析难度较大,不知道他到底是个什么样的应用,也不知道是不是借调我的数据用来做了什么样的用途。回头补充一下他的其他特点。供感兴趣爬虫攻防的同学学习研究。


这个爬虫早期给我带来的最大问题是加剧了配额消耗情况,其次是涉及隐私问题导致我不得不对齐进行结果随机偏移处理,同样也不得已,增加了ip查询的图形验证码。但是好处是这个爬虫给我的数据库带来了不少高质量查询记录,因此想了想还是要在此感谢下这个爬虫给我累计的数据库做出的贡献。这个始终没有被我亲自找到的爬虫程序,居然没留给我排查机会(我也确实不用iphone,这一点使得我知道今天才反应过来爬虫的运行环境)


目前知道他的特点如下:

1,访问了我网站最早上线高精度ip的接口地址,实在是没想到更好的应对方法,因此这个接口被我加了很大的偏移量。当然,随着数据源关闭,此接口同样不可再返回有效结果。

2,固定cookie,这是我把这个爬虫精确识别出来的唯一参数

3,推测为客户端应用,因为其客户端IP非常分散

4,可能是iPhone手机上的应用,可惜我不懂iPhone相关开发,其browser信息为“Mozilla/5.0 (iPhone; CPU iPhone OS 9_3_2 like Mac OS X) AppleWebKit/601.1.46 (KHTML, like Gecko) Mobile/13F69”

5,停止非常整齐,停止前10分钟还有8个访问。突然停止这一点似乎印证了这个爬虫是苹果app,单一的应用商店更新才能做到如此彻底的app功能截止

6,部分其客户端ip(last 100):

110.166.211.170

223.221.78.55

180.118.93.199

106.57.7.252

121.57.26.142

121.57.26.186

49.88.106.204

27.28.145.110

115.203.0.137

182.202.150.3

49.89.109.44

36.62.241.209

1.86.90.167

115.223.90.19

113.135.238.253

111.177.201.208

60.22.226.9

117.34.249.214

42.230.26.200

110.187.40.111

60.22.227.91

125.32.132.19

1.81.14.161

111.127.45.51

180.127.6.94

118.124.52.244

36.62.243.68

118.79.208.234

123.245.203.228

175.150.120.13

111.127.72.77

42.57.17.163

111.177.195.57

121.31.165.7

106.57.7.8

42.230.38.241

180.127.10.187

49.86.109.157

222.189.94.231

121.31.167.144

221.203.129.185

180.105.200.200

114.103.71.129

118.124.52.237

49.88.106.202

153.99.49.224

112.245.193.72

60.18.17.32

49.89.111.115

114.239.89.65

123.245.207.113

118.79.89.196

182.37.63.110

118.121.35.27

42.57.17.10

59.47.195.46

182.143.32.10

42.7.29.221

114.226.92.33

171.44.107.139

153.99.56.172

36.62.240.31

36.47.247.174

115.223.108.125

124.94.206.219

36.100.244.51

171.125.145.32

114.107.5.34

119.55.212.59

223.221.206.18

59.47.204.61

1.191.68.237

123.188.195.187

180.118.94.7

36.6.140.110

117.33.221.144

115.46.93.103

115.202.54.172

182.143.33.177

175.167.236.101

113.137.89.219

117.68.242.246

223.244.151.245

223.240.72.29

171.115.236.99

125.119.219.90

60.185.34.79

175.21.118.21

42.230.52.98

223.221.205.35

101.205.46.151

106.111.45.101

42.230.38.14

123.244.99.132

58.50.101.147

171.125.47.39

118.213.14.50

182.244.169.185

111.127.72.85

119.55.222.230



打脸了,明明停止了访问,11月5号又复活了,这个爬虫又开始了


原文地址: https://www.opengps.cn/Blog/View.aspx?id=44 文章的更新编辑依此链接为准。欢迎关注源站原创文章!

评论

暂无评论!

发表评论:

用于接收作者回复信息
点击更换验证码 - openGPS提示

AD