前言:

用过python的人应该都会知道爬虫这个东西,网络爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫。

今天就来讲讲如何利用爬虫技术刷网课

实战:

最近学校又推送了一波网课,一个一个的看实在太费时间,于是乎就想到了爬虫来自动刷网课。

第一步

分析网站源代码,看看网站是如何上传用户的数据的。

这是我们的主站

这是我们要刷的课程

接下来就开始分析源代码了哦,

这个就是播放视频相关的js代码。

我们点进去找找播放之后上传相关的函数。

从这个javascript函数我们可以看到这个是播放完毕以后上传到服务器的json数据包。

我们只需要两个参数就可以实现这个函数的重放了。

courseId就是url里面的419

couttentkpointId就是url里面的10506

每个视频的pointid不一样,我们只需要for循环遍历就行了。

第二步

接下来我们就需要看看这个网站是如何登录的了。

看到没,这个网站连验证码都没有,模拟登录就是小儿科了。

打开我们的brup suite抓个包看看,当然也可以不需要抓包,直接分析源代码就可以,照顾一下新手,我们就来抓个包吧。

从这里我们就可以看到这是一个POST方法,三个参数分别是account,password,ipForget。

好的接下来我们就用python来模拟登陆了。

第三步

首先在终端下面安装一下requests。我的系统是mac os

这个是已经安装好了的,没有安装就安装一下,windows是需要先安装python的。这里我就不讲如何安装了。

然后打开我们的代码编辑器。我这里用的是sublime.

代码如下:

首先就是一个登陆,登陆之后我们就有了cookie,然后利用这个cookie来发包刷网课就行了。

文章结尾:

这个网站还是存在很多问题的,如何登陆缺乏验证就可快速爆破,在笔记的地方存在xss漏洞,具体分析过程我在这里就不写了。谢谢大家。