花生酱
不忘初心,方得始终!
花生酱的小屋
Pu口袋校园爬虫(PuSchool-Crawler)

功能

利用此爬虫可以爬取同校同学的学号、姓名以及学分;

此脚本利用了此网址,可以看到登录后,数据本身就是公开的,此脚本便于统计数据;(请勿用于非法用途)

https://ptype.info/wp-content/uploads/2020/02/学分-1024x674.png

排行榜

用法

此处替换成你的cookie

'Cookie': 'You cookie'

此处替换成你学校Pu校园的url

url = 'http://cszyedu.pocketuni.net/index.php?app=event&mod=School&act=rank&k=3&p={page}'

然后执行它即可!

Python pu.py

即可统计你需要的数据!

GitHub地址

源代码

from bs4 import BeautifulSoup
import requests
import re

headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.143 Safari/537.36',
'Connection': 'keep-alive',
'accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8',
'Cookie': 'You cookie'
}

urllist = []
for i in range(669):
    url = 'http://cszyedu.pocketuni.net/index.php?app=event&mod=School&act=rank&k=3&p={page}'.format(page=i)
    urllist.append(url)


for url in urllist:
    r=requests.get(url,headers = headers)
    urllist.append(r)
    soup=BeautifulSoup(r.content,'html.parser')
    print(soup.name)
    t = soup.find_all(re.compile('^td'))

    for title in t:
        print(title.string)
        with open("cszypu.txt", 'a', encoding='utf-8') as a:
            a.write(str(title.string)+'\n')
赞赏

花生酱

文章作者

分享学习笔记,不忘初心,方得始终!

推荐文章

发表评论

textsms
account_circle
email

花生酱的小屋

Pu口袋校园爬虫(PuSchool-Crawler)
功能 利用此爬虫可以爬取同校同学的学号、姓名以及学分; 此脚本利用了此网址,可以看到登录后,数据本身就是公开的,此脚本便于统计数据;(请勿用于非法用途) 排行榜 用…
扫描二维码继续阅读
2020-02-25