卓尔高考网

《使用python获取历年全国各省高考录取分数线数据》代码,python爬取各大高校录取分数

前段时间高考时制作了一个使用大蟒爬取历年高考各省分录取分数线的视频,但忘了放上代码,现在给大家补上:

之前有录制视频教程,详见:https://www。伊克西瓜。com/6846952000320438787/

《使用python获取历年全国各省高考录取分数线数据》代码,python爬取各大高校录取分数

# coding=gbk import requestsimport JSON from lxml import etree headers={ ' User-Agent ' : ' Mozilla/5.0(Windows NT 6.1;win 64x 64)apple WebKit/537.36(KHTML,像壁虎一样)Chrome/74 .',}def downloadtxt(url,coding='utf-8 ',num _ retries=2): try :请求。包裹。URL库3。disable _ warnings()html=请求。get(URL,headers=headers,verify=False)html。编码=编码返回html。文本异常为e : if num _ retries 03360 if有属性(e,' code ')和500=e .代码600:返回downloadtxt(urlHTML(HTML。文本)异常为e : if num _ retries 0: if有attr(e,' code ')和500=e . code 600: return download(URL,num _ retries-1)print(e)return def run(): #要想获得相应年份的数据可修改下列数字,如你要获取2019年的,那就改为2019年,2020年为I在范围内(2020,2021):原文网址='https://api.eol.cn/gkcx/api/?page=1 size=20 uri=API data/API/GK/score/proprovinceyear={ } ' .格式(I)选择器=下载txt(原始URL)JSON数据=JSON。loads(selector)num found=JSON data[' data '][' num found ']for j in range(1,int(num found/20)2): try : URL='https://api.eol.cn/gkcx/api/?page={ } size=20 uri=API data/API/GK/score/proprovinceyear={ } ' .format(j,I)选择器2=下载txt(URL)JSON数据2=JSON。为JSON data 2[' data '][' item ']: try : average=info[' average ']id=info[' id ']local _ batch _ name=info[' local _ batch _ name ']local _ province _ name=info[' local _ province _ name ']local _ type _ name=info[' local _ type _ name ']year=info format(average,id,local _ batch _ name,local _ province _ name,local _ type _ name,year继续,除了作为e:打印(五)继续_ _ name _ _==' _ _ main _ _ ' :运行()

您可能还会对下面的文章感兴趣: