前两天在 Hostloc 看到了有人发了广东省立中山图书馆目前公开了 6133 本免费电子书(其实是 6113 本)可供下载。
我看了一下发现下载源是超星,呐,都是大家的老朋友了,直接爬吧。
于是就花了五分钟写了个“爬虫”,一个晚上可算是下好了,100M 宽带真不给力啊(落泪)。
广东省立中山图书馆
来源:http://gdslzstsg.superlib.libsou.com/node/409.jspx
日期:2020-04-10
数量:6133(实际有效 6113)
大小:224.16 GB
看代码吧,只需要一个 requests
库。当然,都 0202 年了,必须得上 Python 3 咯。另外,这个下载是单线程的,也没有任何异常处理,毕竟五分钟写的要啥自行车(狗头保命)。
至于这个 books.json
文件是怎么来的,用 Chrome 抓一下就知道了。
这里直接给出此文件的链接:传送门
至于伸手党们想直接转存这 224GB 的电子书,你们就自己找办法联系我问我要吧。
2020年05月04日更新:百度网盘暂时不分享了,因为之前嫌占地方就删掉了,可以找其他已经保存的人转存下,这里再给一个 GD 链接好了:https://drive.google.com/drive/folders/1Ab2_JSxuZvPYbypY3eQQWr0Zhmd0f0QV?usp=sharing
本文由 imbytecat 创作,采用 知识共享署名4.0 国际许可协议进行许可
本站文章除注明转载/出处外,均为本站原创或翻译,转载前请务必署名
最后编辑时间为: May 28, 2020 at 08:13 pm
感谢大佬提供脚本
学习一下
下了那么多电子书看的完吗
看不完 😂 找起来方便点