如何利用Tumblr汤不热爬虫脚本保存小哥哥小姐姐图片视频?

  • A+

大家都知道汤不热了凉了,可以关注的各位小哥哥小姐姐姐的图片大家肯定都舍不得。在凉之前想把所有大姐姐小姐姐全都抢救出来,今天试了一下成功了。
之前有大神发过用 python 爬虫爬汤不热图片视频的贴子。操作操都一要的。须要一点点文本编辑 和命令行的知识
首先自己下载好 python 并安装好
然后到谷歌的 GitHub xuanhun/tumblr-crawler 下载大神编好的 python 汤不热爬虫脚本 把脚本解压后放在一个空间大一点的硬盘里(一会下载下来的小姐姐门要住的,太小不够住)然后运行 cmd 在dos命令行下进入到角本所在目录(前掉是先安装好了python)
命令 : pip install -r requirements.txt (安装依赖)


然后在电脑上打开汤不热,把所有你关注的人一页页复制下来。贴到 word文件里 然后用查找替换的方式把多的字符删掉 如:
aa414258
已于 1 个月前 更新

godmmm
已于 1 周前 更新

ad-microkini
已于 11 个月前 更新

hw7232
已于 10 个月前 更新

把中间的 已于 XXXXX 更新 替换删除 我不是很懂 wrod 替换删除 了 “已于” 再替换删除 “更新” 再替换删除 什么年 月日 时 最后是数字 1 2 3 4 5 后边还有几个不多的就手动删除了。
最后把两个段落符号 替换成了 英文的逗号 ,最后格式如:hoverwatch,shmily9921,luolili,hentaidongman,foundpoision,kmmmmmmo,mu-rn(汤不热用户名 用逗号隔开)
然后把搞好格试的 汤不热用户名复制到 sites.txt 文件里 并保存好
挂好全局代里
然后在命令行 进入到 目录 tumblr-crawler-master 然后运行命令
python tumblr-photo-video-ripper.py
然后你所关注用的所有视频和图片都会保存在 以汤不热用户名命名的文件夹里
至于代理我是撸谷歌300刀的羊毛的。感谢一次谷歌
脚本文件夹里 README_CN.md 文件是中文的使用说明,不懂可以用记事本或Notepad++打开 自己研究下。
不说了,我哪块盘只剩100来G了,要去腾点地方给小姐姐们住。

艾薇资讯

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: