阡陌居

 找回密码
 立即注册
搜索
热搜: 新人报到
查看: 10|回复: 0

[实体·科学技能] 《用Python写网络爬虫》作者:[澳]理查德 劳森【EPUB】

[复制链接]

用户组:举人

      UID
21718
      积分
1442
      回帖
568
      主题
237
      发书数
223
      威望
816
      铜币
2316
      贡献
0
      阅读权限
50
      注册时间
2025-12-2
      在线时间
59 小时
      最后登录
2025-12-15
发表于 2025-12-15 13:13 | 显示全部楼层 |阅读模式

内容简介  · · · · · ·

作为一种便捷地收集网上信息并从中抽取出可用信息的方式,网络爬虫技术变得越来越有用。使用Python这样的简单编程语言,你可以使用少量编程技能就可以爬取复杂的网站。

《用Python写网络爬虫》作为使用Python来爬取网络数据的杰出指南,讲解了从静态页面爬取数据的方法以及使用缓存来管理服务器负载的方法。此外,本书还介绍了如何使用AJAX URL和Firebug扩展来爬取数据,以及有关爬取技术的更多真相,比如使用浏览器渲染、管理cookie、通过提交表单从受验证码保护的复杂网站中抽取数据等。本书使用Scrapy创建了一个高级网络爬虫,并对一些真实的网站进行了爬取。






本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|阡陌居

GMT+8, 2025-12-15 16:54 , Processed in 0.083899 second(s), 28 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表