盘天下 | 免费精选资源分享

用 Python 写网络爬虫(第2版)

出版刊物 盘天下 | 网盘资源分享 2024-12-12 944 0


作者简介

Katharine Jarmul 是 德国 柏林的一位 数据 科学 家和 Python 支持者。她 经营 了一家数据科学咨询公司——Kjamistan,为不同规模的 企业 提供诸如数据抽取、采集以及建模的服务。她从 2008 年开始使用 Python 进行 编程 ,从 2010 年开始使用 Python 抓取网站,并且在使用 网络 爬虫 进行 数据分析 和机器 学习 的不同规模的初创企业中 工作 过。读者可以通过 Twitter(@kjam)关注她的想法以及动态。
Richard Lawson 来自澳大利亚,毕业于墨尔本大学 计算机 科学专业。毕业后,他创办了一家专注于网络爬虫的公司,为超过 50 个国家的业务提供远程工作。他精通 世界 语,可以使用汉语和 韩语 对话,并且积极投身于开源 软件 事业。他目前正在牛津大学攻读研究生学位,并利用业余 时间 研发自主无人机。
译者介绍
李斌,毕业于北京 科技 大学 计算机科学与技术 专业,获得硕士学位。曾任职于阿里巴巴,当前供职于凡普金科,负责应用安全工作。热爱 Python 编程和 Web 安全,希望以更加 智能 和自动化的方式提升 网络安全 。博客地址为 python er.com。

用 Python 写网络爬虫(第2版)

内容简介

《用 Python 写网络爬虫(第2版)》包括网络爬虫的定义以及如何爬取网站,如何使用几种库从网页中抽取数据,如何通过缓存结果避免重复下载的问题,如何通过并行下载来加速数据抓取,如何利用不同的方式从动态网站中抽取数据,如何使用叔叔及导航等表达进行搜索和登录,如何访问被验证码图像保护的数据,如何使用 Scrapy 爬虫框架进行快速的并行抓取,以及使用 Portia 的 Web 界面构建网路爬虫。

Katharine Jarmul 是德国柏林的一位数据科学家和 Python 支持者。她经营了一家数据科学咨询公司——Kjamistan,为不同规模的企业提供诸如数据抽取、采集以及建模的服务。她从 2008 年开始使用 Python 进行编程,从 2010 年开始使用 Python 抓取网站,并且在使用网络爬虫进行数据分析和机器学习的不同规模的初创企业中工作过。读者可以通过 Twitter(@kjam)关注她的想法以及动态。

Richard Lawson 来自澳大利亚,毕业于墨尔本大学计算机科学专业。毕业后,他创办了一家专注于网络爬虫的公司,为超过 50 个国家的业务提供远程工作。他精通世界语,可以使用汉语和韩语对话,并且积极投身于开源软件事业。他目前正在牛津大学攻读研究生学位,并利用业余时间研发自主无人机。

译者介绍

李斌,毕业于北京科技大学计算机...

下载地址

【新用户手机夸克APP转存可以获得1TB免费空间】

夸克网盘「电影」精选合集:https://pan.quark.cn/s/0755e002f4b6

夸克网盘「纪录片」精选合集:https://pan.quark.cn/s/8c76cd47e8be

夸克网盘「短剧」精选合集:https://pan.quark.cn/s/0f27fae4301e

夸克网盘「音乐」精选合集:https://pan.quark.cn/s/c999e39a7f49

夸克网盘「教程」精选合集:https://pan.quark.cn/s/27984fcacdad

夸克网盘「书籍」精选合集:https://pan.quark.cn/s/2532536273dd

冲上云霄

转载请注明出处,本文链接:https://www.80srz.com/pantx/47056.html

(0)
收藏 (0)

评论列表