不积跬步,无以至千里;不积小流,无以成江海。

Dean's blog

  • Join Us on Facebook!
  • Follow Us on Twitter!
  • LinkedIn
  • Subcribe to Our RSS Feed

手动安装 Scrapy

之前安装Scrapy的时候,都是使用工具来安装,这样解决包依赖的问题比较方便,但是最近在使用工具安装Scrapy却一直安装不了,后来在网上找到手工安装的过程,记录如下: 1.安装lxml: pip i [更多...]

Scrapy 下载图片和文件

Scrapy内置了FilesPipeline和ImagesPipeline,使用它可以简化载图片、文件的下载过程。我们只需要对爬虫做简单调整,即可实现,甚于还可以在下载图片的同时生成所需要的缩略图,如果对默认生成的文件名不注意,还可以自定义Pipeline重新定义。本篇记录这些需求的开发过程。 [更多...]

使用Scrapy Shell命令测试提取数据

在开发爬虫的时候,从网页上提取数据是一件非常重要的、琐碎的、容易出错的事情。如果都是通过运行爬虫来测试,这个未免太过麻烦。幸好Scrapy早已针对这个问题提供了专门的Shell命令,熟练使用Shell命令,可以起来事半功倍的效果。 [更多...]
粤ICP备17049187号-1