登录
    Technology changes quickly but people's minds change slowly.

2017年04月的内容

技术宅

利用Python将网页保存为PDF文件

利用Python将网页保存为PDF文件
环境简介 wkhtmltopdf可以直接把任何一个可以在浏览器中浏览的网页直接转换成一个pdf,首先说明一下它不是一个python库,而是一个把html页面转换成pdf的一个软件,我们需要在系统上安装它。 Ubuntu 16.04 安装wkhtmltopdf $ sudo apt-get install wkhtmltopdf 然后Python需要使……继续阅读 »

破玉 7年前 (2017-04-20) 2158浏览 0评论 0个赞

人丑多读书

python爬虫获取搜狐新闻

python爬虫获取搜狐新闻
  本次我们来分析搜狐新闻来抓取一些文章来作为我们以后的数据,开发过程中,我们需要用到requests库来处理我们的HTTP请求,Beautifulsoup库来处理我们的HTML文档。由于我们只是获取一部分资讯,所以我们不准备使用队列和多线程来获取所有的内容。只是简单的对文章内容做一些处理。 获取部分文章的链接 我们针对搜狐新闻的要闻部分……继续阅读 »

破玉 7年前 (2017-04-16) 1553浏览 0评论 0个赞