环境简介
wkhtmltopdf可以直接把任何一个可以在浏览器中浏览的网页直接转换成一个pdf,首先说明一下它不是一个python库,而是一个把html页面转换成pdf的一个软件,我们需要在系统上安装它。
Ubuntu 16.04 安装wkhtmltopdf
$ sudo apt-get install wkhtmltopdf
然后Python需要使……继续阅读 »
破玉
8年前 (2017-04-20) 2230浏览 0评论
0个赞
本次我们来分析搜狐新闻来抓取一些文章来作为我们以后的数据,开发过程中,我们需要用到requests库来处理我们的HTTP请求,Beautifulsoup库来处理我们的HTML文档。由于我们只是获取一部分资讯,所以我们不准备使用队列和多线程来获取所有的内容。只是简单的对文章内容做一些处理。
获取部分文章的链接
我们针对搜狐新闻的要闻部分……继续阅读 »
破玉
8年前 (2017-04-16) 1669浏览 0评论
0个赞