登录
    Technology changes quickly but people's minds change slowly.

挖掘机科学与技术学院滴学霸宿舍的舍长

ubuntu 16.04 安装tomcat8.0

ubuntu 16.04 安装tomcat8.0
一、下载tomcat http://tomcat.apache.org/download-80.cgi 我们下载Linux版的tomcat 下载完,解压到/usr/local/ 目录下 配置tomcat 根据tomcat目录下running.txt 我们来配置几个路径 一是tomcat根路径,再一个是Java的路径 A.在bin/startup.sh里面……继续阅读 »

破玉 8年前 (2017-05-30) 1590浏览 0评论 0个赞

python 爬虫处理asp中的__VIEWSTATE与__EVENTVALIDATION

python 爬虫处理asp中的__VIEWSTATE与__EVENTVALIDATION
最近在处理一个aspx页面遇到一点小麻烦,页面中有几个参数不好处理,因为是hidden域,所以无法直接赋值进行提交。 ViewState的原理 1.浏览器请求Default.aspx页面 2.在服务器端 发现创建的ViewState 这个时候 会自动创建一个名字叫做__VIEWSTATE(双下滑线 全部是大写) 的隐藏域 其隐藏域的值经过base64加密以后……继续阅读 »

破玉 8年前 (2017-05-22) 6244浏览 1评论 4个赞

用 Windows 的组策略设置chrome扩展白名单

用 Windows 的组策略设置chrome扩展白名单
  最近在使用某个chrome扩展时,老是提示”请停用以开发者模式运行的扩展程序”,经过搜索发现通过Windows 的组策略设置扩展白名单可以有效的解决这个问题。 一、windows10家庭版安装组策略功能 windows10的专业版带有组策略功能,而windows10家庭版需要自己安装 提供以下两种方式: 1. ……继续阅读 »

华裳绕指柔 8年前 (2017-05-04) 2165浏览 0评论 0个赞

利用Python将网页保存为PDF文件

利用Python将网页保存为PDF文件
环境简介 wkhtmltopdf可以直接把任何一个可以在浏览器中浏览的网页直接转换成一个pdf,首先说明一下它不是一个python库,而是一个把html页面转换成pdf的一个软件,我们需要在系统上安装它。 Ubuntu 16.04 安装wkhtmltopdf $ sudo apt-get install wkhtmltopdf 然后Python需要使……继续阅读 »

破玉 8年前 (2017-04-20) 2232浏览 0评论 0个赞

python爬虫获取搜狐新闻

python爬虫获取搜狐新闻
  本次我们来分析搜狐新闻来抓取一些文章来作为我们以后的数据,开发过程中,我们需要用到requests库来处理我们的HTTP请求,Beautifulsoup库来处理我们的HTML文档。由于我们只是获取一部分资讯,所以我们不准备使用队列和多线程来获取所有的内容。只是简单的对文章内容做一些处理。 获取部分文章的链接 我们针对搜狐新闻的要闻部分……继续阅读 »

破玉 8年前 (2017-04-16) 1669浏览 0评论 0个赞

Python 爬虫入门篇(二)–爬呀爬文章

Python 爬虫入门篇(二)–爬呀爬文章
寻找目标 由于刚刚接触目标,我们肯定要找一个好爬的资讯网站啊,这样爬成功了我们才会有点成就感,以鼓励自己继续学习。此篇文章中,我们以金融之家这个资讯网站为例来爬取文章 爬取之前的工作 分析网站内容,进行抓取 我们借助于chrome浏览器审查元素的功能,首先对网站进行分析 借助于审查元素,我们就可以获取这个元素对应的html标签代码,我们要获取这个元素中的……继续阅读 »

破玉 8年前 (2017-03-02) 1566浏览 0评论 0个赞

Python爬虫之Requests库

Python爬虫之Requests库
引言      Requests 允许你发送纯天然,植物饲养的 HTTP/1.1 请求,无需手工劳动。你不需要手动为 URL 添加查询字串,也不需要对 POST 数据进行表单编码。Keep-alive 和 HTTP 连接池的功能是 100% 自动化的,一切动力都来自于根植在 Requests 内部的 urllib3。 ……继续阅读 »

破玉 8年前 (2017-02-25) 1793浏览 0评论 0个赞

利用爬虫自动为wordpress发布文章(一)

利用爬虫自动为wordpress发布文章(一)
python-wordpress-xmlrpc介绍   python-wordpress-xmlrpc 是一个开源的Python第三方库,借助于该开源库,我们可以实现利用Python代码为wordpress发布文章,于是学习该库成为我们实现自动发布文章一个重要步骤。该库的简介以及文档详见python-wordpress-xmlrpc 安装……继续阅读 »

破玉 8年前 (2017-02-24) 4749浏览 0评论 3个赞

Python 爬虫入门篇(一)–初见爬虫

Python 爬虫入门篇(一)–初见爬虫
爬虫踪影   每时每刻,搜索引擎和网站都在采集大量的信息。而他们采用信息的程序就被叫做“爬虫”,这个名字十分形象,程序就像一个个小虫子,采集完数据进行处理。一般都是先“爬”到对应的网页上,在把需要的信息“铲”下来。而作为一个站长,掌握爬虫技术,就可以十分方便的管理自己网站的内容,或者是使自己更加安全的管理自己的网站。 创建爬虫  ……继续阅读 »

破玉 8年前 (2017-02-22) 1625浏览 0评论 0个赞