批量网页内容爬虫(附正则表达式)

  • Post author:
  • Post category:其他

最近,我可爱的女朋友有一个新的任务,需要复制网页上的部分内容,多达1500多页,到word文档中,既有文字,又有图片,十分复杂。是不是可以使用爬虫的方法解决一下子呢? 首先分析网页:  每一页有30个新闻文章,首先爬取页面内的文章的链接  分析页面后,得到文章链接的样式,再利用正则表达式选出来。 #爬取每一页得链接 list2=[] url='https://www' for i in range…

继续阅读 批量网页内容爬虫(附正则表达式)

windows 下通过bat文件 执行PHP脚本

  • Post author:
  • Post category:php

1、建立PHP脚本,如下:go.php <?php file_put_contents('D:\\www\\1.txt','ok'); ?> 使用绝对路径,否则代码将正确执行但是文件将不会被创建。  2、新建go.bat文件,代码如下: "D:\xampp\php\php.exe" -f "D:\www\go.php" 在命令行执行php 的前提是将php加入到环境变量 3. 点击执行…

继续阅读 windows 下通过bat文件 执行PHP脚本

Url重写的简单方法

  • Post author:
  • Post category:其他

 protected void Application_BeginRequest(Object sender, EventArgs e)    {        string oldUrl = HttpContext.Current.Request.RawUrl;         string pattern = @"^(.+)News(/d+)/.html(/?.*)*$";        st…

继续阅读 Url重写的简单方法

Nginx编译安装Lua模块遇到的大坑

  • Post author:
  • Post category:其他

        昨晚一直在弄Nginx安装Lua模块,一开始我是yum install nginx安装的Nginx,这样的话就不需要编译安装的那么麻烦,在安装Lua模块的过程中,我想更新下Pcre的版本,结果把系统搞炸了,删除了不该删的文件(可能当时我用的root权限的,直接rpm -e --nodeps xxxx)就把pcre给卸载了,结果阿里云的服务器炸了,远程连接也断了,后面尝试着恢复,但是…

继续阅读 Nginx编译安装Lua模块遇到的大坑

C++17新特性个人总结

  • Post author:
  • Post category:其他

目录   C++17 1 关键字 1.1 constexpr 1.2 static_assert 1.3 auto 1.4 typename 1.5 inline 2 语法 2.1 折叠表达式 2.2 结构化绑定 2.3 允许非类型模板参数进行常量计算 2.4 条件分支语句初始化 2.5 聚合初始化 2.6 嵌套命名空间 2.7 lambda表达式捕获*this的值 2.8 枚举[类]对象的构造 …

继续阅读 C++17新特性个人总结

前端学习3:HTML属性

  • Post author:
  • Post category:其他

目录 一、HTML属性 二、HTML基本属性  三、实例 1.定义标题属性 2. 定义HTML文档的主体属性  3.定义HTML表格属性  四、不赞成使用的标签和属性 1.背景颜色 2.字体、颜色和字体大小  3.文本对齐 一、HTML属性 HTML标签可以拥有属性。属性为HTML元素提供了更多的信息。 属性总是以名称/之对的形式出现,比如:id="root". 属性总是在HTML元素的开始标签中…

继续阅读 前端学习3:HTML属性

10年报表开发经验总结:掌握这5点,没有做不好的报表

  • Post author:
  • Post category:其他

开发报表是数据分析师必备技能之一,目前市场上,绝大部分的数据分析师的工作时间都是用来做报表。报表是维持公司正常生产运营重要的一部分,企业的业务发展状况、财务状况等等都需要通过报表来监测。 然而很多企业的数据分析师或者报表工程师在报表开发的过程中总遇到这样的问题:每天接需求,接需求,费尽心血做了一堆的报表,但是感觉没什么用。有的报表改了又改,业务总是不满意,最后好不容易改好了,功劳还都是业务部门的,…

继续阅读 10年报表开发经验总结:掌握这5点,没有做不好的报表

hue 连接hbase 2.0.2报错:PopupException: Api Error: TSocket read 0 bytes

  • Post author:
  • Post category:其他

1、先要启动 hbase thrift service,ambari HDP 默认没有启动hbase thrift,需要自己手动启动。在HBase Master节点上执行: # su - hbase # /usr/hdp/current/hbase-client/bin/hbase-daemon.sh start thrift 2、hue官网查询需进行如下配置: 3、 thrift.transpo…

继续阅读 hue 连接hbase 2.0.2报错:PopupException: Api Error: TSocket read 0 bytes