正则表达式及python中re库的使用

  • Post author:
  • Post category:python

正则表达式是一个特殊的字符序列 它能够帮助用户便捷的检查一个字符串是否符合某种规则模式 元字符 -具有特殊意义的专用字符 -用来描述字符串的边界的元字符 -开始'^' 结尾'$' 常用的元字符 . 匹配任意字符(除\n) \w小写 匹配 字母、数字下划线 \W大写 匹配非字母、数字下划线 \s小写 匹配任意 空白字符 \S大写 匹配任意非空白字符 \b 匹配位于开头或结尾的空字符串 \d 匹配任意…

继续阅读 正则表达式及python中re库的使用

Databend 设计概述 | 白皮书

  • Post author:
  • Post category:其他

Databend 是一个开源的、完全面向云架构的新式数仓,它提供快速的弹性扩展能力,并结合云的弹性、简单性和低成本,使 Data Cloud 构建变得更加容易。 Databend 把数据存储在像 AWS S3 ,Azure Blob 这些云上的存储系统,可以使不同的计算节点挂载同一份数据,从而做到较高的弹性,实现对资源的精细化控制。 Databend 在设计上专注以下能力: 弹性 在 Databe…

继续阅读 Databend 设计概述 | 白皮书

JDK简单环境配置

  • Post author:
  • Post category:其他

JDK的环境配置 一、下载安装jdk(此处省略) 二、配置环境变量 找到“此电脑”,右键选择属性,选择高级系统设置 点击环境变量 在系统变量区域内点击新建进行编辑 变量名为JAVA_HOME,变量值为 自己安装jdk的路径 编辑path变量 配置完成 三、检验是否配置成功 按住键盘win+r,打开运行,输入cmd,打开命令行窗口 输入 java -version 获取当前安装版本 注意:java后…

继续阅读 JDK简单环境配置

tensorflow2.0实现mnist手写数字识别代码

  • Post author:
  • Post category:其他

import tensorflow as tf from tensorflow import keras from tensorflow.keras import layers, datasets, Sequential, optimizers, metrics (x_train, y_train), (x_test, y_test) = tf.keras.datasets.mnist.load_…

继续阅读 tensorflow2.0实现mnist手写数字识别代码

Spark报错:Initial job has not accepted any resources

  • Post author:
  • Post category:其他

警告信息:初始化job的时候,没有获取到任何资源,检查你的集群,确保workers已经被注册和有足够的内存资源。 问题出现的可能原因:worker节点没有启动;你分配的内存资源超过worker节点的内存容量(就是内存溢出了);还要一种可能就是zooKeeper的问题,不能够协调worker了。 版权声明:本文为BigData_Mining原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附…

继续阅读 Spark报错:Initial job has not accepted any resources

LeetCode——169.多数元素

  • Post author:
  • Post category:其他

题目如下: 给定一个大小为 n 的数组,找到其中的多数元素。多数元素是指在数组中出现次数大于 ⌊ n/2 ⌋ 的元素。 你可以假设数组是非空的,并且给定的数组总是存在多数元素。 示例 1: 输入: [3,2,3] 输出: 3 示例 2: 输入: [2,2,1,1,1,2,2] 输出: 2 自己的算法及代码如下: 看到这个题目,首先想到用 HashMap,但写了一下,没写出来;然后想到 Set 集合…

继续阅读 LeetCode——169.多数元素

从零开始建网站(一):

  • Post author:
  • Post category:其他

出来工作也快两年了,一直做的是前端工程师的工作,临近年底,想到现在也是比较空闲,就打算自己建立一个个人网站。这个系列的博文我也是打算一直持续更新下去,记录下自己建站的一点一滴。 好了,话不多说了,现在就开始搭建网站: 要建立个人网站,有三个必备要素:域名、服务器和程序。域名我是从腾讯云上购买的,最近刚好有活动1块钱就可以买一个域名使用一年,毕竟是打算自己用来学习的,就没有买太好的域名,选了一个.c…

继续阅读 从零开始建网站(一):

EduCoder Java高级特性 – 多线程基础(3)线程同步

  • Post author:
  • Post category:java

第1关:并发编程的三个概念 任务描述 在我们进行应用开发的时候,常常会关注网站的并发,如果网站的用户量很多,当这些用户同时访问一个服务的时候,我们的服务器就会接收到大量的并发请求,处理好这些并发请求是一个合格程序员必须要完成的工作。 理解并发编程的三个概念对于我们更好的开发高并发的 Web 应用有很大的帮助。 本关的任务就是理解并发编程的三个重要概念并完成右侧选择题。 1、在并发编程中,我们需要以…

继续阅读 EduCoder Java高级特性 – 多线程基础(3)线程同步

python爬虫:去掉重复的URL(爬取博客园中每页标题和url)

  • Post author:
  • Post category:python

1.爬取博客园中每页每条新闻的标题和url,在cnblog.py中写入操作内容(增加对每页的爬取) # -*- coding: utf-8 -*- import scrapy import sys import io from..items import cnlogsItem from scrapy.selector import Selector from scrapy.http import …

继续阅读 python爬虫:去掉重复的URL(爬取博客园中每页标题和url)

Linux安装lsof

  • Post author:
  • Post category:linux

需要先判断系统类型; Ubuntu判断方法: cat /etc/issue RedHat、CentOS判断方法: cat /etc/redhat-release 安装lsof; CentOS: yum install lsof Ubuntu: apt-get install lsof 版权声明:本文为to_gether原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声…

继续阅读 Linux安装lsof