SuperSet安装和使用

  • Post author:
  • Post category:其他




1、SuperSet概述

Apache Superset 是一个现代的数据探索和可视化平台。它功能强大且十分易用,可对接

各种数据源,包括很多现代的大数据分析引擎,拥有丰富的图表展示形式,并且支持自定义

仪表盘。



2、安装SuperSet



①python环境安装

Superset 是由 Python 语言编写的 Web 应用,要求 Python3.7 的环境。而CentOS系统自带python版本是2.7.5,不满足SuperSet的要求。

而如果升级系统Python环境会影响系统本身一些以来python环境应用的使用,比如yum,所以我们系统需要存在多个不同版本的Python



②安装Miniconda

# 需要有wget工具,没有的话安装wget
yum -y install wget
# 下载miniconda
wget -c https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh
# 安装miniconda
bash Miniconda3-latest-Linux-x86_64.sh

在安装过程中,出现以下提示时,可以指定安装路径

在这里插入图片描述

加载环境变量配置文件,使之生效

source ~/.bashrc

取消激活 base 环境

Miniconda 安装完成后,每次打开终端都会激活其默认的 base 环境,我们可通过以下命

令,禁止激活默认 base 环境。

conda config --set auto_activate_base false



③创建python3.7环境

配置conda国内镜像

conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main

创建python3.7环境

conda create --name superset python=3.7

conda常用命令

# 创建环境
conda create -n env_name python=3.7
# 查看所有环境
conda info --envs
# 删除一个环境
conda remove -n env_name --all
# 激活环境
conda activate env_name

conda启动环境脚本

#!/bin/bash

# ~/.bashrc中conda环境的命令,要加这一段才能再shell中使用conda命令
# >>> conda initialize >>>
# !! Contents within this block are managed by 'conda init' !!
__conda_setup="$('/opt/modules/miniconda3/bin/conda' 'shell.bash' 'hook' 2> /dev/null)"
if [ $? -eq 0 ]; then
    eval "$__conda_setup"
else
    if [ -f "/opt/modules/miniconda3/etc/profile.d/conda.sh" ]; then
        . "/opt/modules/miniconda3/etc/profile.d/conda.sh"
    else
        export PATH="/opt/modules/miniconda3/bin:$PATH"
    fi
fi
unset __conda_setup
# <<< conda initialize <<<

case $1 in
"start"){
        echo "==========启动superset python3.7 环境=========="
        conda activate superset
        conda info --envs
};;
"stop") {
        echo "==========关闭superset python3.7 环境=========="
        conda deactivate
        conda info --envs
};;
esac

命令使用如下:

source superset_py_env.sh start
source superset_py_env.sh stop

之所以用source执行脚本,如果不用source liunx会默认生成一个子线程执行命令,所以主线程的环境仍然不会改变,所以要用source

因为调用./a.sh来执行shell是在一个子shell里运行的,所以执行后,结构并没有反应到父shell里,但是source不同他就是在本shell中执行的,所以能够看到结果。



④安装SuperSet

更换yum源

cd /etc/yum.repos.d/
wget -nc http://mirrors.aliyun.com/repo/Centos-7.repo
mv CentOS-Base.repo CentOS-Base.repo.back
mv CentOS-7.repo CentOS-Base.repo
mv Centos-7.repo CentOS-Base.repo

下载SuperSet

# 安装依赖
sudo yum install -y gcc gcc-c++ libffi-devel python-devel python-pip python-wheel python-setuptools openssl-devel cyrus-sasl-devel openldap-devel
# 安装和更新setuptools 和 pip
pip install --upgrade setuptools pip -i https://pypi.tuna.tsinghua.edu.cn/simple
# pip换源
pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple
# 安装Superset
pip install apache-superset
# 没换源的话可以指定源安装
# pip install apache-superset -i https://pypi.tuna.tsinghua.edu.cn/simple
# 初始化SuperSet数据库
superset db upgrade
# 创建管理员用户
export FLASK_APP=superset
superset fab create-admin
# Superset 初始化
superset init



3、启动SuperSet



①安装 gunicorn

pip install gunicorn

gunicorn 是一个 Python Web Server,可以和 java 中的 TomCat 类比



②启动和停止SuperSet

# 启动
gunicorn --workers 5 --timeout 120 --bind 虚拟机地址:8787 "superset.app:create_app()" --daemon
# 停止
ps -ef | awk '/superset/ && !/awk/{print $2}' | xargs kill -9

–workers:指定进程个数

–timeout:worker 进程超时时间,超时会自动重启

–bind:绑定本机地址,即为 Superset 访问地址

–daemon:后台运行



③superset启停脚本

#!/bin/bash
superset_status(){
	result=`ps -ef | awk '/gunicorn/ && !/awk/{print $2}' | wc -l`
	if [[ $result -eq 0 ]]; then
		return 0
	else
		return 1
	fi
}
superset_start(){
	source ~/.bashrc
	superset_status >/dev/null 2>&1
	if [[ $? -eq 0 ]]; then
		conda activate superset ; gunicorn --workers 5 --timeout 120 --bind 虚拟机地址:8787 --daemon 'superset.app:create_app()'
	else
		echo "superset 正在运行"
	fi
}
superset_stop(){
	superset_status >/dev/null 2>&1
	if [[ $? -eq 0 ]]; then
		echo "superset 未在运行"
	else
		ps -ef | awk '/gunicorn/ && !/awk/{print $2}' | xargs kill -9
	fi
}
case $1 in
	start )
		echo "启动 Superset"
		superset_start
	;;
	stop )
		echo "停止 Superset"
		superset_stop
	;;
	restart )
		echo "重启 Superset"
		superset_stop
		superset_start
	;;
	status )
		superset_status >/dev/null 2>&1
		if [[ $? -eq 0 ]]; then
			echo "superset 未在运行"
		else
			echo "superset 正在运行"
		fi
esac

加执行权限:

chmod u+x superset.sh



4、Superset 使用



①准备 MySQL 数据源

安装依赖

conda install mysqlclient

对接不同的数据源,需安装不同的依赖,以下地址为官网说明

https://superset.apache.org/docs/databases/installing-database-drivers

重启SuperSet



②数据源配置

添加数据库:

在这里插入图片描述

添加数据表

在这里插入图片描述



版权声明:本文为tyh1579152915原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。