在数据生产应用部门,取数分析是一个很常见的需求,实际上业务人员需求时刻变化,最高效的方式是让业务部门自己来取。本文就来手把手教大家搭建一个 Python 连接数据库,快速取数工具,需要的可以参考一下。
目录
在数据生产应用部门,取数分析是一个很常见的需求,实际上业务人员需求时刻变化,最高效的方式是让业务部门自己来取,减少不必要的重复劳动,一般情况下,业务部门数据库表结构一般是固定的,根据实际业务将取数需求做成sql 脚本,快速完成数据获取—授人以渔的方式,提供平台或工具
那如何实现一个自助取数查询工具?
基于底层数据来开发不难,无非是将用户输入变量作为筛选条件,将参数映射到 sql 语句,并生成一个 sql 语句然后再去数据库执行
前言
最后再利用 QT 开发一个 GUI 界面,用户界面的点击和筛选条件,信号触发对应按钮与绑定的传参槽函数执行
具体思路:
1.数据库连接类
此处利用 pandas 读写操作 oracle 数据库
2.主函数模块
1)输入参数模块,外部输入条件参数,建立数据库关键字段映射
–注:读取外部 txt 文件,将筛选字段可能需要进行键值对转换
2)sql 语句集合模块,将待执行的业务 sql 语句统一存放到这里
3)数据处理函数工厂
4)使用多线程提取数据
一、数据库连接类
cx_Oracle 是一个 Python 扩展模块,相当于 python 的 Oracle 数据库的驱动,通过使用所有数据库访问模块通用的数据库 API 来实现 Oracle 数据库的查询和更新
Pandas 是基于 NumPy 开发,为了解决数据分析任务的模块,Pandas 引入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的方法类和函数
pandas 调用数据库主要有 read_sql_table,read_sql_query,read_sql 三种方式
本文主要介绍一下 Pandas 中 read_sql_query 方法的使用
1:pd.read_sql_query()
读取自定义数据,返还DataFrame格式,通过SQL查询脚本包括增删改查。
1 |
|
sql:要执行的sql脚本,文本类型
con:数据库连接
index_col:选择返回结果集索引的列,文本/文本列表
coerce_float:非常有用,将数字形式的字符串直接以float型读入
parse_dates:将某一列日期型字符串转换为datetime型数据,与pd.to_datetime函数功能类似。
params:向sql脚本中传入的参数,官方类型有列表,元组和字典。用于传递参数的语法是数据库驱动程序相关的。
chunksize:如果提供了一个整数值,那么就会返回一个generator,每次输出的行数就是提供的值的大小
read_sql_query()中可以接受SQL语句,DELETE,INSERT INTO、UPDATE操作没有返回值(但是会在数据库中执行),程序会抛出SourceCodeCloseError,并终止程序。SELECT会返回结果。如果想继续运行,可以try捕捉此异常。
2:pd.read_sql_table()
读取数据库中的表,返还DataFrame格式(通过表名)
1 2 |
|
3:pd.read_sql()
读数据库通过SQL脚本或者表名
1 2 |
|
以下创建连接 oracel 数据库的连接类 Oracle_DB
主要提供 2 种操作数据的函数方法。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 |
|
二、数据提取主函数模块
cx_Oracle 是一个 Python 扩展模块,相当于 python 的 Oracle 数据库的驱动,通过使用所有数据库访问模块通用的数据库 API 来实现 Oracle 数据库的查询和更新。
1)外部输入参数模块
txt 文本中,就包含一列数据,第一行列名,读取的时候忽略第一行
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 |
|
2)业务 sql 语句集合
注意in后面{0}不要加引号,这里传入为元组,params 参数传入sparm
= {‘Start_time’:’2021-04-01′,’End_time’:’2021-05-01′},此处参数可根据需要改变
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 |
|
3)业务数据处理
业务数据处理流程,原始数据后处理,这里不作介绍:
1 2 3 4 5 6 7 8 9 10 |
|
多线程提取数据部分,这里 tasklist 列表多线程提取数据
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 |
|
到此整个数据库取数工具开发流程介绍完毕,就差最后一步分享给小伙伴使用了,做成 GUI 应用此处不做详细介绍,构建独立的 python 环境,快速发布你的应用
到此这篇关于手把手教你实现Python连接数据库并快速取数的工具的文章就介绍到这了。
300+Python经典编程案例
50G+学习视频教程
100+Python初阶、中阶、高阶电子书籍
点击拿去