人人都是数据分析师:Tableau应用实战(二)数据连接与管理

  • Post author:
  • Post category:其他


连接数据源是利用Tableau进行数据分析的第一步,Tableau拥有强大的数据连接能力,支持几乎所有的主流数据源类型。

本节目标:实现多表联接查询和多数据源数据关联,创建、管理和操作数据源。

Tableau元数据管理分为三层:数据连接层(Connection)、数据模型层(DataModel)和数据可视化层(VizQL)。


Tableau中的数据连接层


数据连接层的数据连接信息包括数据库、数据表、数据视图、数据列,以及用于获取数据的表连接和SQL脚本,但是数据连接层不保存任何源数据


Tableau中的数据模型层


在完成数据连接后,Tableau会自动判断字段的角色,把字段分为维度字段和度量字段两类。如果所连接数据是多维数据源,那么Tableau直接获取数据立方体维度和度量信息;如果连接的是关系数据源,Tableau会根据数据库的数据来判断该字段是维度字段还是度量字段。

多维数据库(我也不懂(略))

本节我们主要讲解如何连接excel和mysql。


连接mysql:



复制粘贴输入数据


筛选数据


直接使用数据源的全量数据,在视图设计时可能会导致工作表响应迟缓。如果仅希望对部分数据进行分析,可以使用数据源筛选器。Tableau可以在新建数据源时选择筛选器,也可以在完成数据连接后,对数据源添加筛选器。

数据整合

Tableau的数据整合功能可实现同一数据源的多表联结、多个数据源的数据融合,以及针对源数据的行列转换。

说明 联接类型分为内部、左侧、右侧、完全外部4种。其中“内部”只列出与联接条件匹配的

数据行;“左侧”表示不仅包含查询结果集合中符合联接条件的行,而且还包括左表的所

有数据行;“右侧”表示不仅包含查询结果集合中的符合联接条件的行,而且还包括右表

的所有数据行;“完全外部”表示包含查询结果集合中的包含左、右表的所有数据行。

实现多个数据库的多表连接

行列转换 利用数据透视表可以实现行列转换

Tableau加载数据有两种基本方式:一种是实时连接,即Tableau从数据源获取查询结果,本

身不存储源数据;另一种是数据提取,将数据提取到Tableau的数据引擎中,由Tableau进行管理。本节重点介绍数据提取。

在下列情况下,建议使用数据提取的方式。

 源数据库的性能不佳:源数据库的性能跟不上分析速度的需要,则可以由Tableau的数据引擎来提供快速交互式分析。

 需要脱机访问数据:如果需要在差旅途中脱机访问数据,则可以将相关数据提取到本地。

 减轻源系统的压力:如果源系统是重要的业务系统,那么建议将数据访问转移到本地,以减轻对源系统的压力。

而在下列情况下,则不建议选择数据提取方式。

 源数据库性能优越:IT基础设施支持快速数据分析,那么不建议进行数据复制。

 数据的实时性要求高:需要使用实时更新的数据进行分析,则不建议使用数据提取的方式。

 数据的保密要求高:出于信息安全考虑不希望将数据保存在本地,则不建议进行数据提取


创建数据提取


Tableau有两种方式创建数据提取:一种是完成数据连接之后,针对数据源进行提取数据操作;另一种是在新建数据源时选择“提取”方式。

……(略)



版权声明:本文为sinat_34789167原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。