连接数据源是利用Tableau进行数据分析的第一步,Tableau拥有强大的数据连接能力,支持几乎所有的主流数据源类型。
本节目标:实现多表联接查询和多数据源数据关联,创建、管理和操作数据源。
Tableau元数据管理分为三层:数据连接层(Connection)、数据模型层(DataModel)和数据可视化层(VizQL)。
Tableau中的数据连接层
数据连接层的数据连接信息包括数据库、数据表、数据视图、数据列,以及用于获取数据的表连接和SQL脚本,但是数据连接层不保存任何源数据
Tableau中的数据模型层
在完成数据连接后,Tableau会自动判断字段的角色,把字段分为维度字段和度量字段两类。如果所连接数据是多维数据源,那么Tableau直接获取数据立方体维度和度量信息;如果连接的是关系数据源,Tableau会根据数据库的数据来判断该字段是维度字段还是度量字段。
多维数据库(我也不懂(略))
本节我们主要讲解如何连接excel和mysql。
连接mysql:
复制粘贴输入数据
筛选数据
直接使用数据源的全量数据,在视图设计时可能会导致工作表响应迟缓。如果仅希望对部分数据进行分析,可以使用数据源筛选器。Tableau可以在新建数据源时选择筛选器,也可以在完成数据连接后,对数据源添加筛选器。
数据整合
Tableau的数据整合功能可实现同一数据源的多表联结、多个数据源的数据融合,以及针对源数据的行列转换。
说明 联接类型分为内部、左侧、右侧、完全外部4种。其中“内部”只列出与联接条件匹配的
数据行;“左侧”表示不仅包含查询结果集合中符合联接条件的行,而且还包括左表的所
有数据行;“右侧”表示不仅包含查询结果集合中的符合联接条件的行,而且还包括右表
的所有数据行;“完全外部”表示包含查询结果集合中的包含左、右表的所有数据行。
实现多个数据库的多表连接
行列转换 利用数据透视表可以实现行列转换
Tableau加载数据有两种基本方式:一种是实时连接,即Tableau从数据源获取查询结果,本
身不存储源数据;另一种是数据提取,将数据提取到Tableau的数据引擎中,由Tableau进行管理。本节重点介绍数据提取。
在下列情况下,建议使用数据提取的方式。
源数据库的性能不佳:源数据库的性能跟不上分析速度的需要,则可以由Tableau的数据引擎来提供快速交互式分析。
需要脱机访问数据:如果需要在差旅途中脱机访问数据,则可以将相关数据提取到本地。
减轻源系统的压力:如果源系统是重要的业务系统,那么建议将数据访问转移到本地,以减轻对源系统的压力。
而在下列情况下,则不建议选择数据提取方式。
源数据库性能优越:IT基础设施支持快速数据分析,那么不建议进行数据复制。
数据的实时性要求高:需要使用实时更新的数据进行分析,则不建议使用数据提取的方式。
数据的保密要求高:出于信息安全考虑不希望将数据保存在本地,则不建议进行数据提取
创建数据提取
Tableau有两种方式创建数据提取:一种是完成数据连接之后,针对数据源进行提取数据操作;另一种是在新建数据源时选择“提取”方式。
……(略)