少女祈祷中...

Tableau:最易上手且功能强大的可视化操作BI工具

Tableau是一款广受欢迎的商业智能(BI)工具,以其直观的用户界面和强大的数据可视化功能而闻名。无论是数据分析师、业务用户还是IT专业人员,都能快速上手并利用Tableau进行高效的数据分析和可视化展示。

相对于Excel,Tableau可以处理以亿为级别的数据,展现出其卓越的数据处理能力。而Excel在处理几十万条数据的时候,往往会出现卡顿现象,限制了其在大型数据集上的应用。

相较于MySQL,Tableau不仅提供了强大的数据连接和处理功能,还以其可视化操作和丰富的图表选项著称。用户可以通过Tableau直观地展示数据,进行深入的数据探索和分析,而MySQL虽然在业务取数方面表现出色,但在可视化能力上相对有限,无法全面满足复杂的数据展示需求。

相较于Python,Tableau的上手难度显著降低,用户无需深厚的编程基础,即可通过简单的操作实现复杂的数据分析和可视化。这种即学即用的特性,使得Tableau成为非专业人士进行数据分析的理想选择,而Python则需要用户投入较大的精力进行学习和实践。

相较于其他BI工具,Tableau在多个方面展现出其独特的优势:

  • 更直观的用户界面:Tableau的拖放式操作界面和直观的图表生成方式,使得数据分析变得更加简单和直观。
  • 更灵活的数据连接:Tableau支持多种数据源的连接和混合分析,能够无缝集成各类数据,提供全面的数据洞察。
  • 更强大的交互功能:Tableau的仪表板支持丰富的交互功能,用户可以通过点击、筛选等操作深入探索数据,提升分析的深度和广度。
  • 更丰富的社区支持:Tableau拥有庞大的用户社区和丰富的在线资源,用户可以轻松获取帮助和学习资料,加速问题的解决和技能的提升。

数据连接

Tableau支持与多种数据源的连接,包括本地文件、数据库、云服务等。以下是一些常见的数据连接方式:

  • 本地文件:Tableau可以直接打开多种类型的本地文件,包括:
    • CSV文件:通常使用文本编辑器打开。
    • Excel文件(xlsx):使用Microsoft Excel打开。
    • JSON文件:用于存储结构化数据的轻量级格式。
    • Microsoft Access文件(mdb, accdb):用于存储关系型数据的桌面数据库文件。
    • PDF文件:虽然PDF主要用于文档展示,但Tableau可以通过插件或外部工具提取其中的数据。
    • 空间文件(如Shapefile, GeoJSON):用于地理空间数据的存储和分析。
    • 统计文件(如SPSS, SAS):用于存储统计分析数据的文件格式。
  • 数据库:Tableau支持与多种数据库的连接,如MySQL、Oracle、SQL Server等。用户只需提供数据库的连接信息,即可将数据库中的数据导入Tableau进行分析。
  • 云服务:Tableau还支持与各种云服务的连接,如Amazon Redshift、Google BigQuery等。通过与云服务的集成,用户可以轻松访问和分析存储在云端的大量数据。

在Tableau的数据连接世界中,实时连接与数据提取是两种核心的数据接入方式,它们各自拥有独特的优势和适用场景,共同构成了Tableau强大的数据处理能力。

实时连接

实时连接是Tableau的一项关键功能,它允许用户直接连接到数据源,实时获取和分析数据。这种方式的优势在于:

  • 即时性:用户可以实时查看和分析最新的数据,无需等待数据提取和加载的过程,确保了分析结果的时效性和准确性。
  • 动态性:实时连接支持数据的动态更新和变化,用户可以在Tableau中观察到数据随时间的变化趋势,适用于需要频繁更新数据的场景。
  • 灵活性:用户可以根据需要灵活地调整查询条件和分析维度,实时获取所需的数据洞察,提高了数据分析的灵活性和响应速度。

然而,实时连接也存在一定的局限性,例如在处理大规模数据集时可能会遇到性能瓶颈,以及对数据源的稳定性和响应速度有一定要求。

数据提取

数据提取是Tableau的另一种数据连接方式,它通过将数据从源系统提取到Tableau的本地存储中,实现数据的离线分析和处理。这种方式的优势在于:

  • 性能优化:数据提取可以将大规模数据集加载到Tableau的本地存储中,通过优化数据结构和索引,提高数据查询和分析的性能,适用于处理复杂和大规模的数据集。
  • 稳定性:数据提取不受源系统性能和稳定性的影响,用户可以在Tableau中稳定地进行数据分析和可视化,确保了分析过程的连续性和可靠性。
  • 灵活性:用户可以根据需要定期更新数据提取,保持数据的最新状态,同时也可以对提取的数据进行预处理和清洗,提高数据分析的质量和效率。

数据提取的局限性在于它需要定期更新以保持数据的最新状态,以及在处理实时数据变化时可能存在一定的延迟。

适用场景

  • 实时连接:适用于需要实时查看和分析最新数据的场景,如实时监控、实时报表、实时决策支持等。
  • 数据提取:适用于需要处理大规模数据集、进行复杂数据分析和可视化的场景,如历史数据分析、趋势预测、数据挖掘等。

通过灵活运用实时连接和数据提取两种方式,Tableau为用户提供了全面的数据接入和分析能力,无论是实时数据监控还是深度数据挖掘,Tableau都能提供强大的支持。

数据保存

数据保存确保了用户的工作成果得以安全存储,便于后续的访问、分享和进一步分析。Tableau提供了多种数据保存方式,以满足不同用户的需求和场景。

工作簿保存

Tableau工作簿是用户进行数据分析和可视化的主要成果,包含了所有的数据连接、图表、仪表板和分析逻辑。Tableau支持将工作簿保存为.twb.twbx格式:

  • .twb格式:这种格式保存了工作簿的结构和设置,但不包含数据提取。用户在打开.twb文件时需要重新连接到原始数据源。
  • .twbx格式:这种格式是Tableau打包工作簿,包含了工作簿的所有内容,包括数据提取。用户在打开.twbx文件时无需重新连接数据源,可以直接进行分析。

数据提取保存

对于通过数据提取方式连接的数据,Tableau允许用户将提取的数据保存为.tde.hyper格式:

  • .tde格式:这是Tableau Data Extract的旧格式,适用于Tableau 10.x及更早版本。它支持数据的压缩和优化,便于快速加载和分析。
  • .hyper格式:这是Tableau Data Extract的新格式,从Tableau 10.5开始引入。它提供了更高的性能和更灵活的数据模型,支持更复杂的数据类型和操作。

数据源保存

Tableau还支持将数据源保存为.tds.tdsx格式:

  • .tds格式:这种格式保存了数据源的连接信息和设置,但不包含数据提取。用户在打开.tds文件时需要重新连接到原始数据源。
  • .tdsx格式:这种格式是Tableau打包数据源,包含了数据源的所有内容,包括数据提取。用户在打开.tdsx文件时无需重新连接数据源,可以直接使用。

云端保存

随着云计算的普及,Tableau也提供了云端保存的选项,支持将工作簿和数据提取保存到Tableau Online或Tableau Server:

  • Tableau Online:这是Tableau的云服务平台,用户可以将工作簿和数据提取上传到云端,实现跨设备的访问和协作。
  • Tableau Server:这是Tableau的企业级服务器解决方案,支持在企业内部部署,提供更强大的数据管理和安全控制。

数据备份与恢复

为了确保数据的安全性,Tableau还提供了数据备份和恢复的功能。用户可以定期备份工作簿、数据提取和数据源,以防止数据丢失或损坏。在需要时,用户可以通过备份文件快速恢复数据,确保分析工作的连续性和可靠性。

数据解释器

数据解释器清理是Tableau中的一项功能,主要用于处理和清理导入的数据,以便更有效地进行数据分析和可视化。以下是数据解释器清理的具体含义和作用:

含义

数据解释器清理是指在Tableau中导入数据时,自动识别和处理数据中的常见问题,如重复行、缺失值、格式不一致等。这一过程旨在提高数据的质量和一致性,确保后续的数据分析和可视化更加准确和可靠。

作用

  1. 数据清洗:自动识别和删除重复的行,填充或删除缺失值,统一数据格式,从而提高数据的整体质量。
  2. 简化分析:通过清理数据,减少分析过程中的干扰因素,使分析师能够更专注于数据的实质内容和洞察。
  3. 提升可视化效果:高质量的数据是生成有效可视化图表的基础。数据解释器清理确保数据在可视化过程中能够准确反映实际情况,避免误导性的图表和结论。
  4. 节省时间:手动清理数据通常耗时且容易出错。数据解释器清理功能能够自动完成这些任务,节省分析师的时间和精力,使其能够更快地进行数据探索和分析。

在Tableau中,数据解释器清理功能通常在数据源设置阶段启用。用户可以在导入数据时选择启用数据解释器,Tableau将自动进行数据清理。这一功能特别适用于处理来自不同来源和格式的数据,确保数据在导入后即可用于分析和可视化。

数据可视化

我们之所以需要数据可视化,是因为在缺乏专业训练的情况下,面对一堆数字,我们往往难以迅速识别出其中的最大值、最小值等关键信息。人类对数据的敏感度实际上是相对较低的。

然而,一旦我们通过可视化操作,将这些数字转化为直观的图像,我们的数据敏感度便会显著提升。这是因为人类天生就是图像视觉动物,我们的大脑更擅长处理和理解视觉信息。通过图表、图形等视觉元素,我们能够更快速、更直观地捕捉到数据的核心特征和内在规律,从而更有效地进行数据分析和决策。

其实对于tableau,我们要做的,熟能生巧就可以了,除此之外,要掌握做表格、做词云、做其他基础图表的能力。

其实总结来说,就是:

  • 度量默认聚合
  • 度量值会形成图形标记,图形标记可以切换
  • 维度会对度量值进行区分,增加度量值的信息密度
  • 图表分为有轴图表和无轴图表(极坐标图表)
  • 离散形成标签,连续形成数轴

基础图表制作指南

柱状图

在成功连接数据源后,创建一个新的工作表。将所需数据分别拖拽至区域,即可轻松生成柱状图。

条形图

若需将柱状图转换为条形图,只需点击工具栏中的排序快捷图标左侧,选择交换行和列(快捷键:Ctrl+W)。此外,通过在维度数据上右键点击并选择创建分层结构,可实现数据的分层展示,这是一个非常便捷的功能。

筛选器

筛选器是基础且实用的功能之一。在点击显示筛选器后,右侧将出现筛选面板,可用于按数值、日期、门店等条件进行图像筛选。

热力图

首先创建一个表格,然后将度量值数据拖至颜色区域,并将标记类型更改为方形,即可完成热力图的制作。

气泡图和词云

将数值度量放置于大小区域,将名称等维度量放置于标签文本区域,并将标记类型改为,即可生成气泡图或词云。

饼图

制作饼图的方法与气泡图类似。将标记类型更改为饼图,将数值度量放置于角度区域,将名称等维度量放置于颜色区域。若需显示百分比或标签,按住Ctrl键将相应内容拖至标签区域。对于百分比显示,右键点击数值度量(位于标签中),选择快速表计算 -> 合计百分比,并在设置格式 -> 数字 -> 百分比中进行进一步设置。

树地图

树地图的制作与饼图相似。将维度量放置于颜色区域,将角度区域中的数据度量拖至大小区域,并将标记类型更改为方形

堆积图

堆积图适用于对比分析。首先将一个维度量放置于区域,将数据度量放置于区域,然后将另一个维度量放置于颜色区域。

编辑表计算 - 数值

选择标签区域中的数据度量,右键点击并选择编辑表计算,然后选择表向下,即可查看每列不同维度量之间的百分比差异。

编辑表计算 - 数轴

选择区域中的数据度量,右键点击并依次选择快速表计算 -> 合计百分比,然后选择编辑表计算并点击表向下,以显示相对百分比,使占比变化更加明显。

折线图

选择相应的行列数据,并将标记类型设置为线。通过添加筛选器,可以在分析菜单中点击预测,以获得一定的可信度分析。日期数据通常放置于区域,右键点击可选择离散或连续的年月周日数据,通常使用连续数据进行操作。此外,还可以在分析菜单中添加趋势线、盒须图等分析工具。

面积图

选择相应的行列数据,将标记类型设置为区域,并将具有区分性的维度量放置于颜色区域,即可生成面积图。

散点图

选择相应的行列数据,将标记类型设置为自动,并将具有区分性的维度量放置于颜色详细信息区域。最后,添加分析菜单中的趋势线,以完善散点图。根据需求,还可以添加群集功能进行分类。

直方图

首先创建一个数据桶,然后将其拖至相应的行和列区域。可根据需要添加其他维度量进行区分。

地图

将城市、省份、国家等维度量右键点击并选择地理角色,更改为相应的角色。然后双击或使用智能推荐功能,即可生成相应的地理图。后续可加入行列数据和其他筛选条件进行进一步区分。

在进行距离类型的维度量分析时,我们通常会通过右键选择创建->的方式,将不同距离区间进行分组。以美化可视化效果并清晰区分各组与门店的距离,从而提升数据解读的直观性和效率。

主键

在处理大量数据时,为了便于区分和识别,我们通常会创建一个主键,以实现数据的唯一标识。在操作界面的左侧,我们可以看到查看数据查找字段等功能选项,而右侧则提供了创建计算字段的选项。通过点击创建计算字段,我们可以选择合适的维度量来构建一个具有唯一标识的主键。这样,在后续的数据处理过程中,我们便能够更加准确地区分和识别每一条数据。

BI仪表盘

在精心打造BI仪表盘的过程中,我们首先需要精准定位我们的目标观众,这包括但不限于业务人员、中层管理者、高级管理者以及用人单位等。

每类观众因其职责和需求的不同,对仪表盘的功能和呈现方式有着各自独特的要求:

  • 对于业务人员而言,他们更关注与自身业务紧密相关的数据细节,因此仪表盘应提供直观、具体的数据展示,以便他们快速获取所需信息,辅助日常业务决策。
  • 中层管理者则需要一个全面而精炼的总结报告,涵盖各个关键维度的数据。这样的仪表盘应具备多维度分析能力,能够帮助他们从宏观层面把握业务动态,同时也能深入到具体细节,以便进行更为精准的管理和指导。
  • 高级管理者通常关注的是整体战略层面的总结报告。因此,他们的仪表盘应简洁明了,突出关键指标和趋势,以便他们迅速把握全局,做出高层次的决策。
  • 至于用人单位,他们往往需要一个明确的分析主题,且分析的维度越深入、图表越高级,越能满足他们的需求。这类仪表盘应具备强大的数据挖掘和可视化能力,能够提供深入的分析结果,帮助用人单位洞察数据背后的深层次信息。

如何明确主题

在明确目标观众后,我们需要进一步确定仪表盘的主题。这一步骤至关重要,因为它直接关系到仪表盘的内容和结构。我们可以通过以下几个步骤来明确主题:

  1. 需求调研:深入了解目标观众的具体需求和痛点,通过访谈、问卷等方式收集信息。这一阶段,我们需要关注观众对数据的具体需求,包括他们希望看到哪些数据、这些数据的重要程度是否相同,以及他们希望通过这些数据解决什么问题。
  2. 数据梳理与分类:根据调研结果,对涉及的数据进行梳理和分类。这一步骤中,我们需要识别出哪些数据是核心数据,哪些是辅助数据,以及它们之间的关联性。同时,我们还需要评估每类数据的重要程度,确保在后续的仪表盘设计中能够合理分配展示空间。
  3. 关键指标筛选:在数据梳理的基础上,筛选出与主题紧密相关的关键指标。这些指标应能够全面反映主题的核心内容,并且具有较高的重要程度。通过这一步骤,我们可以确保仪表盘的主题突出,避免信息过载。
  4. 数据整合与分析:对筛选出的关键指标进行数据整合和深入分析,挖掘数据背后的关联和趋势。这一阶段,我们需要运用各种数据分析工具和方法,对数据进行深入剖析,以便为可视化设计提供有力的支撑。
  5. 可视化设计:根据分析结果,设计直观、易懂的可视化图表,确保观众能够迅速理解数据含义。在设计过程中,我们需要充分考虑观众的认知习惯和视觉偏好,力求使图表既美观又实用。
  6. 反馈与迭代:在仪表盘初步完成后,邀请目标观众进行试用,并根据反馈进行迭代优化。这一步骤中,我们需要关注观众的实际使用体验,及时调整和优化仪表盘的设计,确保其能够真正满足观众的需求。

最适合数据的图表

  1. 对比:
  • 绝对值对比——条形图/柱状图
  1. 变化:
  • 没有累计关系——折线图+柱状图
  • 有累计关系——面积图/堆积图
  1. 构成:
  • 对象少于3个——环形图
  • 对象大于3个——树地图
  1. 分布:
  • 单变量分布——直方图
  • 多变量分布——散点图/气泡图

度量名称显示

首先先把一个数据度量放在文本里,再拖动一个数据度量放在画布里那个显示的数据上,拖到上面会发现有个+或者智能显示,这样,就可以发现上面显示一个度量名称,下面我们把度量名称拖到上,然后把其他所需要的度量值托到左侧的度量值里就可以了。

其实我们在做仪表盘的时候,会在筛选器里通常加入日期一类的维度量,然后右键点击应用于工作表->使用相关数据源的所有项,再显示筛选器,操作筛选器之后,你会发现,所有的表图都会根据你对筛选器变动,而不是只变动一张图表的。

双轴

在Tableau中创建双轴(Dual Axis)可以帮助我们在一个图表中同时显示两个不同的度量,每个度量有自己的轴。这对于比较两个不同量级的数据或者展示两个相关但不同类型的数据非常有用。以下是如何在Tableau中创建双轴的步骤:

  1. 准备数据:确保你的数据源中有至少两个不同的度量(Metrics),这些度量将分别显示在两个轴上。
  2. 创建第一个视图:将第一个度量拖到功能区。例如,将销售额拖到功能区。
  3. 创建第二个视图:将第二个度量拖到与第一个度量相同的位置,例如,将利润拖到功能区,并且放在销售额的旁边。
  4. 转换为双轴:右键点击第二个度量(例如利润),然后选择双轴(Dual Axis)。
  5. 调整轴和格式:你可以通过右键点击轴标签来调整每个轴的格式,比如设置轴的最小值、最大值、刻度间隔等。

双轴的作用主要包括:

  • 比较不同量级的数据:例如,销售额和利润,这两个数据可能量级不同,通过双轴可以更直观地比较。
  • 展示相关但不同类型的数据:例如,温度和降雨量,这两个数据虽然相关,但类型不同,通过双轴可以同时展示。
  • 增强可视化效果:双轴图表可以提供更丰富的信息,帮助用户更好地理解数据之间的关系。

最后我们发现,这个双轴图并不美观,没关系,我们点击第一个视图,将其调整为条形图,并通过调整透明度和条形大小来增强视觉效果。具体操作如下:

  1. 选择条形图:在标记卡中,将图表类型从默认的折线图改为条形图。
  2. 调整透明度:在标记卡下找到颜色选项,调整透明度滑块,降低条形图的透明度,使其更加柔和,不至于过于突兀。
  3. 缩小条形大小:在标记卡中,找到大小选项,适当减小条形的大小,使其与后续的折线图更好地融合,保持图表的整体协调性。
  4. 保持折线图:对于第二个视图,继续使用折线图,以保持数据的连续性和趋势的清晰展示。

咳,最后的最后,我们再加一个分析里的趋势线,完美收工。

环形图

先做一个饼形图,然后在的上面双击输入0,重复两次,可以得到两个图表,然后右键双轴,在左侧的下面的总和(0)里进行以下操作,首先把所有标签删除,把颜色改为纯白,最后把大小拉小,就可以得到一个环形图了。

不过这个时候会发现左右两侧会有轴线,我们右键轴线段,点击显示标题,就可以把轴线给隐藏掉。

还有一个零值线,我们右键画布,点击设置格式,点击字段左边的图标,里面是设置工作表的各种线和刻度的,找到零值线,将其设置为,这样我们就可以得到一个干净的环形图了。

如果遇到标签的名字不符合我们所期望的,我们可以右键编辑别名进行设置。

仪表盘布局

常见的仪表盘布局有两种,一种是纵向的,另一种是横向的。

仪表盘制作

当你根据数据源做好各类图表的时候,直接在右下侧建立仪表盘,然后把图表拖拽到仪表盘中,进行布局调试和交互设计/记得加上边框哦,这样我们的仪表盘就制作成功了,如下图所示,这是拉姆自己用一个小项目进行的练手:
图表1

本文作者:戴诺斯·拉姆 @ 拉姆的小树屋

本文链接:https://sherry14love.github.io/2024/07/12/learn/tableau/

本文版权:本博客所有文章除特别声明外,均采用 BY-NC-SA 许可协议。转载请注明出处!

留言