2024-09-06
1.8k 字
6 分钟
数据分析之业务拆解和分析
在当今数据驱动的商业环境中,业务分析已成为企业决策和战略制定的核心。本文将介绍九种常用的业务分析方法,这些方法能帮助分析师和管理者更好地理解复杂的业务问题,并制定有效的解决方案。
MECE原则:业务拆解的基础
在开始介绍具体的分析方法之前,我们需要了解MECE原则。MECE是"Mutually Exclusive Collectively Exhaustive"的缩写,意为"相互独立,完全穷尽"。这个原则要求我们在分析问题时,将问题分解为不重叠(相互独立)且无遗漏(完全穷尽)的部分。遵循MECE原则可以帮助我们更系统、全面地分析问题。
九种常用业务分
2024-07-25
8.7k 字
35 分钟
数据分析之MySQL食用指南
MySQL作为一种广泛使用的关系型数据库管理系统,是每个数据分析师必备技能,下面让我们来探讨如何利用MySQL进行高效的数据分析。
基础语句
为了帮助小伙伴们清晰理解SQL查询的语法结构和运行顺序,我们应该知道下面的:
语法结构:select–from–where–group by–having–order by–limit
运行顺序:from–where–group by–having–order by–limit–select
SELECT & FROM
基本语法
在MySQL中,使用 SELECT 语句来指定要查询的字段。语法如下:
1SELECT 字段名1, 字段名2
2024-07-15
692 字
3 分钟
随机森林如何调参
随机森林是一种强大的集成学习方法,通过构建多个决策树并取它们的平均值来进行预测。为了获得最佳性能,需要对随机森林模型进行调参。以下是一些常见的参数和调参方法:
常见参数
n_estimators: 决策树的数量。通常,增加树的数量可以提高模型的性能,但也会增加计算成本。
max_depth: 每棵树的最大深度。限制树的深度可以防止过拟合。
min_samples_split: 内部节点再划分所需最小样本数。增加这个值可以防止过拟合。
min_samples_leaf: 叶子节点最少样本数。增加这个值可以防止过拟合。
max_features: 寻找最佳分割时要考虑的特征数量。通常,默认值(
2024-07-12
6.7k 字
22 分钟
数据分析之Tableau食用指南
Tableau:最易上手且功能强大的可视化操作BI工具
Tableau是一款广受欢迎的商业智能(BI)工具,以其直观的用户界面和强大的数据可视化功能而闻名。无论是数据分析师、业务用户还是IT专业人员,都能快速上手并利用Tableau进行高效的数据分析和可视化展示。
相对于Excel,Tableau可以处理以亿为级别的数据,展现出其卓越的数据处理能力。而Excel在处理几十万条数据的时候,往往会出现卡顿现象,限制了其在大型数据集上的应用。
相较于MySQL,Tableau不仅提供了强大的数据连接和处理功能,还以其可视化操作和丰富的图表选项著称。用户可以通过Tableau直观地展示数据,进行深入的
2024-07-02
8.5k 字
29 分钟
数据分析之Excel食用指南
Excel,作为微软公司开发的一款强大电子表格软件,不仅在数据分析、财务计算、项目管理、统计分析等领域发挥着重要作用,还因其丰富的数据处理和计算功能,以及多样化的图表和图形工具,成为高效管理和分析数据的得力助手。
如下图,是拉姆在系统学习Excel时制作的某店铺报表,其中利用了切片器灵活筛选美团、饿了么的数据情况,这是初级数据分析师所必须掌握的。接下来,我们要介绍关于excel的各类用法,帮助大家胜任数据分析师。
基础篇
首先,为了确保数据的安全性和便于分析计算结果,我们需采取以下步骤:
创建一个新的工作簿(例如工作簿2),专门用于存储和分析计算结果。
这样做的好处是可以避免在原始数据工
2024-06-15
2.4k 字
9 分钟
数据分析食用指南2-优化与连接
优化算法
曾经有一次面试的时候,HR问拉姆优化算法都是有哪些,拉姆很懵,因为拉姆下意识以为这是算法岗的内容,就磕磕绊绊得回答的很糟糕。
现在了解一下,其实数据分析和数据挖掘中常用的优化算法是有很多的,这些算法可以帮助我们找到最优或近似最优的解决方案。
以下是一些常见的优化算法及其应用场景:
梯度下降(Gradient Descent)
梯度下降是一种迭代优化算法,用于最小化一个函数。在机器学习中,它通常用于最小化损失函数,以找到模型的最佳参数。
应用场景:线性回归、逻辑回归、神经网络等模型的参数优化。
随机梯度下降(Stochastic Gradient Descent, SGD)
随机