2024-07-02
8.5k 字
29 分钟
数据分析之Excel食用指南
Excel,作为微软公司开发的一款强大电子表格软件,不仅在数据分析、财务计算、项目管理、统计分析等领域发挥着重要作用,还因其丰富的数据处理和计算功能,以及多样化的图表和图形工具,成为高效管理和分析数据的得力助手。
如下图,是拉姆在系统学习Excel时制作的某店铺报表,其中利用了切片器灵活筛选美团、饿了么的数据情况,这是初级数据分析师所必须掌握的。接下来,我们要介绍关于excel的各类用法,帮助大家胜任数据分析师。
基础篇
首先,为了确保数据的安全性和便于分析计算结果,我们需采取以下步骤:
创建一个新的工作簿(例如工作簿2),专门用于存储和分析计算结果。
这样做的好处是可以避免在原始数据工
2024-06-15
2.4k 字
9 分钟
数据分析食用指南2-优化与连接
优化算法
曾经有一次面试的时候,HR问拉姆优化算法都是有哪些,拉姆很懵,因为拉姆下意识以为这是算法岗的内容,就磕磕绊绊得回答的很糟糕。
现在了解一下,其实数据分析和数据挖掘中常用的优化算法是有很多的,这些算法可以帮助我们找到最优或近似最优的解决方案。
以下是一些常见的优化算法及其应用场景:
梯度下降(Gradient Descent)
梯度下降是一种迭代优化算法,用于最小化一个函数。在机器学习中,它通常用于最小化损失函数,以找到模型的最佳参数。
应用场景:线性回归、逻辑回归、神经网络等模型的参数优化。
随机梯度下降(Stochastic Gradient Descent, SGD)
随机
2024-06-05
2k 字
7 分钟
回归与分类
回归(Regression)和分类(Classification)是机器学习中两种常见的监督学习任务,它们在目标和方法上有所不同。
回归(Regression)
回归分析是一种预测性的建模技术,它研究的是因变量(目标)和自变量(预测器)之间的关系。这种技术通常用于预测一个具体的数值,如房价、股票价格、温度等。
关键特点:
目标变量:连续值。
输出:一个数值。
例子:线性回归、多项式回归、决策树回归、随机森林回归等。
应用场景:
房价预测
销售预测
股票价格预测
线性回归
线性回归(Linear Regression)是统计学和机器学习中最基础的预测建模技术之一,它用于建立和估计一个
2024-05-31
2.4k 字
8 分钟
数据分析之特征提取-PCA
常见方法
在数据分析中,特征提取是一个关键步骤,它涉及从原始数据中提取有意义的特征,以便用于后续的分析和建模。以下是一些常用的特征提取方法:
主成分分析(PCA):
PCA是一种线性降维技术,通过将数据投影到新的正交坐标系中,提取出数据的主要成分。这些主成分是原始特征的线性组合,能够最大程度地保留数据的方差。
独立成分分析(ICA):
ICA是一种用于分离混合信号的技术,它假设数据是由独立的非高斯信号源线性混合而成的。ICA的目标是找到这些独立的信号源。
线性判别分析(LDA):
LDA是一种监督学习方法,用于在保持类间差异最大化的同时,减少数据的维度。LDA通过找到一
2024-05-23
272 字
1 分钟
GPT-4o免费分享
注意喔,红色字体可以直接转跳。如果想要免费的ChatGPT4,可以和拉姆联系,拉姆很乐意和小伙伴们进行讨论喔~
国内可访问的mychandler
mychandler每月免费用户有40次,就是进入的时候很慢很慢,使用魔法也不快(他的CDN肯定有问题)
插件merlin(国内可用)
merlin可以在edge中访问,也可以在chrome中,每日102电力,下面是详细价格表:
Coze
Coze简直是我们的神,每次都是免费的!无论是GPT4还是4o,而且到目前为止,拉姆都不知道他的限制次数或者tokens到底是多少,太伟大了
YOU
YOU每日五次访问,使用体验是比较可以的。
P
2024-05-20
1.8k 字
6 分钟
随机森林与决策树
定义与基本概念
决策树: 树形结构的分类或回归模型,通过特征分割进行分类
随机森林: 集成学习算法,由多个决策树组成
决策树(Decision Tree)
决策树是一种用于分类和回归问题的基本算法,可以对数据进行分类和预测,主要步骤包括特征选择,决策树生成,剪枝。
特征选择:决策树通过递归地选择最优特征,并根据该特征对训练数据进行分割,使得对各个子数据集有一个最好的分类。
决策树生成:决策树从根节点开始,每个节点都是基于某个特征的分割条件,最终形成一棵树形结构。
剪枝:为了防止过拟合,通常会对生成的树进行剪枝,通过移除预测性能不佳的分支来简化模型。
12345678
« 上一页 1 2 3 4 5 下一页 »