2024-05-20
1.8k 字
6 分钟
随机森林与决策树
定义与基本概念
决策树: 树形结构的分类或回归模型,通过特征分割进行分类
随机森林: 集成学习算法,由多个决策树组成
决策树(Decision Tree)
决策树是一种用于分类和回归问题的基本算法,可以对数据进行分类和预测,主要步骤包括特征选择,决策树生成,剪枝。
特征选择:决策树通过递归地选择最优特征,并根据该特征对训练数据进行分割,使得对各个子数据集有一个最好的分类。
决策树生成:决策树从根节点开始,每个节点都是基于某个特征的分割条件,最终形成一棵树形结构。
剪枝:为了防止过拟合,通常会对生成的树进行剪枝,通过移除预测性能不佳的分支来简化模型。
12345678
2024-05-19
1.5k 字
5 分钟
数据分析与数据挖掘浅谈
技术栈和工具分析
对于python技术栈的我们来说,走数据分析与数据挖掘是一条不错的路。
虽然也可以走前后端,但是目前的市场份额,Java和PHP仍然是主流,对于大厂而言,正在从Java到Golang过渡,所以python做前后端是有点尴尬的。
数据分析与数据挖掘常见的技术栈除了python之外,还有R、SQL、Hadoop、Spark、Hive、SPSS、SAS、Weka、Scikit-learn、TensorFlow、Keras等。
其中拉姆目前所接触的只有python、r、spss、Scikit-learn、TensorFlow、Keras
比较熟悉的只有python的一些库,Pand
2024-05-18
1.2k 字
4 分钟
docker食用指南
什么是Docker?
Docker 是一个开源的应用容器引擎,让开发者可以打包他们的应用及其依赖包到一个可移植的容器中,然后发布到任何支持 Docker 的平台上。它提供了简便的虚拟化解决方案,使得应用开发、测试和部署更加一致和高效。
Docker的应用场景
Web 应用的自动化打包和发布。
自动化测试和持续集成、发布。
在服务型环境中部署和调整数据库或其他的后台应用。
从头编译或者扩展现有的 OpenShift 或 Cloud Foundry 平台来搭建自己的 PaaS 环境。
基本概念
镜像 (Image):镜像是一个只读模板,包含了运行应用程序所需的所有内容(代码、库、配置等
2024-05-15
918 字
3 分钟
linux食用指南
Linux 基本概念
1. 什么是Linux
Linux是一个开源的、类Unix操作系统,由Linus Torvalds于1991年首次发布。它有许多不同的发行版(例如Ubuntu、Red Hat、Fedora、Debian等),用于桌面、服务器和嵌入式系统。
2. 文件系统结构
Linux使用一种树状的文件系统结构,所有内容都从根目录(/)开始。常见的目录有:
/bin:基本命令二进制文件
/etc:配置文件
/home:用户主目录
/var:可变文件,如日志
/usr:用户程序和数据
3. 权限和所有权
每个文件和目录都有权限和所有权。权限分为三类:所有者、所属组和其他用户。每
2024-03-31
982 字
3 分钟
GPT4与实用AI分享
这篇博文里有免费的GPT4、音乐生成AI、AI搜索引擎,分为国内和国外两部分。
其中国内有两个:搜索引擎AI:秘塔AI;Claude平替:KimiAI。
国外有七个:音乐生成AI:Suno;GPT4的免费平替:Coze和Claude还有wrtn、PopAi;搜索引擎AI:phind和perplexity。
至于Copilot和arena.lmsys.org就没提,不过你若是想要试试的话,可以直接点击红色字体进行跳转。
PS:红色字体是转跳链接哦,点击直接转跳到官网。
国内AI
秘塔AI
秘塔AI https://metaso.cn/
秘塔AI是一个AI搜索引擎,用户体验是很可以
2024-03-30
1k 字
3 分钟
Summary for 2021-2023
如果能重来
一眨眼就到大三下学期了,想想似乎是昨天才刚步入大学校园,急景流年,韶光如箭啊。
目前来看,大学生活虽谈不上颓废,也可以说得上是无所事事,说说比较后悔的几件事吧。
平心而论,比较后悔的第一件事,就是拉姆应该从大一便开始,积极参加各种竞赛项目的,不然也不至于现在连拿得出手的国奖都没几个。
这点可以参考拉姆的班委,拿了二三十个竞赛奖项,还有一个大佬,拉姆只是见到过,大三上学期就拿到了几十个奖项,还有各种合作项目,真的真的太强了。
当然,说笑一下,90%以上的大学生都不知道也不会参与各种竞赛,有这种觉悟的人是很少的,毕竟一般来说你的辅导员催你搞创新学分都在大三大四。
前些时候在群里看