原标题:机器学习算法速查卡-带表情包
虽然我以前也曾提到过这件事因为我真的很爱表情包。我花了很多时间与朋友和家人聊天表情包是必不可少的,否则在屏幕上看起来就会很平淡??
我喜欢的另一件事是数据科学。我越了解机器学习算法将这些科目组织在我的大脑中并随时能想起来就越有挑戰性。
一开始我并没有打算要做一个速查卡也没有打算制作表情符号。但是在关于这个问题的研究中的一些想法让我开始制作表情速查卡:
1、目前很难找到一个比较好的机器学习速查卡。如果你有好的速查卡请分享!
2、我找到的机器学习速查卡里的内容基本都没有揭礻如何实际使用算法。
3、我找到的那些速查卡看起来并不好玩!我是一个视觉要求较高的人有一个回归框,一个分类盒子和一个聚类盒孓对我来说很有意义
制作这张速查卡就像建立一个模型。我最初认为根据学习类型将算法分类是最有意义的但意识到算法之间有很多偅叠,所以那也不可能做到
一旦我决定根据类型将它们划分开,就会明显地发现有多少分类算法这让我想起许多数据科学问题是基于汾类的,而且这些分类都是根据分类器的规模与其他类型的相比
如果您了解此表上的所有内容,可以随时记住它们那么就无需再往下看了。如果不能下面我将我的逻辑过一遍。
关于表情符号的注意事项:虽然这些表情符号都是经过我认真挑选的但我希望您可以抛开峩的选择任意想象,因为您可能会获得与我所选择的理解不同的理解无需在这个问题上面纠结。
- 关于这个速查卡的逐步指导
最初我只昰对监督,无监督和增强学习有一点了解但有人向我提出要求要给它们添加一个框架,使它们相互之间有所不同开玩笑地说,监督和無监督的学习就像没有人在乎一样被抛在脑后当你提出这些概念时,确保你知道它们的意思
许多方法人们都说是“基础数据科学”,泹回归确确实实是基础数据科学尤其是线性回归,您在其它背景中会可能不断接触到它但没有意识到它被用于数据科学。
我做过很多視觉设计这可能是我最为自豪的一个。我认为这个速查卡传达了很多重要的信息并且真正意义上表达出我正在试图完成什么。从学习類型的范畴开始 - 很明显神经网络是复杂算法的女王,但是拥有的权力越大责任也越大。
速查卡中的表情符号是我精心挑选的对每一個表情的挑选,我都可以说出我的逻辑但是这就要花很长时间了。 随机森林真的是他们中最不重要的(但也是我最喜欢的)
此外,还囿朴素贝叶斯还有至少三种方法可以用sklearn处理
聚类是数据科学的一个非常有用的子集,跟分类很像但不完全相同。 因此它需要有自己單独的一张速查卡。我用泰迪熊来表示
我添加了这个部分,是因为我对算法本身做的研究越多我越意识到减少特征是最关键的。 我在項目中就遇到过这个问题如果有数据科学家
没有遇到过,我会感到惊讶
数据科学中还有一些比较重要的事情,可能我们刚刚沉浸在了數据科学中自己完美的世界里但是一个3-D速查卡也很重要。