
机器学习算法数不胜数,要想找到一个合适的算法并不是一件简单的事情。通常在对精度要求较高的情况下,最好的方法便是通过交叉验证来对各个算法一一尝试,进行比较后再调整参数以确保每个算法都能达到最优解,并从优中择优。但是每次都进行这一操作不免过于繁琐,下面小编来分析下各个算法的优缺点,以助大家有针对性地进行选择,解决问题。 ![]() 1.朴素贝叶斯 ; I( c" e" \4 f; l6 S: l- j/ r- Y: M. {* I 朴素贝叶斯的思想十分简单,对于给出的待分类项,求出在此项出现的条件下各个类别出现的概率,以概率大小确定分类项属于哪个类别。 优点:9 u6 b9 W& y! k' j7 o9 O / y7 d, F; a9 p" x- l% G% v 1)朴素贝叶斯模型发源于古典数学理论,因此有着坚实的数学基础,以及稳定的分类效率; 5 e* n9 O( V; } 2)算法较简单,常用于文本分类; e! `& Q1 G! L& W% ^) x! e 3)对小规模的数据表现很好,能够处理多分类任务,适合增量式训练。 缺点: 7 u, \8 L' P+ m7 O 1)需要计算先验概率;, ~( b$ X+ @ {: K: @ 2)对输入数据的表达形式很敏感;) ]/ `6 l" j' n% b5 H; `1 A7 t 3)分类决策存在错误率。 ![]() 2.逻辑回归 ( k, {9 V- @4 v) A/ m: O, q 优点:$ [3 z/ v, d0 P/ V8 L* d$ }" k 1)实现简单,广泛地应用于工业问题上;; S; X1 I- e1 I/ D3 u) N: ? ! @" h$ U# r3 N) C/ |9 r: c 2)可以结合L2正则化解决多重共线性问题;) e6 P6 ~" ] v( ~" ] 8 \% |- E% V, i6 r' J& K, e 3)分类时计算量非常小,速度很快,存储资源低; 缺点: ; q, \4 K$ `) ]0 N% z 1)不能很好地处理大量多类特征或变量; 2)容易欠拟合,一般准确度较低;! x: u5 C2 H7 d5 q |1 }; @ $ U; Z3 u5 }, ^: [1 r/ U" R/ Y0 u 3)对于非线性特征,需要进行转换; 4)当特征空间很大时,逻辑回归的性能不是很好;2 Z/ Z) x- A" l8 E! G4 @9 }9 U) x 5)只能处理两分类问题(在该基础上衍生出来的softmax可以用于多分类),且必须线性可分。 ![]() 3.线性回归 线性回归与逻辑回归不同,它是用于回归的,而不是用于分类。其基本思想是用梯度下降法对最小二乘法形式的误差函数进行优化。 优点:实现简单,计算简单;. h$ K/ R1 j5 I ( ~) j+ w5 x9 o 缺点:不能拟合非线性数据。 4.最近邻算法1 X% `3 T4 |. t$ D- a8 y # `/ v6 ^ P: S" n3 q9 k 优点:# T/ c6 Q& e. ]! b$ r$ b6 p . r% G. _$ `' O6 `9 m. m5 A2 i 1)对数据没有假设,准确度高;! a5 x! l- h+ Q P# v$ M6 U" B; Q 2)可用于非线性分类; , _. z5 X3 \. q ~' ` 3)训练时间复杂度为O(n);7 R9 P: s- ~5 \% p$ ?/ @5 `" M 4)理论成熟,思想简单,既可以用来做分类也可以用来做回归。& Q- \% j# T) k1 g+ e3 x2 N! j 缺点:, G/ f- H3 O% i ?6 K8 @ * o D/ C4 G- d 1)计算量大;3 f: V2 N% r7 g* \ 2)需要大量的内存; 3)样本不平衡问题(即有些类别的样本数量很多,而其它样本的数量很少)。9 G. ?$ o! S7 e! I$ b ![]() 5.决策树 , g1 B: y2 D' s# d 优点:7 P- E, F/ Q1 [, H7 C 1)能够处理不相关的特征;! K( w7 @9 ^* O( s0 Z 2)在相对短的时间内能够对大型数据源做出可行且效果良好的分析;# k4 b4 i, F5 b) e. V! A6 l: X' u/ L , c, n3 _$ u0 n7 }4 i. A 3)计算简单,易于理解,可解释性强; 4)比较适合处理有缺失属性的样本。 缺点:& O% p, U( ?3 h ) O/ P5 k, K, o: l( ?+ ] 1)忽略了数据之间的相关性; 3 L# a$ M6 ?/ Y+ Z7 i C 2)容易发生过拟合(随机森林可以很大程度上减少过拟合);# r( g" o/ B; Q, V- b D' i 3)在决策树当中,对于各类别样本数量不一致的数据,信息增益的结果偏向于那些具有更多数值的特征。 |
学习了![]() |
卧槽,感觉有点太高级啊!!!![]() |