Home > MachineLearning > Main text

ICA独立成分分析


Tag: python, machine learning

概述

独立成分分析(Independent Component Analysis, ICA):类似于PCA,找到一组新的基向量(basis)来表征样本数据,但是PCA用于服从高斯分布的数据,ICA用于服从非高斯分布的数据。

经典案例就是“鸡尾酒宴会问题”:

在一个聚会场合中,有\(n\)个人同时说话,而屋子里的任意一个话筒录制到底都只是叠加在一起的这\(n\)个人的声音。但如果假设我们也有 \(n\)个不同的话筒安装在屋子里,并且这些话筒与每个说话人的距离都各自不同,那么录下来的也就是不同的组合形式的所有人的声音叠加。使用这样布置的\(n\)个话筒来录音,能不能区分开原始的\(n\)个说话者每个人的声音信号呢?

知识点

1、适用场景:

  • 数据不服从高斯分布
  • 数据信号是相互独立的

2、鸡尾酒问题中的ICA算法:ICA.png

3、ICA vs PCA:

  • ICA:样本数据由独立非高斯分布的隐含因子产生,隐含因子个数等于特征数,更适合用来还原信号
  • PCA:K个正交的特征,更适合降维 ICA_vs_PCA.png

参考


If you link this blog, please refer to this page, thanks!
Post link:https://tsinghua-gongjing.github.io/posts/Independent_component_analysis.html

Previous: [CS229] 14: Dimensionality Reduction