主成分分析的结果解读及Excel实现——PCA系列(下)

作者: Oo梦回望月oO分类: 校园学习 发布时间: 2022-05-21 00:13:31 浏览:89078 次

主成分分析的结果解读及Excel实现——PCA系列(下)

去码头整点金条:
任何一个正态分布都是一个圆先伸缩再旋转得到的椭圆,PCA的目的就是找到这个椭圆的所有轴所在向量以及在该轴上的伸缩系数[doge]

【回复】很通俗易懂!其实,以下这个视频中就讲解了伸缩与旋转的数学过程:https://b23.tv/pqwcrcz
拉格朗日懂得多:
讲的是真不错,思路很清晰。刚好最近也在学习,分享下自己的一点小总结:https://blog.manyacan.com/archives/1946/

【回复】回复 @Heaven_erika :感谢补充。我其实专门把PCA的整个数学推导在Excel上操作了一遍,可以说从数学上,不论什么样的数据都能进行PCA。 其中有一类比较极端的情况,就是至少有两个变量间是严格的线性关系(相关系数为1或-1),这时协方差矩阵必然至少有一个特征值为0,因此协方差矩阵(和对角阵)就不是满秩矩阵了。假设原始变量数为k,协方差矩阵(和对角阵)的秩为r,那么主成分数最多只有k-r个。 综上所述,我个人认为是不需要做KMO和Bartlett检验的。当然,我看到因子分析的教程中都涉及到这两个检验。应该是因为因子分析和PCA的原理不完全相同所致的。
【回复】写的很专业。我在资料上看见,因子分析前需要做KMO和Bartlett的检验,但主成分分析和因子分析不完全相同。我还没有见过,主成分分析需要做这个检验
【回复】回复 @Oo梦回望月oO :[doge]我也是做微生物的,多多交流。
是唐宝不是糖宝:
讲得很清晰,就是需要0.75倍速播放,不然大脑跟不上[喜极而泣]

【回复】[喜极而泣]哈哈,实际上我原本语速很慢,最近的视频在剪辑时都用了1.3倍加速。如果用0.75倍速,刚好就是我的原速
矿物生长:
你好 我有个问题 就是你这里四个变量的数据都不缺全是150个,如果这四个变量中有的数据是空的 比如依次145个,140个,150个,150个。那么做PCA是可以直接做吗?还是要删除空数据以及对应的其他变量的数据,直到四个变量的数据量一致?

【回复】很奇怪,我当时写了一大段回复了。今天发现没有回复,那我重新写一遍吧[笑哭] 1.有缺失值,是无法进行PCA的。这从底层的线性代数原理很好理解,因为有缺失值是无法进行矩阵运算的。 2.实际上,在线网页MetaboAnalyst中对缺失值有好几种处理办理。比如,以未缺失值的平均数代替缺失值;或者,直接删除有缺失值的变量(但这对于变量数较少的案例不适用)。
【回复】回复 @Oo梦回望月oO :感谢up主
千丝折纸鳶:
请问Excel那个数据处理在哪可以学到矩阵变化这些知识呀

【回复】百度搜索就行了。这个在编程软件上很方便,Excel上做矩阵运算有点麻烦
zzzzzdr:
up您好,想问一下,我看到文献里的载荷图都是根据spss成分矩阵的的数据画的,也就是spss提供的载荷图,而我用origin得出的载荷图以及载荷数据,与您用成分矩阵数据算出来的特征矩阵数据是一样的,所以请问二者的联系是什么呢?

【回复】其实我在评论区已经有解释过,SPSS做的是因子分析,不是主成分分析
爱吃香菜的王王碎碎冰:
能发一下excel吗,想实操一下,谢谢UP[脱单doge]

【回复】回复 @Oo梦回望月oO :找到啦,感谢UP[给心心]
【回复】请移步至我首页的专栏里
Vivian邦:
主成分分析的结果出现了:62 missing values generated,请问这种情况出现的原因是什么,怎么处理呢?

【回复】不能有缺失值,评论区中有人问过
zl也许:
请问大家视频P8:30介绍的特征向量等于特征值请问是为什么呀?我在其他PCA数据处理中发现这并不是一定的吧?

【回复】那是SPSS的结果,还需要把每个特征向量单位化变成单位向量,这样才能组成正交矩阵P(同时也是载荷矩阵)
康康good:
讲的太好了,对刚学者很友好。请问原始数据表格可以发我一份吗?想跟着操作一下

【回复】回复 @康康good : 现在应该能看到了
【回复】回复 @康康good :B站出bug了(我自己能看到置顶评论)。那请移步到我主页,看我的最新动态。我现在重新发一下评论
【回复】回复 @Oo梦回望月oO :up主,你这条视频好像没有置顶评论
不知道叫啥名hhh:
谢谢up主,我想请问下如果已经得到了各样本在前两个主成分各自的得分,也就是得到了每个样本的xy坐标,如何根据坐标绘制PCA图呢

【回复】用的什么软件?Excel的话,“插入”选择散点图
Xanxas111:
请问 用同样的数据,为什么origin和SPSS两个软件做出来的PCA的结果会不同呢

【回复】回复 @Oo梦回望月oO :好的!谢谢up
【回复】回复 @-眠眠不觉醒 :检查导入数据的小数点位数是否一致
【回复】回复 @Oo梦回望月oO : 请问up,我也有同样的问题,就是同样的数据,spss的三个主成分解释度分别是32.637、52.407、67.472,但是origin就是32.866、53.252、67.395,结果相差不是特别大但还是不同也可以吗
爱学习的小刘01:
upup我有点没明白的点,求解答[星星眼],就是那个你最后说根据前面的碎石图看到Pc1Pc2的累计贡献率已经很高了,那这个碎石图是怎么搞出来的呢?Pc1.Pc2.Pc3Pc4就是这里的萼长度宽度,花长度宽度的吧

【回复】第一个问题,碎石图部分的字幕有解释。第二个问题,载荷图部分有解释
zzzz卓z:
up你好,想请教一下 spss主成分分析和pca图是一样的吗?可是spss可以得到综合得分评价优劣,但是pca图感觉那些圈圈是分类了吗[大哭][大哭][大哭]

【回复】回复 @小熊爱吃软糖ya :上一期视频讲过,simca软件做不出各组的置信椭圆。
【回复】回复 @Oo梦回望月oO : PCA图画圈用SIMCA画的吗?能教一下吗?
【回复】SPSS是“因子分析”,只不过借助了主成分分析的算法。真正做pca还是用其他软件吧
碎碎念73:
请教一下up,我有6个品种三天的各指标的数据,是需要分三次进行PCA分析吗,可以放在一块一起分析吗

【回复】看自己的实验目的。重点考察品种因素、不关注实践因素的话,就分析一次。要是品种和时间都考察可以分开进行PCA分析,这跟双因素方差分析的思路类似
爱吃馒头的猫猫头:
up求助!pc1加pc2到100%了是可以直接用的嘛,还是说我处理的原始数据有点问题

【回复】原始数据里有多少个变量?

数学 线性代数 生物统计学 高能公开课 得分图 统计学 PCA SPSS Excel 主成分分析

如果觉得我的文章对您有用,请随意打赏。您的支持将鼓励我继续创作!