这句话也对也不对,按一般的逻辑
来说。这句话是对的没毛病,有一
些人的气场相当的好,让人感觉有
亲和力,与这样的人交往感觉很舒
服,而有些人会做表面文章,而内
心却很肮脏。人的外表第一眼看上
去跟你是同类人,但实际上只不过
是个假象,而恰恰相反,跟你的性
格却格格不入。这样的人不能以第
一眼的印象,来决定人的好坏!
物以类聚人以群分,这句话说的很有道理,不是同一类人第一眼看上去就感觉不顺眼,这说明人的第一印象最重要,有的人第一眼看上去就感觉很熟悉,很亲近,很体贴,很顺眼。而有的人不是这样的,第一眼看上去就感觉不顺眼,就感觉不是同一路人,是人感觉很不舒服。但话又说回来,有些人也不全是这样的,对有些事也不能全以貌取人,需要交往一段时间后才能知道分晓,才能知道一个人的好坏,才知道是不是同一路人,虽然是有的人第一眼看上去好像不是同一路人,通过交往一段时间时间后,却成了很好的朋友,所以说这句话我认为说的很不确切,看人的看品,交人需要交心,不能一概而律。
不是这样的,这样的态度太直观了,都说人不可貌相,日久才能见人心,因为人和人相处了之后才能知道对方是怎样,而不能直接说第一眼看他不顺眼就不行。
平时我们总有这样一个习惯,对自己比较熟的人,一点点小缺点我们都是能够接受的,而对于一个陌生人或者是突然闯进你世界的人,他有一点小小的缺点,你也会感觉特别的反感,而且把他当成是眼中钉,那是因为你对他还不熟。
还有一种情况就是说,自己内心有一个假想敌,把事先已经把对方设计成是怎样一种类型的人了,不论他是怎样做的好或者讨好你,你都会觉得特别的反感,其实这是一种先入为主的观点,是不正确的,我们应该克服它。
就按我们平时在街上闻到的臭豆腐一样,闻到味道你就感觉到特别反感,而觉得他特别不好吃,其实不是这样的,很多人都是吃过了才会爱上他的。
可道是“物以类聚,人以群分”,每个人都有跟自己志趣相合的人,形成了自己的社交圈子,这样不同的社交圈子铺展开来,就相当于把每个人做了分类,不同社交圈子的人类别不同,比如每天宅在宿舍打游戏的同学,和早出晚归日夜学习的同学,简直就是两个世界。其实我们在数据分析的过程中,也经常会碰到一些类似的情况:比如说想分析不同省家庭的消费特征、根据不同司机的开车习惯为其推销不同的车型等等。在这种情况下,我们不是很在乎单条数据所呈现出来的性质是怎样的,而是希望对数据整体中的某一类有所定义。那么这个“类”应该如何得到呢?今天我们就来介绍一种办法——聚类分析来帮助我们进行分类。
所谓聚类分析,顾名思义,就是将数据以某种相似度进行分类,进而分析每一类数据的特征。我们在这里主要介绍两种聚类分析的方法,层次聚类的方法和k-均值(k-means)聚类的方法。二者的方法本身我们就不细讲啦,请大家去围观媛子老师的“数据江湖之多元剑法 | 聚类分析”,接下来我们就以“大学单身狗”数据作为表演会场,为大家解说接下来两位聚类分析导师的即兴表演直播:
布置表演会场——数据初探
在两位聚类导师到来之前,我们得首先把表演会场布置起来,不然导师来了,发现会场什么都没有,这岂不是很尴尬。想必小伙伴们对于会场的布置已经轻车熟路了,这里也就不过多赘述啦。我们这次所使用的数据样本个数为293,变量数为32:
敲黑板!这里有个小重点!
为了方便后面进行聚类,我们需要把所有变量都转为数值型,由于数据中有些定性变量取值水平是“是”和“否”以及还有一些其他非数字的取值水平,也就是说需要把定性变量的取值水平都转为0-1型,如果是有k个取值水平的变量,则需要转为k-1个0-1型变量:
最终结果就成为了下面这样!定性变量都转化为了0-1的形式,而定量变量则保持不变。会场布置完毕,请大家静候聚类导师来到表演现场!
kmeans聚类表演
1聚类聚类,到底几类?
首先来到我们表演现场的是kmeans导师,他今天为我们带来的是利用数据呈现当代大学生风气风貌节目。但他明显对于我们会场的布置依旧不是很满意,这数据间可是有数量级影响的,你聚类前不标准化这哪行?于是我们赶紧跟导师一起对数据进行了标准化处理。
接下来就看kmeans导师神秘地一笑,突然说:这世界那么大,这类型那么多,聚类聚类,大家猜一猜我到底要聚几类?这问题问的,很好地起到了现场观众们一脸懵逼,kmeans导师一阵暗爽的作用。观众们赶紧摆出一副我不知道,导师您讲一讲的样子,心中却暗暗吐槽:我要是知道现在表演节目的说不定就是我了,你竟然还让我猜,这哪猜得到?
Duang~kmeans导师将他的道具——碎石图亮了出来!碎石图是一种衡量聚类个数多少的方法,大家不要被这个有种 “胸口碎大石”感觉的名字所吓倒,实际上它非常简单啦,只是一张普通的图,根据聚类个数和样本点到聚类中心距离的平方和所绘制,因此碎石图的横纵坐标自己进行计算就可以哦:
但现在观众有问题了,你这只是画了个图,你还是没说怎么确定个数啊。kmeans导师慢慢解释说,我们需要选择纵坐标取值降低有减缓趋势时的聚类个数(当然如果能够结合业务需求就更好啦),在上图中满足这点的就是横坐标取4的时候,因此我们选择将数据聚为四类。
2kmeans聚类——show time!
接下来就看导师将标准化的结果及聚类个数放到了kmeans函数中,不一会他就为我们展示了最终结果:
利用kmeans函数计算出的结果是一个很大的列表,其中比较重要的是size、mean、Clustering这三项,size展示了各类的个数,mean表示各类的聚类中心,而Clustering则表示聚类后的分类情况。
现场观众们看着kmeans老师展示的结果,装作一直称赞的样子,心里却又开始了吐槽:你这么大一个列表,这么多项,你到底让我们看哪个?
Kmeans导师好像自己也意识到了这个问题,于是不慌不忙的将结果中的center,也就是刚才所说的means拿了出来,准备进行分析。
这里现场观众忍不住要提问了,为什么要拿出来聚类中心进行解读呢?这是因为我们希望看到不同类的整体特征的区别,而我们已有的聚类中心则正是对各类的整体把握,不同的聚类中心能够体现不同类之间的区别,所以分析聚类中心是非常有必要的。
3聚类结果——不同学生的生活风貌
看到大家都没有了疑问,kmeans导师展开了接下来的分析:聚类后的聚类中心是一个个的数字,由于数据进行了标准化处理,因此我们无法根据聚类中心的数值把握其真实意义,我们只能通过其正负来判断这个指标是远高于平均水平还是远低于平均水平(平均水平即为0)。而具体对结果的解读,依旧需要我们对所研究的数据有所了解,也就是我们经常说的“行业背景”。聚类分析提供给我们的是新产生的不同的类,应该如何分析不同类之间的实际区别,还是需要“行业背景”来帮助我们分析了,因此kmeans老师敲着黑板对大家说,行业背景很重要! 很重要!很重要!
譬如说上面聚类所述的第一类学生,可以看到他们主要是男生,成绩较好,运动、娱乐时间较长,但参与社交活动较少,其他结合着大学生的“行业背景”,我们就可以将这类学生进行以下解读:
该类学生的宗旨应该是“学习与运动可兼得”:恋爱情况较少,社交关系也很少,各项球类运动不在话下,但唱歌跳舞、学生组织等其他方面都不是很出彩。此外,可能由于家乡主要是在三线城市及县级市,因此生活费也不是很高。整体来看,可能是由于自身是大三学生,较大一大二而言有更多自由时间,因此把自己的全身心都投入到了学习与运动当中,可谓是“学动结合型”。
接下来kmeans老师也依次将剩下三类的分析结果贴了上来:
第二类则是“甜蜜热恋型”,这类学生宗旨则是“与谈恋爱有关的事情,都是我的信仰”:颜值较高,被追的次数较多,恋爱次数也较多,话费、生活费等也较高,可能都是用于情侣之间的消费了,同时由于谈恋爱,这类学生的非学习时间较长,成绩也不是很好;
第三类则是“迷糊发呆型”:此类中大部分则是女生,恋爱情况较少,社交关系也很少,又非常宅,学习成绩和娱乐水平也就一般,更可怕的是娱乐时间、睡觉时间、运动时间都要低于正常水平,只有自习时间略高一些,大概是发呆成为了生活的主旋律?但可能由于家乡主要是在一线城市,因此消费水平不低,这也成为了这类学生最突出的一点。
第四类则是“社交达人型”,其宗旨则是“学习不够,社交来补”:可能由于主要是大三大四的家乡在一线城市的学生,因此对成绩并不是很看重,对社交方面有所需求。成绩不是很理想,因此凭借着自身颜值,投入到社交事业中,娱乐、睡眠、运动时间都较长,参加很多学生组织,也是班级的班干部,恋爱次数也首屈一指。
随着四类学生不同特征的呈现,kmeans导师的节目也即将结束了,最后他对自己的节目做了一个总结:首先使用碎石图道具确定聚类个数,再开始对数据进行聚类,最终结合行业背景对聚类中心进行解读,分析不同类的不同特征。在众人的鼓掌中(相信这次现场观众们应该是没有吐槽的),kmeans导师退场了,接下来的是层次聚类导师的表演。
层次聚类表演
1层次聚类重头戏——树状图
在看到kmean导师的表演后,这层次聚类导师就琢磨起来了,这前面kmeans聚类将大学生分成了四类,对不同学生有所刻画,我要干些啥才能出彩呢?他对数据框中行聚类了,那我要不对列聚个类?诶,这是个good idea。想到此,层次聚类导师也开始了他的节目(碎碎念:当然不是说k-means只能对个体、层次聚类法只能对变量啦。无论对变量还是个体,用任何一种聚类方法都是可!以!的!)
首先层次聚类导师向我们展示了他的核心——hclust函数,只要将数据放到这个函数中,就可以得到聚类的结果,但由于这次是对变量聚类,因此需要放进去的是变量的相关系数矩阵;但尴尬的事情发生了,节目组也不知道他要这么表演,没事先准备好这相关系数矩阵呀,层次聚类导师得自己动手丰衣足食了。没想到我们布置会场还是有这么多不完善的地方,看来针对每位导师,都需要有独特的会场布置方式。
不过层次聚类导师也没有太介意会场的疏忽,自己处理好矩阵之后,又弄了一会就直接给大家就展示了他节目的重头戏——树状图。这时候又有观众开始吐槽了,你这啥话都不说,直接上图是几个意思?层次聚类导师这才解释道,由于层次聚类是一层一层的聚,逐步将变量聚在一起的嘛,所以我们可以将其可视化,以树状图的形式呈现,看图解读总比看字解读舒服吧。这样我们对层次聚类结果的解读就转为了对树状图的解读。这一步我们先利用as.dendrogram函数将结果强制转为树状图格式,再利用plot函数就可以轻松得到:
2三维度结果全面解读——不同角度看变量
听到这里,观众们才明白了这树状图是干啥的,但问题又来了,既然这图反映了指标分类,那应该如何进行解读呢?层次聚类导师不慌不忙的为我们展开了解释:这系统树图纵坐标是标有数字的,代表了图中一个个分支的高度,高度的高低也代表了在对指标分类时区别的快慢:高度越高,证明这个变量被区分出来的越早,也就是更早自成一家,因此解读的重点自然落到了分析为什么某些指标距离较近及某些指标为什么距离较远的问题上。面对这些问题,我们依旧需要对其行业背景有了解,才能更好地进行分析,接下来层次聚类导师就结合着大学生在校生活的“行业背景”,从三个维度对上面指标分类的结果对变量进行了以下解读:
第一个方面就是从树状图的根部变量之间的相互关系进行解读:以上图中最左边的这一小类为例,其由每周娱乐时间和每周睡觉时间两个变量构成,这说明这二者的相关关系可能较大,根据大学生的在校作息,可以理解为喜爱娱乐的同学学习时间较少,因此娱乐过后需要多睡觉来填补精力,因此二者相关性较强。其他各类的变量之间关系也以此类推。
第二个方面则是从树状图顶部各变量的分类来进行解读:可以看到树状图在高度为1.5左右时分为两类;在1.2左右时分为了五类;在1.0左右时就分为了10类,不同的高度会导致变量存在于不同的类别,因此在确定聚类个数后,就可以根据树状图中对应的高度对变量进行归类。
第三个方面则是从定性变量的取值水平来进行解读:由于定性变量只能取一个值,因此在取值水平中呈现出的相关关系应该很强,但上图可以看出“一线城市”、“二线城市”等取值在树状图根部附近并没有处于同一类别中,这说明了定性变量不同的取值有着明显不同的特征,如一线城市很多都是女生,会舞蹈、二线城市的学生生活费都较高、三线城市学生会打羽毛球的较多……这样我们根据与定性变量不同取值归为同一类的其他变量,就可以对定性变量中有不同取值的人呈现出明显不同的刻画。
讲完了对聚类结果的分析,层次聚类导师的节目也走到了尾声,总体而言,层次聚类可能显得更为简单些,同时树状图充分地为我们呈现了不同变量之间的远近关系。随着层次聚类导师离开了节目现场,本次直播也快要结束了,感谢两位导师的精彩表演,也感谢大家的收看!
直播赠言,难忘今宵
这里再和大家强调一下,我们将层次聚类用到了对变量的聚类中,但这不代表它就不可以用于对行的聚类,在数据量较小时,利用层次聚类对数据进行聚类也会有着很好的效果。但无论是层次聚类还是kmeans聚类,聚类的结果都只是将原有数据分好了类,而每一类代表什么含义,依旧需要我们结合行业背景对不同类的特征进行分析区别。因此,聚好类只是辅助,分析各类特征才是关键,聚类分析中更多好玩的事情,还期待着大家去探寻,也许下一次就是你的高光时刻!
“物以类聚,人以群分”这个说法,对很多人而言,是耳熟能详的。并且很多生活中的细节,也在不断印证着这个说法。然而现在,这一观点有了科学依据。
朋友间的关系越亲密,大脑的反应活动就越相似 图据网络
本周二发表在《自然通讯》杂志上的一项研究指出,从脑部扫描结果来看,朋友间在反应同一事物时,脑部波长是极其相似的。
该研究由加州大学洛杉矶分校社会心理学家卡罗琳·帕金森带领的研究团队,对达特茅斯大学塔克商学院的42名学生进行了相关实验。首先,这里的“朋友”被定义为会一起出去喝酒、吃饭、看电影或其他“非正式社交活动”的人。这42名参与试验的学生有861种不同的配对方式,而他们中一些是朋友,一些则不是。
据《洛杉矶时报》报道,研究人员向42名学生播放了14段不同内容的视频片段,片段时长从88秒至5分钟不等,总共长达36分钟,目的是唤起观众的一系列情绪。当学生在观看视频时,核磁共振成像仪(MRI)扫描记录了他们大脑中80个不同区域的反应活动模式。
随后,研究人员将每个人的反应图像逐一进行了比较,通过大脑活动模式来预测哪些人是朋友,而哪些只是同班同学。最终的正确率达到了48%,而使用程序算法,通过社交距离进行猜测的准确率仅为25%。
研究人员在最终的报告中写道:“神经相似性会随着人与人之间的友谊而增加。这些结果表明,我们与自己的朋友,在感知及应对周围世界的方式上非常相似。”同一时间,朋友间的反应比非朋友间的反应更为相似。而反应越相似,他们的关系就越亲密。从统计学角度分析,每增加一个单位的神经相似度,两个人是朋友的几率就增加了47%。
尽管“物以类聚,人以群分”这一说法,对于任何听说过的人而言,似乎是显而易见的现象。然而在这项研究前,从没有人对朋友间的认知活动进行过检验,以佐证这一观点。
但这项研究并不能解决关于友谊最基本的谜团:我们究竟会与价值观相似的人成为朋友,还是朋友间的价值观会相互影响?为了解决这些问题,还需要进行长期的研究,但研究人员预测答案将是:两者都有。
望采纳
祝你天天开心