微信扫一扫
分享到朋友圈

学不好数学,你可能连朋友也找不到!

作者:果壳网 来源:果壳网 公众号
分享到:

09-27

当你进入一所新的学校,找到一份新的工作,或者来到一个新的城市,你该如何结交新的朋友呢?你可以主动去勾搭“交际花”,通过他们结识更多的人;当然也可以“一切随缘”,在日常交往中逐渐找到朋友。无论你选择哪种方案,了解人群中现有的社交关系,对你的交友选择意义重大。


想象一下,如果有一天你搬到了一个奇怪的新城市,在这个城市里有一个奇怪的规则:每个人最多可以有4个朋友,并且每个人都希望能最大化他们的友谊。那么这个城市中人们的友谊关系将会呈现出怎样的结构?


为了探索这个问题,我们将用到数学中的一个概念——网络。


简单来说,网络是由一系列的节点和他们之间的连接组成的,是一个抽象的数学概念。它既可以指代计算机网络的连接,不同人之间的合作,魔方的不同状态和拧魔方的操作,当然,也可以指代我们这个城市中的友谊结构——把人看作一个个的节点,而人与人之间的友谊看作是连接。


进行了数学抽象化的表示后,这个城市的友谊网络看上去差不多可能是这样:




每个人都会努力找到他的4个朋友。当一个新人搬到城里时,他们会找一个朋友数少于4个的人来建立友谊,通过这种方式,随着时间的推移,友谊网络变得越来越庞大。当然,不排除有个别人形成了一个“小圈子”,游离于“大部队”之外,但是在今天的讨论中我们就暂且忽略这种情况,认为所有的人都集中在一张友谊网络之内。


一张网络如果结构清楚明晰,我们往往能从中得到很多信息。但是当节点越来越多,连接越来越密,看上去越来越“无迹可寻”时,简单的可视化分析可能会变得不大管用。因此,我们需要别的手段来挖掘网络的更深层次的信息。


在网络中,节点具有的连接数被称作该节点的“度”。一个节点的度越大,它连接的其它节点也就越多,反之就越少。




度是网络中的一个很重要的概念,但它是局域的:它只能描述单个节点的性质。如果要考虑所有节点的性质,我们就必须做一个统计。


在我们的友谊网络中,每个节点代表一个人,节点的度就是这个人拥有多少个朋友。大多数人都会拥有4个朋友,没有人会拥有超过4个朋友,但可以少于4个,有一些度为3、2、1的节点。前面我们说了,不考虑游离的个人或者组织,因此度的分布会是这样的:



这张度的分布直方图就呈现了我们友谊网络的重要信息。当然,在这种简单的例子中,度的分布可能不会比简单的可视化带给我们更多的信息量。但是在更加复杂的网络中,它往往能发挥更加强大的作用。


 


让我们离开刚刚那个城市,进入一个新的城市。在这座城市中的友谊有一个新的规律:友谊是随机发生的。也就是说,这个城市一开始没有友谊连接,每个人都是孤立的节点,然后在所有可能的连接中随机挑选一条,变成真的连接,然后随着时间的推移不断重复和发展,友谊网络变得越来越复杂。


这样的友谊会是什么样子?可能会像下面这样:



这样的表示恐怕很难看清背后的本质,但如果我们研究它的度的分布,就能得到一些有用的信息。尽管直接计算并不容易,我们可以通过一个小小的例子简单推演一下。


假设这座城市只有10个人,你是其中之一,那么运用高中组合数学的知识,我们可以简单地算出所有可能的友谊共有10×9÷2=45个,也就是说网络中最多有45条边。


现在我们随机地产生一个友谊,也就是从45条边中随意选择一条把它画上,那么它与你有关的概率是多少?显然,与你有关的边一共有9条,因为你可能跟剩下的9个人分别产生友谊,所以与你有关的概率就是9÷45=20%。


这个结论适用于10个人中的每一个人,因此每个人都有20%的概率获得新的友谊。当然,随着友谊的增加,这个概率会有所变化,但是总的来说,每个节点获得友谊的概率大致相同。这就意味着友谊将在这座城市里均匀分布,几乎每个人都会拥有接近平均数量的朋友。


这种熟悉的性质体现在典型随机网络的二项式度分布中。



通过研究这种形式的度分布,我们会发现大多数节点的度是平均的,只有个别节点会出现极大或极小的情况。这便是一条很重要的信息,而且当有新人进入时,分布可能会略有变化,但是这种一般性的特征不会改变。


 


回到我们的现实生活中,上面的两个例子都不是符合真实情况的友谊网络模型。人们可以拥有4个以上的朋友,并且也并不符合二项式度分布。那么真实的友谊网络模型会是什么样的呢?


当你和朋友或者朋友的朋友建立联系时,你们的友谊网络可能会分享现实世界其它网络的功能,例如食物网、蛋白质网、互联网等等。这些网络通常都是所谓的“无标度网络”——这是一种在过去20年中主导网络科学的连通模型,数学、物理学、经济学、生物学、社会科学等领域的研究人员都在各自的领域观察到了无标度网络的现象。


一个复杂的无标度网络,来源于某社交网络的元数据 | Martin Grandjean


无标度网络的原则非常简单——优先连接。它不同于前面我们提到的简单的随机网络,具有更多连接的节点获得新连接的概率更大,换句话说就是强者愈强的马太效应


这种无标度网络模型对应到友谊网络中是否合理呢?我们来想一下,生活中,朋友越多的人,认识新朋友的概率也就越高,符合我们的常识。


虽然在无标度网络的发展中有很多因素在共同起着作用,但是大多数科学家还是认为“优先连接”的原则是最为根本的,它对网络的度分布有着非常大的影响:



从图中我们可以看出,优先连接的原则意味着度的长尾分布。网络中大多数节点的度都很低,但是会有个别节点拥有非常高的度。这和前面我们假设的两个模型截然不同。


这些度很高的节点,就像集线器一样,是无标度网络的关键特征。他们是友谊网络中的“交际花”,是经济中心的银行,是互联网的核心交换机房……这些节点的存在,会让我们有一种“世界很小”的错觉。例如,在Facebook的20亿用户中随机选择2个,他们平均可以通过不超过4个朋友建立联系。并且它们还具有抵御网络风险的能力,少数节点的崩溃不影响整体网络的通畅。


尽管无标度网络的研究与应用得到了大量的认可,但并不代表没有任何争议。这些度分布的精确数学特征可能就难以解释。网络科学先驱、物理学家Albert-László Barabási在他的著作《连接:新网络科学》一书中指出,表现出优先连接性质的网络将遵循幂律形式的度分布。幂律分布在很多物理模型中很常见,例如万有引力定律和库仑定律,它们都可以表示成f(x)=axk的形式,图像如下所示:



幂律分布确实有一条长长的尾巴,但是这真的符合实际吗?今年早些时候发表的一项研究分析了1000个真实世界的网络,发现只有三分之一的分布可以通过幂律分布很好的描述。很多的网络可以用指数分布和对数正态分布来更准确地描述,它们可能具有无标度网络的高级特征,但是度分布不一致,它们真的可以被看作是无标度分布吗?这真的很重要吗?


如果我们希望将理论和数据联系起来,这一点就很重要。但优先连接原则真的是无标度网络形成的主要因素吗?还是说有其它的因素也起着重要的作用,这些因素导致了不同的度分布?要回答这些问题,并找出接下来要问的正确问题,是充分理解网络的性质与结构、网络如何发展和演化的很重要的一部分。


并且,争议也在提醒着我们,就像我们的网络一样,数学本身也是一系列不断发展的联系。在网络科学这样一个年轻的研究领域,当前的研究也在不断地挑战着20年前的猜想。当新的想法加入到网络之中,它们将我们所有人与数学的过去和未来相连接。所以研究数学就像是发展友谊一样,需要我们找到连接最多最核心的节点,通过它们来最大化你的“度”。


原文链接:

https://www.quantamagazine.org/how-network-math-can-help-you-make-friends-20180820/

作者:Patrick Honner

翻译:可乐不加冰

审校:山寺小沙弥


本文经授权转载自公众号:中科院物理所

(微信公众号ID:cas-iop)


果壳

ID:Guokr42

整天不知道在科普些啥玩意儿的果壳

我觉得你应该关注一下

阅读8877
数学 朋友 
举报0
关注果壳网微信号:guokr42

用微信扫描二维码即可关注
声明

1、头条易读遵循行业规范,任何转载的稿件都会明确标注作者和来源;
2、本文内容来自“果壳网”微信公众号,文章版权归果壳网公众号所有。

评论
更多

文章来自于公众号:

果壳网

微信号:guokr42

邮箱qunxueyuan#163.com(将#换成@)
微信编辑器
免责声明
www.weixinyidu.com   免责声明
版权声明:本站收录微信公众号和微信文章内容全部来自于网络,仅供个人学习、研究或者欣赏使用。版权归原作者所有。禁止一切商业用途。其中内容并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。如果您发现头条易读网站上有侵犯您的知识产权的内容,请与我们联系,我们会及时修改或删除。
本站声明:本站与腾讯微信、微信公众平台无任何关联,非腾讯微信官方网站。