第六周小讲座——《Google搜索的数学原理》

2012-10-15 发布人:系统管理员

讲座老师:华育中学数学教师 叶刚
讲座时间:2012年10月10日下午1:20-2:00
讲座地点:公共教室A305

[讲座简介]
1、日常生活中简单的搜索得以实现主要得益于以下三条:
  (1)搜索对象数量较少;
  (2)搜索对象具有良好的分类和排序;
  (3)搜索结果的重复度较低。
  而互联网上对网页进行搜索不满足以上三条,使得互联网搜索非常困难。
2、在Google主导互联网搜索之前,多数搜索引擎采用关键词在网页中出现的次数来决定网页的排序,这个排序的方法导致广告网页和垃圾网页经常“金榜题名”。
3、1996年初,Google公司创始人Larry Page和Sergey Brin通过类比学术界用学术论文的被引用次数和是否被重要人物引用来评判学术论文的重要性这一方法,发现在互联网上可以用一个网页被其它网页的链接的次数以及是否被重要的(排序靠前的)网页链接来评判该网页的重要性,从而对互联网上的所有网页进行排序。
4、Larry Page和Sergey Brin对网页排序的具体计算设计了一个重要的公式,通过虚拟用户在互联网上漫游了充分长时间后访问各个网页的概率分布来决定网页的排序。

suo1.jpg

 

suo2.jpg

 

suo3.jpg

[听后感]
    Google作为这个世界上公认的最强的搜索引擎,它的搜索原理必然非常复杂。叶刚老师专门开设了一场关于Google搜索的数学原理的讲座,为我们讲述了这一复杂而又有趣的原理。老师主要讲了Google怎样进行对网页的排序的知识。叶老师告诉我们,搜索引擎对于网页的排序,主要是靠这个网页被转载的数量以及被重要网站转载的数量来决定的。重要网站比如某一个诺贝尔奖得主的网站。被转载的次数越多,这个网页就会被排的越靠前。这样的排序方式将会用到一个以转载量为分母的数学公式。而老师又提出了问题:这个公式有没有什么问题?同学们便讨论开了。有些反应快的同学立刻说道:当转载量为0的时候,这个公式无意义。对!”,老师称赞道:“那又有没有办法可以解决呢?”同学们又开始了讨论。最后,老师给出了答案:只要把分母改成所有网页的数量就行了。这次讲座让我们了解了Google的搜索原理,使我们都受益匪浅。(14届 支鑫奕) 

    周三,我听了由叶刚老师开设的讲座《Google搜索的数学原理》,我觉得十分有趣。叶老师从创始人的角度入手,写了两位大学生克服困难找到方法的过程,并在之后讲解了其中的数学原理。数学原理涉及到概率的问题,老师只是说了一些基本的东西,我觉得十分实用。在懂得了如何计算网页链接的概率后,我便掌握了选择合适搜索方法的技巧,这让我受益匪浅。(14届 吴旻烨)

    我在本次讲座之中了解了Google 是万维网上最大的搜索引擎,使用户能够访问一个包含超过 80 亿个网址的索引。Google 坚持不懈地对其搜索功能进行革新,始终保持着自己在搜索领域的领先地位。经过这次讲座,我发现了创业其实并不是那么难的,尤其是IT产业与一些科技类的新产业,只要有一个想法,也许只是一个新的更好地算法,就可以建立自己的研究小组,之后成为一个公司,但是其中大多需要极好的数学与计算机的知识,所以眼前,要更认真地学习,多看自己感兴趣的方面的书籍,要有钻研精神,这才是重要的。(14届 葛瑞天)

    本次的《Google搜索的数学原理》讲座是个很有意思的话题,令我这个对电脑程序一窍不通的人也知道了不少搜索引擎的知识。首先,老师从普通搜索说起,令我们对搜索的三大要素有了一定的了解,随后道出电脑搜索引擎与普通搜索的不同,也让我们知道了Google搜索的神奇所在。但它是如何做到在茫茫“信息海”中找到符合用户需求的信息的呢?老师又用幽默的语言向我们介绍了Google两个创始人的想法,循序渐进地引导我们了解搜索时的计算公式和漏洞。虽然由于我们知识掌握有限,不能一下子全部掌握Google搜索的奇妙原理,但本次讲座无疑激起了我们的兴趣。(14届 叶天瑶)