Crevision - Creative Template
  • 课程总览
  • 名师讲堂
  • 正在开课
  • 使用说明
  • 登录
  • 注册

课程总览 / 谷歌如何从网络大海里捞针

关于课程

简介

想象一个含有250亿份文件,却没有集中管理机构和馆员的图书馆,而且任何人都可以在任何时间添加新的文件而不需要通知其他人。一方面你可以确定,这庞大的文件堆中有一份文件含有对你至关重要的信息,而另一方面,你又像我们中的大多数人那样没有耐心,想要在几秒钟之内就找到这条信息。你有什么办法呢?

摆在你面前的这个难题看起来似乎无法解决。而这个文件堆跟万维网(World Wide Web)其实相差无几,后者就是一个超大的、高度混乱的以各种形式存放的文件堆。当然,从万维网中找信息我们有办法解决,因为我们对搜索引擎非常熟悉。

本课程将介绍谷歌的网页排序算法(PageRank Algorithm),以及它如何从250亿份网页中捞到与你的搜索条件匹配的结果。


授课对象

预备知识:线性代数、大学数学


课程内容

  • 谷歌的介绍
  • 如何辨别谁重要:一个网页的重要性是由链接到它的其他网页的数量及其重要性来决定。
  • 如何将上述基本想法转换成线性代数中的一个维数为250亿的矩阵的特征值问题。
  • 如何计算平稳向量(矩阵特征值)即网页排序值:幂法(power method)。
  • 如何解决幂法实现过程中的三个重要的问题。


授课方式

课时:3课时


上课地点

仙林校区综合实验楼丙区-504


上课时间

周五晚


参考资料

1、 http://www.mysanco.com/index.php?class=wenku&action=wenku_item&id=44

2、http://www.ams.org/samplings/feature-column/fcarc-pagerank

3、http://zh.wikipedia.org/wiki/Google

4、矩阵计算(第3版) 戈卢布(Gene H.Golub) (作者), 范洛恩(Charles F.Van Loan) (作者), 袁亚湘 (译者), 等


下载文件

登录查看文件

任课教师

Member-1 顾国勇

相关课程

  • 博弈论:竞争机制的数学
  • 利用Geogebra 画空间图形
  • 从商业谈判到优化算法
  • Flash动画制作与场景设计
  • 拥抱大数据时代 ------K-均值聚类算法
  • 时间序列分析在经济预测中的应用
  • Matlab简单入门
  • 随机非随意,概率破玄机
  • 高波数声波散射问题的内罚有限元解法
  • GPS导航背后的数学
  • R软件简介
  • 大摆幅钟摆的运动
  • 高维数据降维及应用
  • 概率论和金融衍生产品定价
  • 蒙特卡洛方法简介
  • MCMC方法
  • CT图像的重建
  • 压缩传感与稀疏信号重建简介
  • 区间数学与可靠解计算
  • 机器学习十大算法中的EM算法
本期报名人数: 31

过往选课人数

  • 第1期:75人
  • 第2期:101人

课程讨论

简介

此处只讨论与本课程相关的问题。



© Copyright 2025
地址: 南京市鼓楼区汉口路22号