想象一个含有250亿份文件,却没有集中管理机构和馆员的图书馆,而且任何人都可以在任何时间添加新的文件而不需要通知其他人。一方面你可以确定,这庞大的文件堆中有一份文件含有对你至关重要的信息,而另一方面,你又像我们中的大多数人那样没有耐心,想要在几秒钟之内就找到这条信息。你有什么办法呢?
摆在你面前的这个难题看起来似乎无法解决。而这个文件堆跟万维网(World Wide Web)其实相差无几,后者就是一个超大的、高度混乱的以各种形式存放的文件堆。当然,从万维网中找信息我们有办法解决,因为我们对搜索引擎非常熟悉。
本课程将介绍谷歌的网页排序算法(PageRank Algorithm),以及它如何从250亿份网页中捞到与你的搜索条件匹配的结果。
按照时间的顺序把随机事件变化发展的过程记录下来就构成了一个时间序列。对时间序列进行观察、研究、 找寻它变化发展的规律,预测它将来的走势,并且通过干预来控制将来事件就是时间序列分析。本课程将采用时间序列分析预测法解决上面的问题。本课程处理问题的软件是R语言,R是一个自由、免费、源代码开放的软件,是一个被广泛应用于统计计算和统计制图的优秀工具。本课程将简单介绍该软件在时间序列分析中的应用。
大量的应用问题中需要计算数学模型的数值解,而误差信息对于数值解非常重要,不了解误差信息,仅通过一个数值解我们甚至不知道这个问题是否有解。配合了可靠的误差信息的数值解为“可靠解”(reliable solution或者validated solution)。这个课程即是着眼于介绍可靠解的计算,其核心是:介绍区间数学的知识,以图在算法层面上控制逼近、离散等误差;介绍基于区间计算的软件IntLab,以图在实际计算的层面上控制舍入、数据等误差。通过二者的配合,我们可以计算出可靠地误差信息,从而得到问题的可靠解。
本课程共3学时。首先,从一些例子出发引入概率论,介绍概率论的起源和发展历史;其次,介绍概率论的基本任务“解释各种随机现象背后所隐藏的规律”;再次,介绍最近几年获得Field奖、Gauss奖、Abel奖中的几位的工作与概率论的关系,以彰显概率论的国际地位;再其次,介绍概率论在离散数学(如图论、组合、数论等领域)及其他众多学科中的应用;最后,用一些具体的例子来阐述概率论的一些基本概念和应用。
本讲座介绍计算机断层成像(CT)的图像重建方法。通过介绍CT图像的工作原理,建立相应的数学模型--线性方程组,然后由此介绍了一些求解线性方程组的数值解法。本讲座对于想了解线性代数方程组数值解法的同学值得选择。
GeoGebra是一个在「Java」虚拟机环境上执行的解析几何作图程序,可以说是一个数字式的平面直角坐标系统。所以用 GeoGebra做出来的动态图档,可以轻易的在不同操作系统,如 Windows、Linux、FreeBSD、Mac等不同的操作系统上执行。或可以在不同执行平台,如 Microsoft IE、Mozilla Firefox 等不同的因特网浏览器上,完整而无碍的执行。
在学习和工作中, 小到写个通知,信件,大到撰写论文,出版书籍,我们每个人都会遇到需要排版的情况。当然目前有许多排版软件可供选择,不过对于理科特别是数学专业的学生和老师常常需要面对大量的数学公式, 如果使用像微软的Office这样的软件排版数学公式往往费时而且排版出来的数学公式也不好看。TeX 是在 70 年代中期至 80 年代, 天才计算机程序设计艺术专家斯坦福大学的高德纳(Donald Ervin Knuth)教授为出版其7卷本的著作《计算机程序设计艺术》而编制的排版程序, TeX 是二十世纪排版技术方面最重大的发明,历经近50 年的岁月,TeX 在基本没有改动的情况下被世界各地各种语言的人们广泛使用, TeX 优美的排版效果令使用者爱不释手。LaTeX 是 Leslie Lamport 博士设计的基于 TeX 的文档排版系统, 也就是用 TeX 的语言编写的一组宏代码, 它使得即使对排版理论几乎一无所知的学者也能比较容易的将文稿或书籍排版出来。本课程将面向对LaTeX零基础的同学介绍LaTeX排版的基础知识。
有限元方法是工程计算中近似求解偏微分方程的常用数值解法。內罚有限元方法是标准有限元方法的一种变形。高波数波散射问题的高效数值模拟是一个著名的难题。本课程以声波散射问题为例介绍三角网上有限元方法的MATLAB实现;及如何选取內罚有限元方法的加罚参数以有效求解高波数问题。
随机模拟方法又称为蒙特卡罗方法。这是随着计算机的诞生同时产生的,其主要奠基人是诺依曼。通过随机模拟的方法可以解决实际中很多复杂问题,这些问题或者难于得到理论解;或者有理论解,但无法计算(如复杂积分的计算,最优化问题等等)。用计算机进行随机模拟计算是一个很好的解决方法,它的特点是简单易行,避免了复杂的数学理论,十分实用。本课程将介绍随机模拟在保险精算中的简单应用以及一种重要的产生随机数的方法-取舍法。
本课程共计4学时。首先从传统的信号处理理论谈起,介绍Nyquist采样的局限性,以及编码传输潜在的缺陷。其次,我们通过实际例子来说明实际应用中的信号往往具有某种稀疏性或可压缩性。进而引入近年来处理信号的新技术:压缩传感。我们介绍压缩传感的基本理论,以及如何利用带有稀疏正则项的优化模型来重建稀疏信号。最后,介绍求解L1模型的常用数值方法。
我们每个人的生活都离不开数据。大数据开启了一次重大的时代转型。就像望远镜让我们能够感受宇宙,显微镜让我们能够观察微生物一样,大数据正改变我们的生活和理解世界的方式,成为新发明和新服务的源泉。数据挖掘是信息产业界近来非常热门的研究方向,聚类分析是数据挖掘中的核心技术。聚类分析广泛应用于模式识别、信息检索、图像处理、机器学习等领域。K-均值算法是基于原型的聚类技术,具有简单、快速并有效处理大规模数据的优点,是应用最广泛的聚类方法之一。本讲主要介绍K-means聚类技术,及在R软件上的算法实现。
最优化理论与方法是运筹学与计算数学的交叉学科.近20年来,信号处理,图像恢复,机器学习等信息技术领域以及统计学、数据科学中涌现了大量的优化问题.如何有效地求解这些问题,是近几年应用数学的一个新的研究热点, 一些当今世界一流应用数学家对这些问题也表现了浓厚的兴趣并给予了极大的关注.
数据科学中大规模计算问题的很大一部分可以归结为(或松弛成)一个可分离算子的凸优化问题. 这些科学计算中的问题往往与一个极大-极小问题等价,求解就类同于商业谈判中得到买卖双方都满意的双赢策略. 由于问题规模大,传统的优化求解方法往往难以凑效.根据问题的结构特点,设计简单易行的一阶分裂算法已渐成学界共识,一些简单的迭代求解方法又犹如一个逐步趋近双赢策略的商业谈判过程.本课程从日常生活的常识、商业谈判的视角出发,介绍设计最优化方法的一些基本原理,求解一些管理科学与技术科学中的问题.
变分不等式是运筹学中许多问题的一种统一表述模式.经济活动中的最优平衡问题、政策性调控问题,都可以用变分不等式来描述. 我们会用最直观的例子让学生理解这个貌似深奥的概念.最优化和变分不等式有着紧密的联系.凸优化的一阶最优性条件就是一个单调变分不等式.在变分不等式的框架下考虑凸优化的求解方法,就像学了微积分的大学生不再用配方法,而是通过求导得到一元二次函数的极值点,这常常会带来很大的方便.
长期以来,针对管理科学的特点,我们致力于单调变分不等式的一阶方法的研究,提出了以投影收缩算法为代表的一系列预测-校正方法.得益于求解变分不等式收缩算法的研究基础,在应对大规模优化问题一阶求解方法的时候,我们根据“分解降低难度,整合把握方向”的原理提出的一系列求解凸优化的分裂收缩算法.这些方法被多所美国名校的研究工作者用来求解实际问题,赢得了国际学术界的好评.
为满足高年级本科生的知识需求,我们分三个专题开设《凸优化的分裂收缩算法》.结合我们课题组的学术成果,以数据科学中凸优化的一些典型问题为例,向学生介绍如何以变分不等式为基本框架,设计大型凸优化问题的求解算法.利用我们的优势,争取收到事半而功倍的效果.
著名数学家冯康先生说过,一个科学家最大的本领就在于化复杂为简单,用简单的方法去解决复杂的问题.本课程中介绍凸规划的分裂收缩算法,始终追求简单统一的原则.简单,方法才有可能被相关学科和工程师们采用.因为简单,课程中介绍的一些最新方法已经被机器学习和图像处理等领域的专家学者采用.课程中介绍的方法,都有统一的框架.这些统一框架揭示已有方法之间的内在联系,简化算法的收敛性证明,又能对设计新的算法,提高算法效率提供指导性帮助.
教材选取何炳生主页上《凸优化和单调变分不等式的收缩算法-统一框架与应用》的部分内容,结合本科生的需求,做适当调整.力求做到普及与提高相结合,学习和创新相结合,对学生从学习走向研究有所帮助.
R软件是一款自由下载安装的无版权统计软件。随着统计在各行各业的广泛应用,科研人员们开发了大量的软件包,可供大家免费下载安装使用。目前在统计,金融,计量经济学等领域都得到广泛应用。相较其它软件如sas,matlab,它体积小,随时随地可以免费下载安装,特别是很多大牛把最新的研究成果做成package放到网上可以直接下载应用。
在很多应用问题中,涉及到多个决策主体(angent,可以是人、团体甚至是抽象的机制),他们的效用(interest或者objective)是不一致的甚至对抗的,那么最终所有的决策主体能达到某种决策上的均衡吗?这是个非常有趣的问题,而且有着广泛的实际背景,例如国家之间的碳排放协议、交通规划、乃至飞行器的设计。这些看上去不相干的实际问题,其中都有竞争机制下的多目标决策问题,这正是博弈论(Game Theory)所要研究的。本课程介绍博弈论的产生、基本概念、一些常见的博弈问题以及相关的处理手法。
随机过程是现代概率论的一个重要分支,其在物理、化学、生物、经济、金融等学科中有着广泛的应用。
布朗运动作为一类重要的随机过程,具有明确的物理背景和严格的数学定义。本课程将介绍布朗运动、股票价格过程
及金融衍生产品定价相关内容。
EM算法是Dempste,rLaird,Rubin于1977年提出的,这篇文章是统计学中引用率最高的文章之一。在机器学习与数据挖掘中有着广泛的应用。我们将详细讲解EM算法的原理,算法收敛性及其应用实例。
GPS是英文Global Positioning System(全球定位系统)的简称。GPS起始于1958年美国军方的一个项目,1964年投入使用。20世纪70年代,美国陆海空三军联合研制了新一代卫星定位系统GPS 。主要目的是为陆海空三大领域提供实时、全天候和全球性的导航服务,并用于情报收集、核爆监测和应急通讯等一些军事目的,经过20余年的研究实验,耗资300亿美元,到1994年,全球覆盖率高达98%的24颗GPS卫星己布设完成。GPS在现代生活中发挥着越来越重要的作用,通过GPS可以开展卫星导航、手机定位等服务。
本课程将介绍GPS的原理,提高GPS精度的方法以及怎么在导航中求出最短路径等GPS导航背后的算法与技巧。
本课程共计4学时。高维数据需要大量的计算资源,并对某些机器学习算法造成难以克服的推广困难。数据降维与信息的有损压缩紧密相关,能够用以表示数据、解释数据、分析数据、寻找到数据背后所隐藏的本质信息,极大地降低计算复杂度。该课程简略地介绍数据降维的主成分分析法、奇异值分解等,及其在个性化推荐系统中的应用。通过本课程学习,使学生了解高维数据处理的基本方法,并能够进行编程实现。
生活中我们常常面临许多选择或被选择,比如我们选择某个通讯公司的手机卡,选择海南香蕉还是进口香蕉,我们保研成功了,这些主动选择或被动选择背后有怎样的机制呢?如果让你再选一次,是否有不同的答案呢?有没有碰到过两难的情况呢?本课程将首先介绍选择的心理机制,以及基于统计假设建立离散选择模型,最后结合生活案例进行分析。
Flash是一款著名的动画制作软件、交互功能很强,成品文件小巧玲珑。它使用了矢量图形(用数学向量描述的图形),可以随意调整缩放,而不会影响图形文件的大小和质量。通过使用关键帧和元件(元件可以链接式的重复使用),使所生成的“.swf”格式的动画文件非常小,便于在网络上播放和传播。
Flash制作的动画,能够交互式地将音乐、动画、声效等融合在一起,很多用户已经把Flash当做一个开发多媒体的首选工具。它拥有功能强大的ActionScript语言,采用了与Java类似的语法结构,拥有自己的ActionScript函数、属性和目标对象等。