四种科学范式

最近看了一篇文章,关于Few-shot Learning的综述,看到作者有第四范式的研究者。这个名字让我联想到了之前帮导师做《机器学习》课程PPT时查阅到的一些资料,整理了一下写在这里。
ps. 如导师所言,干的事儿都不白干,总会有用的。。

范式

  • “范式”(paradigm)这一概念最初由美国著名科学哲学家Thomas Samuel Kuhn于1962年在《科学革命的结构》中提出来,指的是常规科学所赖以运作的理论基础和实践规范,是从事某一科学的科学家群体所共同遵从的世界观和行为方式。
  • “范式”的基本理论和方法随着科学的发展发生变化,新范式的产生,一方面是由于科学研究范式本身的发展,另一方面则是由于外部环境的推动。

科学范式的提出

图灵奖得主,关系型数据库的鼻祖Jim Gray(吉姆-格雷)在2007年加州山景城召开的NRC-CSTB大会上,发表了生前的最后一次演讲“The Fourth Paradigm: Data-Intensive Scientific Discovery”,提出了科学研究的第四类范式,其中的“数据密集型”就是现在我们熟知的“大数据”。

  • 几千年前,是经验科学,主要用来描述自然现象
  • 几百年前,是理论科学,使用模型或归纳法进行科学研究
  • 几十年前,是计算科学,主要模拟复杂的现象
    今天,是数据探索,统一于理论、实验和模拟。它的主要特征是:数据依靠信息设备收集或模拟产生,依靠软件处理,用计算机进行存储,使用专用的数据管理和统计软件进行分析。

第一范式

  • Describing natural phenomena,描述记录自然现象,也可理解为实验科学
  • 方法以基于实验或经验的归纳为主
  • 如:钻木取火,比萨斜塔实验

第二范式——理论科学

  • Using models, generalizations,在自然现象基础上进行了抽象简化
  • 主要通过构建数学模型进行研究
  • 如:相对论,博弈论

第三范式——计算科学

  • Simulating complex phenomena,以计算机仿真模拟取代实验
  • 如:天气预报、核试验模拟

第四范式——数据探索

  • Data captured by instruments or generated by simulator; Processed by software; Information stored in computer; Scientist analyzes database
  • 因果关系→相关关系,知道“是什么”有时比知道“为什么”更重要

推荐阅读

Tony Hey, et al., The Fourth Paradigm: Data-Intensive Scientific Discovery, 2009.
《Big Data: A Revolution That Will Transform How We Live, Work, and Think》by Viktor Mayer-Schönberger
第二本书网上有卖,内容写的很好,里面有很多观点很深刻。唉,还是看书少啊。。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容