三体社区泛科幻大本营

注册

只看楼主

科学是怎样被计算机玩坏的,以及我们能怎么补救

美睿 发表于 2015-11-10 19:53:48 [ 上一主题] [下一主题]

本帖最后由 美睿 于 2015-11-10 19:55 编辑

计算机成了我们工作生活不可缺少的一部分。

生态学家们使用计算机来模拟灾难对于动物数量的效果;生物学家们使用计算机来检索巨量DNA数据;天文学家们使用计算机来控制巨型望远镜阵列,以及处理收集的数据;海洋学家们使用计算机结合来自卫星、船舶和浮标的数据来预测全球气候;社会科学家们使用计算机来发现和预测政策效果或者分析谈话记录。

计算机帮助几乎每个学科的研究者们识别他们数据中的有趣之处。

而计算机也是我们个人的工具,我们经常独占使用自己的计算机,而它的文件以及目录一般被认为是隐私空间,不会被公众所看到。准备数据、分析它、可视化结果——这些程序都是在计算机上私下完成的任务,只有在流水线的最末端,才出来一篇公众可见的期刊文章来总结所有这些私有任务。
1.jpg
谁也不知道这是计算机,还是数据黑箱

而在十七世纪六十年代英国科学家罗伯特·波义耳曾经表示:一项发现中应该能够被再现,才能被接受成为科学知识。也就是说一件事情经过重复后,最终得到同一个结果才能被叫做真理(科学知识)。

在之前的科学历史上,研究者们报告他们的研究方法的方式,都可以让人们能独立再现他们的成果。

可是,自从有了个人计算机的出现许多研究的可再现性的这个说法就看不见了。如果不是根本不可能的话。现今的研究过程太多的被计算机的不透明使用所遮蔽,大部分研究人员已经对计算机产生依赖,导致了别人几乎不可能重建他们的成果。

怎么能评判结果的可靠性,或者重现其分析呢?
2.jpg
祝重建分析好运吧。US Army

斯坦福统计学家Jonathan Buckheit和David Donoho早在1995年就意识到了这个问题,当时个人计算机仍然是相当新的想法。

他们做出了一个激进的要求,在计算机上做的每一件事最终都会公开给别人看。这意味着我们个人计算机上的所有那些私人文件,以及我们在准备发表时所做的私下分析任务都应该伴随期刊文章被公开。

Victoria Stodden发现对于分享文件最大的反对意见是编写文档和清理文件所需的准备时间,第二最大的顾虑是这些文件如果被别人使用有得不到承认的风险。
3.jpg
计算机里有什么秘密?US Army

于是最近,由生物学家、生态学家、核工程师、神经科学家、经济学家和政治学家组成的这几个小组都分别提出了解决这个问题的类似方案,他们将会一起把科学数据从未被记录的计算机操纵黑箱中解救出来,这样独立读者们就又可以批判性地评估和重现结果了。这样研究者、公众、和科学本身都会受益。

他们给出了这样的建议:
1 ——把数据分析期间的鼠标指点过程尽可能地最小化,并替换为包含计算机执行的指令的脚本。

这样可以解决鼠标移动留不下痕迹、难以与他人沟通、难以自动化的记录问题。这样使用Microsoft Excel之类电子表格程序进行数据清理、组织任务期间很普遍。

而另一方面,脚本则包含无歧异的指令,能在遥远的未来(当具体细节已经被忘记时)被其作者和其他研究者们阅读。因为它们文件不大,也就能被包括在一篇期刊文章里,而且脚本能轻易改编为自动研究任务,能节约时间并减少人为错误的可能。

2 ——使用普及、非专有文件格式来存储文件(如用逗号分隔变量CSV文件来做数据表格),用简单的规范来系统性地把文件组织进文件夹,使得其他人能容易地知道信息是如何组织的。

3 ——他们推荐在所有计算机系统(如Windows、Mac和Linux)上都可用的自由软件来分析和可视化数据(如R和Python),对于协作,他们建议免费程序Git,它能在许多人编辑同一个文档时帮助追踪变化。

现在许多大学生正在学习它们,许多研究生看到组织有条理、使用开放格式、自由软件和流畅协作的个人优势,正在从志愿组织(如Software Carpentry、Data Carpentry和rOpenSci)寻求培训和工具,以填补他们正式训练中的差距。

随着学习这些技能的学生毕业并走上有影响的地位,我们将会看到这些标准变成科学的新常态,学术期刊将会要求代码和数据文件伴随发布,资助机构将会要求把它们放进能公开访问的在线存储库。
4.jpg
用来分析数据的一个脚本的例子

研究者们使用计算机方式的改变会有益于公众参与科学,随着研究者们越来越愿意分享他们的文件和方法,公众将能更好地访问科学研究,越来越多人使用自由软件,公众也将能使用同样的软件来重新合成和扩展发表在期刊文章里的成果。

当然,个人计算机不是科学可再现性问题的唯一原因,实验设计差、不恰当的统计方法、高度竞争性的研究环境以及新颖性和在高知名度期刊上发表所具有的高价值都有责任。

计算机的作用的独特性在于,我们对该问题有一个解决方案,我们有着借鉴自计算机科学研究的成熟工具和经过良好测试的方法的明确建议,来提高任何种类的科学家在计算机上做的研究的可再现性。投资一小部分时间去学习这些工具,我们就能帮助恢复科学的这一基石。

汉化 ▌王兜丢
编辑 ▌美睿
原文:The converation

来源:煎蛋网


转载请邮件:jiaoy@youzu.com

扫码即可关注三体社区

三体社区微信号:

threebody-home

回复 点赞(0)

提示:close

 

已赞!

 

提示:close

 

已关注!

 

您需要登录后才可以回帖 登录 | 立即注册

关注我们新浪微博微信 3

  

沪ICP备14049458号    网站地图

Powered by Discuz! X3.2@2001-2013, Comsenz Inc 版权信息

更多友情链接

钛度社区 3G小说网 磨铁中文网 创世中文网 网易原创 起点中文网 潇湘书院 红袖添香 小说阅读网
科幻世界 书海小说网 纵横中文网 科幻星云网

快速回复 返回顶部 返回列表
close