当研究人员们做出了激动人心的发现时,其所用到的数据通常会被严密地保护起来,直到它们可以被进一步检验、拓展,然后才能伴着欢庆号角,在经过同行评审的学术杂志中发表——至少其中一部分。
但这个传统经常使公众和大多数其他研究人员被蒙在鼓里——有时甚至长达数年,正如某些人哀叹的一个典型例子,对Ardipithecus原始人的准确描述——它在最初被发现后过了大约15年才进入人们的视野。由于科学方法鼓励人们互相评论和检验彼此的研究结果,以便于复制这个成果,所以杂志发表常常伴随着分享原始数据。而在一个数据快速传递和储存的网络时代中,许多研究人员已开始坚定地呼吁大家开放交流数据,并且更广泛地使用所谓的开源科学。
一个连接更紧密的存储库使数据能够(或必须)在发现后迅速被上传,这个想法在气候变化,分子化学和微生物等领域变得十分流行。而在医学领域,许多研究人员憧憬着一个数字的未来:成堆的病人数据被收集起来后可以马上进行模式分析。
“从纯粹的科学发展角度来说,即刻公布每一个数据是更有利的,” 华盛顿大学法学院的知识产权部副主任Jorge Contreras在一片有准备的演讲中说道。他7月22日在Science杂志上在线发表了一篇新的政策文章,正是关于这个话题。
然而这样理想主义的主张,他也注意到,“并没有给与得到原始数据的科学家们一个通过发表学术文章来发展事业的机会,” 这样一来,在一个“不发表就灭亡”的残酷世界里,新发现和新数据还是会被藏着掖着。
而且,即便发表之后,数据缺失的情况并没有好转。“由于忙碌的计划表,竞争压力和其他人际交往间无法控制的的因素,甚至在发表论文之后,分享数据的过程依旧很不连贯,”Contreras在他的文章中观察到。
并不是每一个领域都对掌控数据如此紧张,举个鼓舞人心的例子,人类基因组计划就明文规定,所有的新数据必须再24小时内被公布于众。但是Contreras也承认,并不是所有的学术领域都能重大到可以如此自由而迅速地接触数据。基因组“代表了人类共同的历史遗产,其研究不应该被专利所阻碍,”他写道。而另一方面,专利正是许多科学研究的主要目的,太早亮出你的底牌显然不是一个明智的决定。
于是,Contreras提出要在数据的自由和权利中找到平衡。“我想人们应该妥协,”他在演讲中说道。“太过注重数据使用者的利益将不太会吸引到足够的数据生产者,而太多关心数据生产者的利益,” 则会削弱对科学研究其他科学家和普通民众的帮助。
但那并不表示数据应该被藏起来。相反,他认为,在数据公开后,但在其他研究者能够发表相关结论之前,这段时间能使得“数据生产者足够的动力去准备论文,同时又使数据能够更开放地推动科学进步。”