开放科学的障碍:从大型企业到沃森和克里克

还没有读者喜欢这篇文章。
To compete or collaborate

Opensource.com

只有当发现成果被共享时,科学才能进步,但科学家们往往缺乏公开他们研究的动力。这是佐治亚理工学院的一组研究人员在他们最近发表于 voxEU.org 上的文章 学术科学家会与同事分享信息吗?不一定 中所说的。事实上,当被要求分享数据时,科学家们常常会做出复杂而精明的决定

“考虑两位科学家决定是否相互分享材料(如细胞系)或数据的行为。如果一位科学家分享了她的材料,她会增加另一位科学家在她之前解决问题的可能性。另一方面,分享的潜在好处是另一位科学家将来可能会分享他的材料。这具有众所周知的囚徒困境的明显要素;如果他们分享,两位科学家都会变得更好,但除非预计这种情况会再次频繁发生,否则他们都不会这样做。当分享的前景反复出现时,科学家们会权衡当前拒绝分享的收益与未来因缺乏材料或数据访问而造成的预期损失。”

《自然》杂志 更简洁地 概括道:“共享数据是好事。但共享你自己的数据?那可能会变得很复杂。”

抢先发表

到目前为止,最大的恐惧似乎是抢先发表:别人利用你分享的一些信息,抢先你一步获得重大发现。1953年,遗传学家詹姆斯·沃森和生物物理学家弗朗西斯·克里克与化学家莱纳斯·鲍林以及X射线晶体学家罗莎琳·富兰克林和莫里斯·威尔金斯竞相发现DNA的结构。根据《自然》杂志对著名的沃森和克里克论文的 注释版本,莱纳斯·鲍林是第一个发现某些蛋白质螺旋结构的人,他在1953年初发表了他关于DNA三重螺旋模型的提议。尽管存在缺陷,沃森和克里克还是在这个模型中找到了必要的细节,从而抢在鲍林之前找到了解决方案

“鲍林提出的三链螺旋模型的碱基朝外。虽然模型是错误的,但沃森和克里克确信鲍林很快就会意识到他的错误。他们估计他离正确答案还有六周的时间。受到紧迫感以及击败科学巨星的前景的激励,沃森和克里克花了四个星期沉迷于DNA,进行了无休止的对话和模型构建,最终得出了正确的结构。”

1952年,[国王学院实验室的负责人] 拒绝了鲍林查看他们DNA的X射线照片的请求——这是启发沃森双螺旋设想的关键证据。鲍林不得不使用较旧的、质量较差的照片。”

我们都听说过沃森和克里克,但我们当中有多少人知道鲍林的工作?对被抢先发表的恐惧绝非小题大做,它是信息共享的一大障碍。对于商业界的科学家来说,与竞争对手分享可能意味着失去新产品率先上市的优势。

剽窃

许多科学家都经历过自己的想法被盗用,但这仍然是一种痛苦的经历。因此,向科学界自由展示他们花费数小时准备的研究——甚至可能在发表之前——的想法是令人望而生畏的。科学家可以相信他的同事不会窃取这些想法并以自私自利的方式来展示它们吗?

即使是沃森和克里克也犯了同样的错误。《自然》杂志详细描述了 对罗莎琳·富兰克林的轻视

“在这里,沃森和克里克说他们“不了解”国王学院科学家罗莎琳·富兰克林的工作细节——这种说法标志着许多人认为的未能给予富兰克林应有的荣誉是不可原谅的错误。”

加州州立大学海沃德分校的科学史学家琳恩·埃尔金认为,沃森和克里克确实不了解富兰克林工作的全部细节,但他们了解的细节足以发现DNA的结构。然而,这篇论文从未正式承认她,而是通过说他们“不了解”她的工作来掩盖她的重要作用。”

富兰克林一直在使用X射线晶体学研究DNA模型问题以确定结构。就在沃森和克里克具有里程碑意义的论文发表前几个月,富兰克林非常接近发现正确的模型,但她没有在她拍摄的照片中识别出来。由于对她所在学院对女性的态度感到沮丧,富兰克林正准备离开国王学院,这时,同事莫里斯·威尔金斯(克里克的密友)向沃森展示了一张关键照片。

在1968年出版的《双螺旋结构》一书中,沃森描述了他如何前往国王学院,试图说服富兰克林和威尔金斯在他和克里克之前与他们合作,以免鲍林发现他模型中的错误。富兰克林拒绝了,但在威尔金斯和沃森离开时,威尔金斯决定向沃森展示富兰克林的 照片51。“当我看到照片的那一刻,”沃森写道,“我惊得张大了嘴,脉搏开始加速。”照片中十字形的斑点图案清楚地表明了螺旋形状。

与此同时,沃森和克里克还从一位拥有富兰克林(未发表的)研究副本的同事那里获得了她的大部分研究成果,包括精确的DNA测量数据。富兰克林的工作为克里克提供了必要的信息,以确定DNA有两条方向相反的链。

尽管富兰克林做出了这些重大贡献,但她在致谢部分仅仅被列出了名字,而没有关于她工作的任何细节。(请查看注释版的《自然》 论文,了解整个争议,包括更多信息的链接。)

因此,很容易理解为什么某人的研究会在没有得到适当认可的情况下被“借用”。但无论如何,富兰克林-沃森的故事说明了一种避免系统性知识共享的文化实际上是如何鼓励这种剽窃行为的。当全世界都可以访问你的数据和研究时,不择手段或粗心的研究人员更有可能因未能承认现有共享信息对其自身工作的重要性而被抓住。沃森和克里克曾两次通过可疑手段获得富兰克林的工作,因此他们很难给予她适当的赞誉。

误用

虽然不如作品被剽窃或抢先发表那样对职业生涯造成损害,但对于研究人员来说,没有什么比看到自己的作品被误用或误解更令人沮丧的了。无论是数据被错误地用于推进政治立场,还是仅仅因为无知而被误解,这种经历都会使该研究人员和其他人将来不愿分享。

开放科学必须与强大的问责制系统相结合,这个系统可能比开源软件开发社区中用于建立声誉的“互联网即公共记录”模式更为正式。

非凡的益处

但是,如果实践开放科学的风险很大,那么收益将超过风险。哈佛大学教授卡里姆·R·拉卡尼曾说过,创新发生在 “学科交叉点”,而一个科学领域令人困惑的问题的解决方案通常可以由具有不同学科视角的科学家找到。

在很大程度上,我们在 InnoCentive 挑战赛中看到了这一点,组织在挑战赛中发布他们的难题,并奖励最佳解决方案的提交者——很少是来自同一学科的科学家——以丰厚的奖金。但 InnoCentive 不会发布获奖解决方案以供参考,拉卡尼认为这必然会降低最终实施的质量。

此外,佐治亚理工学院的研究人员发现,竞争,尤其是在奖项的商业和知识价值显着的情况下,实际上会扼杀开放科学的实践。专利和咨询机会也是如此。但是,当政府增加资金放松了某个领域的竞争时,科学家们更愿意相互分享他们的研究。

《自然》杂志作者布林·尼尔森 报道,资助机构、期刊和科学协会的推动肯定会有所帮助。在那些确实共享大量数据的学科中,如大气科学或基因组学,这些组织和该领域的科学家已经完成了大量的基础工作。除了专业界对共享的期望外,还必须创建和维护集中式数据存储库,然后制定数据输入标准,这对某些学科来说比其他学科更困难。

但是,没有人说过开放科学会很容易。(好吧,也许有人说过。但他可能不是科学家。)我很想阅读您在科学数据共享方面的经验。请登录并在下面的评论区讲述您的故事。

标签
User profile image.
Rebecca Fernandez 是红帽公司的首席项目经理,负责领导帮助公司扩展其开放文化的项目。她是开放组织大使,为《开放组织》一书做出了贡献,并维护着开放决策框架。她对开源原则和实践的交叉点以及它们如何更好地改变组织感兴趣。

9 条评论

开放科学(顺便说一句,应该简单地称为“真正的科学”)的两个主要障碍是

1) 当前的科学出版系统
2) 终身教职制度

关于(1),出版系统已经成为目标而不是手段。科学家现在为出版系统工作,并将论文视为他们研究的实际最终产品。

科学出版系统应该被拆除。就目前的形式而言,它是工业革命时代信息传播方式的残余。(参见 Yochai Benkler http://www.ted.com/talks/yochai_benkler_on_the_new_open_source_economics.html)。它必须被一个利用现代电子通信并强制执行可重复性验证的系统所取代。

当前的同行评审制度也必须废除,因为它目前没有做任何验证可重复性的工作,而且它主要基于专家提供主观意见,类似于自然科学在亚里士多德时代的样子,远在伽利略引入科学方法之前。(参见卡尔·波普尔:《科学发现的逻辑》:http://books.google.com/books?id=Yq6xeupNStMC&dq=karl%20popper&source=gbs_slider_thumb)

关于(2):终身教职制度将研究人员束缚在“发表”论文上,将其作为科学研究唯一可衡量的成果,并将该指标直接与其职业发展联系起来(参见 http://highereducationquestionmark.com/)。这导致了一种讽刺的情况,即研究人员对发表论文比解决问题更感兴趣,因此,盗用他们的数据优先于分享他们的数据。

为研究提供公共资金的机构必须要求研究人员在获取/开发数据、论文和源代码后立即公开,并根据允许其他人不受限制地使用这些材料的许可证进行公开。一些美国联邦机构已经有这些要求(例如NIH),但没有充分执行,以至于研究人员没有认真对待这些要求。

您能详细说明一下吗?我从未听说过对这方面的批评,事实上,恰恰相反。例如,我经常听到医生将同行评审期刊上的研究称为行业标准,并且他们往往会批评,例如,未在那里发表的脊椎按摩研究。

我认为您对终身教职的看法是正确的。我亲眼目睹了它如何塑造可接受的研究并限制了过时的主题。尽管希望一旦获得终身教职,为发现而研究的动力会大于为发表而研究的动力。

虽然有点晚了...
让我详细说明一下

<strong>最初的想法:</strong>
科学方法要求你的假设必须通过实验来检验;为了使这些实验被认真对待,它们必须可以被其他人重复。

* http://en.wikipedia.org/wiki/Falsifiability
* http://en.wikipedia.org/wiki/Reproducibility

这就是伽利略帮助我们摆脱亚里士多德引入的三千年误解的方式。

希腊思想家的罪过

他们主要“思考”……

并且因为他们生活在以奴隶制为基础的社会中,他们鄙视运行物理实验所需的体力劳动和机械工作。

亚里士多德的思想家构建了具有逻辑一致性的思维结构。例如,行星的轨道“必须”是圆形的,因为圆形具有大量优雅的几何(和哲学)特征。无需测量轨道,那将是“奴隶”的工作……对于如此高价值的哲学家来说是不体面的。直到开普勒测量了轨道,才意识到椭圆是对行星轨迹的更好描述。

亚里士多德哲学家傲慢地认为,他们的“专家判断”足以确定真理,而实验验证是“不必要的干扰”。

伽利略是一位更加务实的人,他证明了那些小实验实际上产生了很大的影响,并且它们表明亚里士多德在物理学的大部分方面都错了(力、加速度、重力、光学、天气……)。亚里士多德在自然科学和生物学方面也犯了很多错误,例如,他认为视觉是通过从我们的眼睛发出光线来工作的,他甚至弄错了女性的牙齿数量(显然,他从不费心去看和数)。

伽利略创立了现代科学方法,他明确指出,哲学上的先入之见只有在 <strong>有实验支持的情况下</strong> 才是有价值的。

<strong>快进到今天。</strong>
“科学方法要求你的假设必须通过实验来检验;为了使这些实验被认真对待,必须可以被 <strong>其他人</strong> 重复。”

由于科学的专业化,我们倾向于假设“其他人”必须是发布原始实验的人的同行。例如,如果这是一个量子物理学实验,那么其他量子物理学家可能是最合格的正确重复实验的人。这就是“同行”的由来。

所以,今天的期刊和会议会将您的论文发送给您的专家“同行”进行评审。

在伽利略的世界里,您的同行将 <strong>有礼貌</strong> 地遵循您论文的指示,以便 <strong>重复</strong> 您的实验,他们会报告结果,说明实验对他们是否有效。

然而,
在今天的“同行评审”中,您的同行会 <strong>跳过</strong> “重复实验”这个小细节,而是用他们的“专家判断”来代替,告诉他们

<em>“是的,这与我所知道的或我所看到的相符……特别是与我以前的工作相符”。</em>

在这种危险的转变中,您的同行已将我们送回 <strong>三千年</strong> 前的科学前时代。

今天的“同行评审”过程 <strong>没有</strong> 强制执行可重复性的验证。因此,它只提供了科学的 <strong>外观</strong>,而不是交付真材实料。

我们当前的专家评审员,往往是 <strong>实验室负责人</strong> 和/或科学领域非常知名的成员,他们鄙视验证论文主张所需的实验工作。他们认为体力劳动是“研究生工作”,因此对于像他们这样的“领域专家”来说是不体面的。就像希腊哲学家鄙视实验工作,认为那是只有奴隶才应该做的事情一样。

我们今天的同行评审员认为

<em>“我是专家,无需再次进行实验,我已经可以知道结果会是什么了”</em>

(我在这里实际上是在引用某人,此人姓名必须保密)

我们当前的同行评审过程将我们带回到开尔文勋爵 <cite>http://en.wikipedia.org/wiki/Lord_Kelvin</cite> 的傲慢,他是皇家学会的 <strong>主席</strong>,他在1902年宣布

<em>“气球和飞机永远不会在实际应用中取得成功。”</em>

http://zapatopi.net/kelvin/papers/interview_aeronautics_and_wireless.html

<strong>一年后</strong>,拥有自行车修理店的莱特兄弟(他们不是任何大学的高级科学家)在北卡罗来纳州沙质的河岸上驾驶飞机飞行。

http://www.firstflight.org/shrine/wright_brothers.php

我们现在应该已经了解到,“专家意见”在科学领域 <strong>一文不值</strong>。

<strong>只有实验才能被信任</strong>,而且只有当它被 <strong>其他人重复</strong> 时才能被信任。

我们不应该再提“同行评审”的出版物,而必须开始要求“可重复”的出版物。

字面意思是:实验已被其他人重复的出版物。

这就是为什么当前的同行评审制度必须被拆除。它的虚伪性必须被揭露,并且必须立即被一个基于 <strong>实验可重复性</strong> 的系统所取代。

这是可以做到的!

例如,六年来,我们一直主办一个开放获取、免费提供的医学图像分析期刊

http://www.insight-journal.org

这是一本为伽利略实践者准备的 <strong>“真正的科学”</strong> 期刊。这类人只有在重复实验后才相信某些东西。

当向该期刊投稿时,您需要提供

<ul>
<li>您的源代码(在开源许可下)</li>
<li>您的数据(在开放数据许可下)</li>
<li>以及重复实验所需的参数。</li>
</ul>

我们必须重新教育整整一代科学工作者,以恢复 <strong>真正的科学方法</strong> 的实践。

第一位评论者路易斯一语中的!两个关键问题正是他引用的那些;闭源出版文化,这与学院据称基于的知识共享的开放模式背道而驰;以及在美国和海外普遍存在的引用计数终身教职制度,该制度在很大程度上奖励数量而非质量,并奖励在“主流”(读作:过时)期刊上发表文章,而不是在较新的开放期刊上发表文章。

一些科学学科已经摆脱了出版社的束缚;物理学科中绝大多数的知识共享都是通过开放的 arXiv 系统进行的。ArXiv 虽然有缺点,但应该在所有主要学科中广泛复制,而付费获取知识的“主流”期刊应该被永久搁置。它们在数字时代不再增加价值。

KISS——保持简单,笨蛋。虽然这并非我想教给我儿子的最重要的生活经验,但这是人类一直忠实遵循的格言。*全部* 真相通常是复杂、曲折且相互矛盾的。大多数人只喜欢一点点真相。请注意,并非完全是谬论——只是不要用真理或现实的细微差别来使我们感到厌烦。

诺贝尔奖就是一个典型的例子。如果我是第一个告诉您这件事的人,我很抱歉,但 A 团队永远不会获得诺贝尔和平奖。好吧,如果 Face 英年早逝,他们可能会获得,因为每个奖项最多只能有三个人获奖。这意味着一个治愈艾滋病的四人团队将被取消获奖资格。虽然我不知道这样做的依据是什么,但我认为这表达了我们社会渴望保持简单的愿望,即要求在历史教科书中印刷更少的名字。

将一卷缩微胶卷留在月球上的想法被废弃了,胶卷上记录了所有直接参与阿波罗计划的工程师、科学家、绘图员、机械师等人的名字。取而代之的是,我们留下了一块牌匾,上面刻着三位宇航员的名字和在与激发美国登月的总统竞争中失败的在任总统的名字。

我们如何将诺贝尔奖委员会的政策与当前的信息时代调和起来?我们如何向一个以片言只语为食的民众呈现 *全部* 真相?真理就是现实,现实就是真理。透明和开放的政策是每个人都能真正受益的政策,而不是肤浅的边沁式的方式。

人类可能有着悠久的崇尚简单的传统需要摒弃,但这样做的好处是实实在在且巨大的。否则,22世纪的教科书可能会将“信息时代”称为用词不当。

---我们都听说过沃森和克里克,但我们当中有多少人知道鲍林的工作?---

您真的不熟悉伟大的莱纳斯·鲍林的工作吗?毕竟,他是极少数获得多个诺贝尔奖的人之一,也是仅有的两位在多个领域获得诺贝尔奖的人之一(另一位是玛丽·居里,您听说过她,对吧?)。鲍林是化学领域的巨匠,也是20世纪最有影响力的科学家之一。

您关于双螺旋结构发表的故事也与历史记录不符。碰巧的是,最近出现了一批新的信件,进一步阐明了两个研究小组之间的合作,以及如何决定论文的撰写方式(并在同一期《自然》杂志上同时发表)
http://www.nature.com/nature/journal/v467/n7315/full/467519a.html

……不,在阅读沃森和克里克之前,我没有听说过莱纳斯·鲍林。我问过其他几位外行人,他们都没有听说过鲍林或富兰克林,所以我假设,也许是错误地假设,他们的名字对于该领域以外的大多数人来说是陌生的。当然,他们没有出现在我在高中或大学时使用的任何教科书中,这些教科书都是非专业的科学课程,而且很可能被简化了。(当然,居里夫人和沃森和克里克确实出现在教科书中。)

我感谢您提供的《自然》杂志文章的链接;不幸的是,我只能访问前一两段。我确实看到一篇最近的文章提到他们同意同时发表几篇论文,但这似乎并没有超过在里程碑式的发现论文中给予富兰克林的极少赞誉。

如果我在历史方面犯了错误,我深感抱歉,我希望您能指出您认为问题出在哪里。我的时间线来自文章中引用的来源以及另一本专门关于罗莎琳·富兰克林的书。我试图从另外两本书中汲取内容,因为它们似乎更平衡。

祝好,
Rebecca

我有点惊讶——鲍林是少数几位超越科学并在大众文化中广为人知的科学家之一。如果您是生物学家或化学家,他的贡献是显而易见且巨大的。但对于非科学家来说,他因其核裁军工作而非常出名,以至于他在1962年获得了诺贝尔和平奖。有一段时间,美国国务院拒绝让他离开该国。他还因晚年关于大剂量维生素具有促进健康和治愈癌症的能力的有些古怪的想法而广为人知。他还在2008年出现在邮票上。<a href="http://en.wikipedia.org/wiki/Linus_pauling">维基百科关于鲍林的条目</a> 很好地记录了他大量的作品。

很抱歉提供了《自然》杂志的链接,我没有意识到他们的新闻文章是收费的。这是 <a href="http://www.guardian.co.uk/science/2010/sep/29/letters-dna-double-helix-francis-crick">《卫报》的报道</a>,报道质量不是很高(作者似乎没有意识到诺贝尔奖不能追授),但至少您可以了解已发现的大量信件的内容。这是一个引人入胜的故事(正如《双螺旋结构》中所述),讲述了一个科学家被要求不要研究某个特定问题的时代,因为另一位科学家已经声称该领域用于研究。无论您如何评价当今世界的竞争性,它确实比只允许一个研究小组处理一个主题的环境更有效率。这实际上就是为什么沃森和克里克当时被视为“流氓”的原因,他们正在研究别人已经声称的问题。

关于论文的发表,来自《自然》杂志的文章

<blockquote>“沃森和克里克在4月25日《自然》杂志上发表的一组三篇论文中的一篇中宣布了他们的双螺旋模型。另外两篇——来自威尔金斯和富兰克林——展示了国王学院研究小组提供的支持性X射线衍射数据……威尔金斯在3月13日访问剑桥观看新模型时,已经拒绝了沃森和克里克共同署名的提议。”</blockquote>

因此,富兰克林的工作并非未被承认,而是她工作的研究小组(由莫里斯·威尔金斯领导)被提议在该论文上共同署名,但他们拒绝了。他们选择撰写自己的配套论文,与沃森和克里克的论文一起发表。已发表的一组论文的措辞和内容经过了所有相关人员的多次辩论和同意。据报道,富兰克林从未怀恨在心,并且直到去世前都与沃森和克里克保持友好关系。

虽然富兰克林确实因为当时的性别歧视和科学文化而受到不公平待遇,但我确实认为她在DNA结构的故事中获得了适当的赞誉。我从这种情况中吸取的教训是,收集数据并不重要。理解数据才是重要的。这就是技术人员和科学家的区别。富兰克林无法做出沃森和克里克所做的智力飞跃。他们值得为此获得赞誉。她值得因收集到导致他们洞察力的数据而被提及,但真正重要的是洞察力。

这就是人们在谈论开放科学和被抢先发表时经常误解的地方。大多数开放科学的支持者指出,如果你的数据是公开可用的并且带有时间戳,你将因收集数据而获得赞誉。这是真的,但收集数据并不重要。当你在有机会理解数据之前发布数据时,你就有可能让别人先理解数据,他们将收获你辛勤工作带来的大部分荣誉和奖励。

我同意在理想的世界中,开放科学是前进的方向。但我不确定在资金和工作岗位有限,科学由人类完成的世界中,开放科学如何运作。如果因成就获得赞誉是一个人获得工作、终身教职或进一步资助的方式,那么在将自己的工作成果赠送给他人之前,充分利用自己的工作成果符合自己的最佳利益。科学家也是人——他们有自尊心,更重要的是,他们需要养家糊口和支付员工工资。对过早发布他们的劳动成果保持谨慎,可以更容易地做到这些事情。这可能会减缓发现的步伐,但它也使科学成为一项可行的职业。

<p>感谢您填补了一些空白。我发现在阅读沃森和克里克等人的故事时,有时很难将当时的态度(性别歧视和其他文化差异)与伦理区分开来。似乎最终富兰克林对她被承认的方式感到满意,这绝对意义重大。</p><p>我当然可以理解不想立即发布数据。在其他领域,如社会科学,这很容易导致怪人和政客滥用您的工作,并在媒体上获得错误的标题。(为什么更正从来没有像最初的报道那样引人注目?)</p><p>我通常赞成开放,但我也在其他领域看到,这可能需要新的创收方式,有时可能永远无法盈利。</p><p>但从另一方面来看,作为一名患有罕见且危及生命的食物过敏症(FPIES)的 4 岁孩子的母亲,我已经能够看到信息共享带来的实实在在的好处。值得称赞的是,研究人员愿意详细讨论他们的发现。当我儿子的过敏症专家在查看了我发送的一篇论文后打电话给他们询问问题时,我惊讶于一对研究人员的帮助程度。</p><p>最终,由于这些研究人员及其愿意分享超出已发表内容的发现,我的儿子将能够提前进行几项实验性血液和皮肤测试,以便让我们了解他在真正进行医院食物激发试验之前通过试验的机会。(由于他的反应类型的严重性和不可逆性,失败的激发试验绝非小事。)</p><p>有时,即使只是提高可访问性和非正式合作也是迈向开放的一大步。</p><p>无论如何,感谢您的周到回复。看来我欠鲍林先生一些阅读时间了。</p>

Creative Commons License本作品采用 Creative Commons Attribution-Share Alike 3.0 Unported License 许可。
© . All rights reserved.