在过去的几个月里,我越来越意识到“开放”运动。“开放”指的是开放获取、开源、开放数据、开放科学。
我在2011年中期,我有一个项目,需要注释一些环状肽的串联质谱。所以我坐下来,“在纸上”分解化合物结构,看看我可能会在光谱中找到哪些理论碎片,并将它们与我的实验光谱进行比较。这是我做过的最愚蠢和最无聊的任务之一。我花了两个整天多的时间来注释我的两个光谱。我想到,这么愚蠢的工作应该由计算机来完成。
当然,我搜索过适用于环状肽串联质谱注释的软件工具。但我只找到了两个已经可以做到这一点的工具,而且它们都不真正适合我的目的。在我评估的所有软件工具中,mMass 最接近我心目中用于我目的的工具,但它不能处理环状肽,并且有一些其他限制,使其不适合使用。所以——只是为了为下次我必须做这项任务做好准备——我联系了该软件的开发者 Martin Strohalm,询问他是否已经计划实现我需要的功能。他没有计划这样做,但确实喜欢实现这些功能的想法。然而,当我们讨论最初的步骤时,他不愿意接受完全实现我所需的一切功能所需的更改。
mMass 是开源的,所以我决定——只是为了好玩——研究它的代码,并尝试调整 mMass 以实现我想要的功能。mMass 主要用 Python 编写,所以首先我不得不再次坐下来学习这门语言。对我来说幸运的是,当时我懂 Python 的姐夫住在我们家,可以在我需要时给我一个良好的开端和支持。
在学习了许多周的 Python、研究了环状肽片段化途径的文献、添加和修改代码之后,最终该软件实现了我想要的功能。
我再次联系了 Martin Strohalm,并向他展示了我的工作成果。他很喜欢这些添加的功能,并同意将这些功能包含到官方 mMass 源代码中。当然,他——作为一个新手程序员——需要修改我的大部分代码,并纠正我遗漏的错误。经过许多许多封电子邮件的往来,我们都对新的 mMass 版本感到满意,然后该版本向公众发布。
新的 mMass 版本优于所有其他可用于环状肽串联质谱注释的工具,所以我认为将整个事情发表在学术期刊上也是值得的。因此,我写了一份手稿,并在 Martin 和我进行了一些润色后,将其提交给了 Analytical Chemistry。我为什么选择 Analytical Chemistry?因为另外两个能够处理环状肽的工具之一在那里发表过,所以我认为那里是发表我们更优秀的工具的合适场所。
顺便提一句:另一个已发表的软件不是开源的,并且 PI 一直不愿意分享代码。好吧,我们的手稿被拒绝了——一位审稿人没有理解该软件的用途,另一位审稿人不同意某些已实现的功能(有趣的是,因为已实现的片段化途径都取自同行评审和已发表的文献……)。我们修改了手稿以使其更清晰,并再次将其提交给 Analytical Chemistry。它再次被拒绝,说实话,我真的不理解审稿人的问题。
无论如何,我开始怀疑 Analytical Chemistry 是否是发表手稿的正确场所。毕竟,该软件和手稿都是开源的结果,因此也许论文应该以开放获取的方式发表。因此,我选择了 PLoS ONE 进行下一次提交。我不得不说,同行评审的严格程度与 Analytical Chemistry 的一样——但这一次我们很幸运地遇到了理解该软件的用途及其潜在价值的审稿人。经过一次小修改,论文得以发表。我想借此机会再次感谢 PLoS ONE 的工作人员提供的巨额费用减免。如果没有这项减免,我们将无法以开放获取的方式发表手稿。
我还参加了最近在纽约举行的 ICNPR 2012 会议,并展示了关于 mMass 的海报,并收到了积极的反馈。
由于 mMass 是开源的,我可以将其作为我工作的基础,并与该软件的原始作者一起,我们能够为处理环状肽的科学家完成一项伟大的工作。而且他们无需承担任何费用。这就是“开放”!
这是我在“开放”领域的第一次经历,您会发现这是我将来会更多地撰写博客的内容……
最初发布于 Natural Product Forum。经许可转载。
4 条评论