但美国国防高级研究计划局(DARPA)的科学家们希望通过一个名为“大机制”(Big Mechanisms)的项目来改变这一现状。他们表示,这个项目可以收集有关某个特定主题的所有现有数据,使其保持最新状态,并得出新的结论或研究方向。
+更多关于网络世界足球竞猜app软件:美国国税局对2014年“十二种肮脏”税收诈骗发出警告+
“拥有关于复杂经济、生物、神经和气候系统的大数据,与理解这些系统中因果关系的密集网络——我们称之为大机制——是不一样的,”他说保罗•科恩DARPA项目经理。“不幸的是,我们对大型机制的了解包含在巨大的、支离破碎的、有时甚至是相互矛盾的文献和数据库中,所以没有一个人能够完全理解一个真正复杂的系统。计算机必须帮助我们。”
DARPA表示,“大机制”项目可能会带来理解复杂系统的新方法。今天的研究人员深入阅读,但很难跟上相关出版物源源不断的步伐。为了保持与时俱进,研究人员必须专攻某一领域,在某个更大领域的一小部分成为专家。大机制计划的愿景是完全不同的:每一份出版物都将立即成为一个复杂系统的公共、计算机维护的因果模型的一部分——一个大机制——而大机制的每一个方面都将与支持它或反对它的数据联系在一起。在某种程度上,我们可以自动化大机械的建造,我们可以改变科学的方式,”DARPA说。
简而言之,大机制计划将开发一种技术,用于阅读研究摘要和论文,提取因果机制的片段,将这些片段组装成更完整的因果模型,并对这些模型进行推理,以产生解释。
DARPA表示,“大机制”项目将首先针对癌症研究,特别是导致细胞癌变并保持癌变的癌症途径或分子相互作用。
DARPA:该项目有三个主要的技术领域:计算机应该阅读癌症生物学的摘要和论文,以提取癌症途径的片段。接下来,他们应该以前所未有的规模和准确性将这些片段组装成完整的路径,并弄清楚路径是如何相互作用的。最后,计算机应该确定可能被操纵的原因和结果,甚至可能是为了预防或控制癌症。
“分子生物学的语言和癌症文献强调机制,”科恩说。论文描述了蛋白质如何影响其他蛋白质的表达,以及这些影响如何产生生物学后果。计算机应该能够比社会学或经济学文献更容易地识别癌症生物学论文中的因果关系。”
实际上,构建大机制系统听起来就像你想象的那样复杂。DARPA表示:“大机制计划将需要新的研究和几个研究领域的整合,特别是统计和基于知识的自然语言处理(NLP);内容管理和本体;系统生物学和数学生物学;表示和推理;也很可能是其他领域,如可视化、模拟和大型因果网络的统计基础。
机器阅读研究人员将需要开发更深入的语义,以表示研究论文中描述的因果模型,通常是动态模型。演绎推理和定性模拟可能不足以模拟信号通路的复杂动态,需要用概率和定量模型加以扩充或取代。”
看看DARPA到底在寻找什么去这里.
看看其他热门故事:
联邦调查局/联邦贸易委员会警告:情人节前后网络上的爱情诈骗猖獗