但科学家在国防高级研究计划局(DARPA)想要改变他们说,在一个叫做大的程序机制可以收集关于特定主题的所有现有数据,保持更新和开发新的结论或研究方向。
+更多网络世界:足球竞猜app软件国税局警告说在“十二大”2014年税务诈骗+
“大数据对复杂经济、生物、神经和气候系统不一样理解原因和effects-what的密集的网,我们称之为大机制这些系统,”说保罗•科恩,DARPA项目经理。“不幸的是,我们知道大机制包含在巨大的,断断续续的,有时相互矛盾的文献和数据库,所以没有一个人可以理解一个非常复杂的系统。电脑必须帮助我们。”
大机制程序可能会带来新的方法来理解复杂的系统,DARPA说。“今天的研究人员阅读深入但难以跟上无情流相关的出版物。保持当前,研究人员必须专业,成为专家的一小部分大得多的东西。大的视觉机制程序是完全不同的:每一个出版物会立即成为一个公共的一部分,computer-maintained,因果模型的一个复杂的大系统机制和一个大的方方面面机制将与数据支持或反驳。在某种程度上,我们可以自动化的建设机制,我们可以改变科学是怎么做的,”美国国防部高级研究计划局说。
简而言之大机制项目将开发技术阅读研究摘要和论文提取因果机制的片段,这些片段组装成更完整的因果模型,在这些模型产生的解释原因。
DARPA表示,将目标第一大癌症研究机构项目,特别是癌症途径或分子间的相互作用,引起细胞变成癌细胞。
从美国国防部高级研究计划局:程序有三个主要的技术领域:电脑应该阅读摘要和论文在癌症生物学中提取的碎片癌症通路。接下来,他们应该将这些碎片组装成完整的通路前所未有的规模和精度,而且应该找出通路是如何交互的。最后,电脑应该确定可能操纵的原因和影响,甚至预防或者控制癌症。
“分子生物学和癌症的语言文学强调机制,”科恩说。“论文描述蛋白质如何影响其他蛋白质的表达,以及这些影响产生生物的后果。电脑应该能够识别癌症生物学原因和影响的论文比,更容易说,社会学和经济学的文献。”
实际上建筑大机制系统听起来像你想象的复杂。据DARPA:“大机制程序将需要新的研究和集成的几个研究领域,特别是统计和基于知识的自然语言处理(NLP);内容管理和本体;系统生物学和数学生物学;表示和推理;而且很可能其他可视化等领域,仿真,统计非常大的因果网络的基础。
“机器阅读研究人员将需要开发更深层的语义表示的因果,经常研究论文中描述的动力学模型。演绎推理,可能不足以定性模拟模型的复杂动态信号通路,需要扩充或取而代之的是概率和量化模型。”
看看到底DARPA将寻找的去这里。
Follow迈克尔·库尼在Twitter上:nwwlayer8和脸谱网
看看这些其他热的故事:
新行星猎人34望远镜瞄准太空深处
IBM:原型设备支持400 Gb / s的数据传输速度
研究人员炫耀高速激光通信设备空间
联邦调查局:10000美元奖励信息的人分在一架飞机的激光器
DARPA希望搜索引擎的圣杯
联邦调查局:偷铜帮派削减监狱
美国宇航局考虑两个公共构建小型太空探索卫星竞赛
美国特勤处:更强的法律可以帮助对抗复杂的网络犯罪