深度学习有助于理清基因之间的相互作用
新时代,高科技越来越发达。朋友们读了很多关于科技的重要新闻。我们也应该在生活中使用很多这些高科技的东西。朋友应该注意什么?今天,我想和大家分享一条关于科技的知识。我希望你会喜欢它。
近年来,卡内基梅隆大学的计算机科学家采用了深度学习的方法,彻底改变了人脸识别等基于图像的应用,重新定位了其探索基因之间关系的实力。
他们说,诀窍是将大量基因表达数据转换成更像图像的东西。擅长分析视觉图像的卷积神经网络(CNNs)可以推断哪些基因相互作用。在这方面,氯化萘优于现有方法。
研究人员关于中枢神经系统如何帮助识别疾病相关基因以及可能成为药物靶点的发育和遗传途径的报告今天发表在《美国国家科学院院刊》上。但是计算生物学和机器学习教授齐夫巴-约瑟夫说,这种叫做CNNC的新方法的应用可能远远超出基因相互作用。
本文作者之一的Bar-Joseph和CMU机器学习系博士后研究员袁烨共同撰写了这篇论文。巴-约瑟夫说,论文中描述的新见解表明,CNNC还可以用来调查各种现象的因果关系,包括金融数据和社交网络。
“十年前开发的有线电视新闻网是革命性的,”巴-约瑟夫说。“我仍然对使用谷歌照片进行面部识别感到敬畏,”他在智能手机上浏览照片时补充道。他展示了这个应用程序如何识别不同年龄的儿子,或者根据他右脑后面的图像识别他的父亲。“我们有时认为这项技术是理所当然的,因为我们一直在使用它。但它非常强大,不仅限于图像。这完全取决于你如何表示你的数据。”
在这种情况下,他和袁研究了基因之间的关系。人类大约有20000个基因协同工作,因此有必要了解基因如何在复杂或网络中协同工作,以了解人类的发展或疾病。
推断这些关系的一种方法是观察基因表达——,它代表细胞中基因活性的水平。袁说,一般来说,如果基因A和基因B同时活跃,说明它们是相互作用的。不过,也可能是巧合,或者两者都是被第三基因c激活的。
为了使用CNNs来帮助分析基因关系,袁和Bar-Joseph使用单细胞表达数据实验来确定每个基因在单细胞中的水平。这种单细胞分析的数千个结果以矩阵或直方图的形式排列,因此矩阵的每个细胞代表一对基因的不同水平的共表达。
以这种方式显示数据增加了空间方面,使数据更像图像,并且更容易被中枢神经系统访问。袁说,通过使用已经被确定为相互作用的基因的数据,研究人员可以训练中枢神经系统来识别哪些基因相互作用,哪些不是基于数据矩阵中的视觉模式。
“很难区分因果关系和相关性,”袁说,但方法在统计上比现有方法更准确。他和巴-约瑟夫预测,CNNC将是研究人员最终用来分析大型数据集的几种技术之一。
“这是一种非常常见的方法,可以应用于许多分析,”巴-约瑟夫说。主要限制是数据——越多,CNNs工作越好。细胞生物学非常适合CNNC,因为一个典型的实验可能涉及数以千计的细胞并产生大量的数据。
本文就为大家讲解到这里了。