李天晓-耶鲁大学

今年暑期,我于美国耶鲁大学分子生物物理与生物化学系Mark Gerstein教授的实验室进行了为期2个月的学习工作。

Gerstein Lab在生物信息学和计算生物学领域有着举足轻重的影响力,参与了诸多大型基因组项目。虽然我在这两个月里承担了一个相对独立的小课题,但通过旁听组会和向实验室的博士生、博后提问请教,对于多个实验室合作的大规模、大数据科研项目的形式有了一定的了解。

实验室氛围活泼,组会时常常伴随着插科打诨;但在学术上要求仍旧非常严苛,即使作为刚进入实验室的本科实习生,我在第二周就被要求在组会上讲解论文。同时,在我刚到美国的几天,Gerstein教授就非常慷慨地给了我一次前往参加正在纽约举办的世界顶级机器学习学术会议ICML的机会,这令我十分惊讶和感动。


本次实习最大的收获在于深入理解了概率模型在生物信息学中的重要性。对于一个生物学过程,首先需要了解产生数据的原理,并对其进行适当的简化和抽象,才能对高通量数据做出有价值的处理和分析,从数据中提取出对理解生物学过程以及进一步的实验研究有用的信息,这是计算生物学和生物信息学的精髓所在。

同时,对于统计学在科研中的地位有了进一步的认识。生物学过程相对于物理、化学要复杂得多,其内在机理还远未探明,在许多时候,我们通过计算得到的是一些在先验假设下具有最大可能性的模式和假说,对未来的深入研究提供思路,而要想得出精确而确凿的结论是极其困难的。因此,对于生物信息学课题尤其是高通量、大数据方面的目的和预期结果需要有准确而深入的认识。

最后,感谢Gerstein Lab全体成员对我的指导和帮助,通过与全球顶尖大学最优秀的年轻学者的交流,我了解了他们的学习生活,并逐渐确立了未来的方向;感谢学堂班和生命科学学院给予我这次宝贵的实习经验,我会利用好这次实习中学到的知识技能,努力完成大四学年的学习和科研工作。