最新一期Nature Chemical Biology发表了系列Commentary文章,其中“The challenges of integrating
multi-omic data sets” 一文明确指出:多组学数据的集成、挖掘所需投入的资源可能高于数据的采集,这对从事计算生物学建模的学者无疑是极大地鼓励:
“The capability to generate multi-omic data sets raises the issue of resource allocation for data
generation versus data curation and integration. The initial experience of researchers shows that the
effort required for the latter can be much greater than that for the former.”
当组学数据的类型增加,例如mRNAs数据与microRNAs的集成分析时,上述趋势更加明显。
上述“资源”的理解,似可包括人力、物力、经费。
作者还指出:
(1) 之所以上述情况现在还没有发生,部分因为人们发现难于找到合适的人从事多种组学数据的处理和集成,因为 这项工作需要对数据产生的过程有深入的技术知识;
(2) 同时,实验设计时的预谋预筹很重要,组学数据往往由于技术背景的人掌管,而试图”测试一切(参数)”。此时,深厚的生命科学背景显得尤为重要。总之,生物医学、信息科学的多学科背景是解决多组学数据集成的重要素质,因为任何一个数据集成方案的背后,都实际上代表了你对这个问题的理解,即modeling。
原文链接:
https://www.nature.com/nchembio/journal/v6/n11/full/nchembio.462.html