蛋白质组丰度数据整合数据库内容简介

发布网友发布时间：2024-10-06 12:21

共1个回答

热心网友时间：2024-10-09 00:58

中国科学院上海生命科学研究院在2006年启动了一项重大院级项目，致力于《模式生物与细胞等功能系统的系统生物学研究》。为该项目产生的转录组和蛋白质组数据提供全方位支持，包括管理、集成、分析和共享。2009年5月，一款专门服务于这一研究的整合数据库服务平台正式上线，整合了NCBI的GEO数据库（4.7GB）和EBI的Pride数据库（同样规模），以及项目内部的1GB数据。平台设计时注重与公共数据库的实时更新，每季度更新一次，用户数据将保持最新。

服务平台不仅具备数据存储功能，还提供了丰富的数据分析工具。针对生物大分子丰度数据，它支持组间比较、聚类和主成分分析等基本分析。对蛋白质组数据，平台包含蛋白质注释功能，帮助用户深入理解数据。为了实现转录组和蛋白质组数据的整合分析，平台采用了基因为中心的整合策略，将两个生物学层次的数据映射到基因层面，确保数据实体的一致性。

部分算法是平台自主开发的，以R包的形式提供给用户，如蛋白质注释相关的函数，用户可以直接下载使用。平台数据对所有用户开放，匿名用户可以浏览和下载从公共数据库整合的数据，但特定项目相关的数据需要用户在系统注册后才能获取。这样既保护了用户隐私，又保证了数据的共享和利用。