蛋白质组丰度数据整合数据库内容简介
发布网友
发布时间:2024-10-06 12:21
我来回答
共1个回答
热心网友
时间:2024-10-09 00:58
中国科学院上海生命科学研究院在2006年启动了一项重大院级项目,致力于《模式生物与细胞等功能系统的系统生物学研究》。为该项目产生的转录组和蛋白质组数据提供全方位支持,包括管理、集成、分析和共享。2009年5月,一款专门服务于这一研究的整合数据库服务平台正式上线,整合了NCBI的GEO数据库(4.7GB)和EBI的Pride数据库(同样规模),以及项目内部的1GB数据。平台设计时注重与公共数据库的实时更新,每季度更新一次,用户数据将保持最新。
服务平台不仅具备数据存储功能,还提供了丰富的数据分析工具。针对生物大分子丰度数据,它支持组间比较、聚类和主成分分析等基本分析。对蛋白质组数据,平台包含蛋白质注释功能,帮助用户深入理解数据。为了实现转录组和蛋白质组数据的整合分析,平台采用了基因为中心的整合策略,将两个生物学层次的数据映射到基因层面,确保数据实体的一致性。
部分算法是平台自主开发的,以R包的形式提供给用户,如蛋白质注释相关的函数,用户可以直接下载使用。平台数据对所有用户开放,匿名用户可以浏览和下载从公共数据库整合的数据,但特定项目相关的数据需要用户在系统注册后才能获取。这样既保护了用户隐私,又保证了数据的共享和利用。