• 免费服务热线
  • 400-065-6886
  • 电话:86(0)512-6295 9990
  • 传真:86(0)512-6295 9995
新闻中心

ATACdb——人类染色质可及性综合数据库

发稿时间:2021-03-17来源:天昊生物

年初哈尔滨医科大学医学信息学系李春权课题组在《核酸研究》杂志上发布了人类染色质可及性(chromatin accessibility)综合数据库ATACdbhttp://www.licpathway.net/ATACdb),该数据库提供了最全面的可及性(可访问性)染色质数据、质控、转录因子印记及其它注释信息



可接近的染色质是识别调控元件的高度信息结构特征,它提供了大量关于转录活性和基因调控机制的信息。人的ATAC-seq数据集快速积累,因此急需全面收集并有效处理这些数据。ATACdb数据库的目的是为了提供大量关于人类染色质可及性数据的公共资源,并且以组织或细胞类型特异性的方式注释和阐明其潜在功能。

ATACdb当前版本记录了1400ATAC-seq样本数据中52078883个区域信息,这些样本是从NCBI GEO/SRA数据库的2200个染色质可及性样本中挑选的。ATACdb数据库提供了质量保证过程,包含4项质控标准。而且,ATACdb提供了详细的染色质可及性区域的(表观)遗传注释,包括超级增强子、典型增强子、转录因子、常见的SNPs、风险SNPseQTLs、连锁不平衡SNPs、甲基化、染色质相互作用和拓扑结构域。特别地是,ATACdb提供了染色质可及性区域准确地转录因子印记的推断。


一、检索染色质可访问性数据的搜索界面

下边主要介绍ATACdb数据库的使用:ATACdb具有界面友好的搜索选项来检索染色质可及性数据(文末图AB)。用户可以通过四个路径确定染色质可及性数据查询的范围,包括基因组区域的搜索(输入基因组位置)搜索组织类型(输入感兴趣的组织的名称)搜索转录因子(输入感兴趣的转录因子的名字)搜索基因(输入基因名称和识别策略)。在基于基因组区域的查询中,用户可以输入基因组位置,ATACdb将识别与提交区域重叠的可及性染色质区域。基于TF查询,用户可以通过提交感兴趣的TF来获取所有可及的TF结合的染色质区域。用户也可以提交一个基因名,与之相关的可及的染色质区域可以通过可及性染色质区域和相关基因之间的关系返回,可以通过三种策略识别,包括最接近,重叠和近端区域。在基于组织的查询中,用户可以选择组织类型和生物样品类型来定制过滤。ATACdb可以在结果页面上显示与特定组织类型相关的可及的染色质区域。



查询结果页面以表格形式显示检索结果的概要信息。该表描述了区域ID、基因组位置、长度、倍数变化、-log10P/log10q值和可访问染色质区域的详细(表观)遗传信息(文末图D)。结果页面提供了ATAC-seq数据的QC报告,包括四个检测分数和一个直方图(文末图E)。用户可以查看染色体中染色质区域的分布情况。对于每个样本,ATACdb能够提供TF印记分析结果,包括带有标签数的TFTF保护评分、结合站点数量和印记logoATACdb还支持阈值选项,允许用户设置不同的阈值,以确保每个样本的TFs是高活性和特定细胞类型的(文末图F)。此外,用户可以点击区域ID查看可访问染色质区域的详细信息。ATACdb列出了更详细的注释信息,包括TFs、超级增强子、典型增强子、常见SNPs、危险SNPseQTLsLD SNPsDNA甲基化位点、3D染色质相互作用和TADs(文末图G)。与可访问的染色质区域相关的基因是通过使用最近、重叠和近端识别策略提供的(文末图H)。可以显示与基因相关的详细信息,如来源于GTExNCBIENCODECCLE项目中不同样本的基因-疾病关系信息和基因表达数据。ATACdb还提供了染色体peak覆盖的可视化以及与TSS区域结合的peak的概况(文末图L)


二、浏览可访问的染色质区域友好界面

用户可以快速浏览样本,并通过生物样本类型、生物样本名称、组织类型和癌症类型设置过滤(文末图C)。可以使用‘Show entries’下拉菜单更改每页记录的数量。页面显示每个样本可访问的染色质区域的数量统计。重要的是,用户可以进一步点击样本ID来查看给定样本的可访问染色质区域。


三、在线分析工具

ATACdb提供了两个实用的分析工具。一种是差异重叠区域分析工具,另一种是由两个TFs结合的重叠的可及的染色质区域分析工具。差异重叠区域分析工具可以计算两个样本的可访问染色质区域之间的相似性和差异性。当用户提交两个感兴趣的样本时,工具将比较两个样本之间的区域,并提取两个样本之间至少有一个碱基的所有重叠区域。对于这些重叠区域,工具进一步显示重叠区域的长度和重叠比例(重叠长度与总长度之比)。此外,我们可以将它们分为四种重叠类型。对于不重叠的区域,我们将其视为差异区域,分别提取两个样本的这些区域。最后,ATACdb将会展示两个样本之间的这些差异和重叠区域,以及它们的详细信息,包括基因组区域、区域长度、区域数目、重叠比例和重叠类型(文末图I)。高重叠率表明两个可及的染色质区域之间有更多的相似性。对于两个TF结合的重叠的可访问染色质区域分析工具,用户可以提交两个TF名称和TF结合位点的窗口长度。该工具可以根据TF结合位点计算重叠区域。ATACdb将显示这些具有重叠长度和重叠比例的重叠区域(文末图J)。这种分析可以进一步帮助用户分析可访问染色质区域中两个感兴趣的TFs之间的重叠区域。

四、个性化基因组浏览器和数据可视化

ATACdb提供了一个强大的基因组浏览器,帮助用户直观地查看基因组中可访问的染色质区域的邻近信息。我们使用JBrowse开发了一个个性化的基因组浏览器,并添加了许多有用的路径,如可访问的染色质区域、增强子、超级增强子、基因、SNPsTADs(文末图M)ATACdb可以显示染色质可及性相关的染色体分布饼图。此外,ATACdb还提供了TF印记标识的可视化(文末图F)、与染色质可及区结合的转录因子表达直方图以及染色质可及区与基因之间的关系(文末图H)


五、数据下载和统计

下载页面提供了所有样本的染色质可访问区域和元素。用户可以快速搜索和下载相关信息(文末图K)。我们为每个样本提供了‘.bed’和‘.csv’格式的染色质可访问区域文件下载。为了分析TF印记,我们提供了‘.txt’和‘.pdf’格式的TF印记文件下载。通过单击‘pdf’,用户可以下载压缩文件中相应的印记logoATACdb支持打包下载所有可访问的染色质区域和TF印记分析结果。在统计页面中,ATACdb为用户提供了关于可访问的染色质区域和注释信息的数字和图形显示(文末图N)。此外,在ATACdb中提供了超级增强子与染色质相互作用的样本信息。


咨询沟通请联系

18964693703(微信同号)


创新基因科技,成就科学梦想




Copyright © 2012-2023 天昊基因科技(苏州)有限公司    All Rights Reserved    苏ICP备17064027号-1