在临床医学和基础科学研究中会获得并积累大量的数据,得益于测序技术普及以及数字技术的应用,个体的基因序列数据和健康数据通过数据库的勾连实现了联通,因此将其联合分析来研究生命科学和疾病发生等问题,可以说是一种“强强联合”的研究手段。
1月11日NatureMedicine报道了宾夕法尼亚大学一项通过联合表型数据和基因数据的分析方法开展人类疾病与健康生物学研究的论文,除了揭示了一系列从未被发现的罕见变异与疾病存在相关性,还为探索罕见变异与疾病表型的关系提供了有效的数据统计工具。
研究人员从宾夕法尼亚生物样本库(PennMedicineBiobank)中挖掘到个有关联电子健康数据(electronichealthrecords,EHRs)的全外显子基因序列,通过一系列表型评估,在基因外显子范围内,研究人类疾病中每个个体基因罕见的预测功能丢失变异(rarepredictedloss-of-functionvariants)对表型/疾病的累积效应。
当一个基因的可预测功能丢失变异至少有25个杂合携带者时,变异可能是移码插入或缺失、终止密码子增加和缺失、剪接位点中断等情况,研究人员试图找到相关的表型,结果显示,共有97个基因在全外显子考察范围内存在显著表型关联。
本研究报道了26个与一系列表型相关的基因,包括此前从未报道与疾病表型有关的21个基因,涉及青光眼、主动脉扩张、糖尿病、肌肉营养不良、听力损伤的基因:如PPP1R13L、RGS12和CLIP,其中有些基因变异属罕见变异。
而罕见变异可能对疾病风险有更大的影响,但正是由于罕见,对其研究的难度较大。这也说明研究人员使用的表型-基因数据联合应用的方案,在应用到更多个体后,将增强对罕见基因变异对疾病发生“贡献”的理解。
此外,研究人员利用来自宾夕法尼亚医学生物样本库、西奈山生物样本库、盖辛格卫生系统的DiscovEHR生物样本库和英国生物样本库的的名非裔美国人队列数据,重复了此次发现中的26个基因。
其中,由于其中5个基因(比如:CFTR基因的罕见可预测的功能丧失变异与囊性纤维化显著相关,后者的发生正是由于CFTR双等位基因变异引起)是已知的存在基因-疾病关联性的,故在分析中作为阳性对照;在另外的21种关联都是新发现的,其中PPP1R13L(一种p53抑制剂)罕见且预测的功能缺失变异与原发性开角型青光眼相关;RGS12变异与1型糖尿病有关,而CLIP变异与主动脉扩张症有关。
研究者后续的功能分析进一步支持了这些基因在表型中的作用:1.利用眼组织数据库,发现了PPP1R13L在青光眼相关的眼组织中高表达;
2.构建的青光眼小鼠模型,从疾病发生的早起到中期,在视神经头PPP1R13L表达会达到最高,并且PPP1R13L抑制可加重轴索损伤后视网膜神经节细胞的死亡,而视网膜神经节细胞是青光眼中受影响最大的细胞;
3.在人类诱导的多能干细胞中,氧化应激可上调PPP1R13L的表达。
基于此研究人员得出以下结论:PPP1R13L在氧化应激下会上调,并可能阻止青光眼中p53激活和p53介导的凋亡导致的视网膜神经节细胞死亡,PPP1R13L单倍体功能不足可导致青光眼发生。
此次研究考察的队列大部分是欧洲血统,包含大约20%的非洲血统,但却发现了16种罕见的、预测的、针对非洲血统的有害单一变异,且目前均不在GWAS目录或有文献提及。这提示:还需要更大规模和多样化的研究来提高对这些变异如何可能导致疾病的理解。
Exome-wideevaluationofrarecodingvariantsusingelectronichealthrecordsidentifiesnewgene–phenotypeassociations-01-11
预览时标签不可点收录于话题#个上一篇下一篇