表型相关特征,如年龄,通过调控途径与遗传成分联系,表观遗传修饰,如DNA甲基化,是基因型向表型转化的主要调控因子。与年龄相关的CpG位点已经被鉴定出来,并被描述为在生物样本的年代年龄估计中具有预测价值。目前,CpG位点的选择仅基于与年龄的统计相关性,而不是基于其在染色体上的位置或其所在基因的功能。关于已识别的基因,以及它们是否与衰老过程有直接或间接关系,或者统计上的相关性更可能是随机的,似乎缺乏相关信息。在这项工作中,我们分析了过去6年发表的关于DNA甲基化年龄标记的研究,共确定了59个与年龄相关的基因。不同预测模型使用最多的5个词是:ELOVL2,FHL2,KLF14,TRIM59而且C1orf132.经过进一步的研究,我们可能会注意到,虽然在选择构建年龄预测模型的目标时,基因的功能并不是主要标准,但很明显,DNA甲基化与年龄之间的统计相关性并不是随机的。不同研究选择的位点和基因大多与衰老直接相关,在代谢、细胞增殖、迁移和免疫信号通路中发挥重要作用,也参与炎症反应和癌症发展。
年龄预测;DNA甲基化;法医表观遗传学;调查铅
留在犯罪现场的DNA样本通常被用于鉴定目的,将其与参考样本或法医数据库进行比较。在没有匹配的情况下,研究人员可能会转向使用先进技术的替代方法,以获得留下DNA材料的人的表型特征(外部可见的特征)的有价值的线索。先前的研究发现,表型可以通过从不同的DNA标记获得的信息进行预测,如单核苷酸多态性(SNPs)、插入/删除多态性(InDel)和表观遗传标记[1-11]。众所周知,表观遗传修饰是基因型向表型转化的主要调节因子。表观遗传调控包括不同水平的基因表达,包括DNA、组蛋白、RNA和染色质的修饰,对人类基因组的功能产生影响[12-14]。DNA甲基化是最典型的表观遗传修饰。它通常与转录抑制有关,它涉及到CpG二核苷酸胞嘧啶中甲基(- CH3)的添加。基因组特定区域DNA甲基化水平的差异可以影响目标基因的表达和下游表型。随着差异甲基化模式开始被更广泛地描述,研究开始专注于理解人类DNA甲基化模式的变化如何被用于描述和预测表型相关特征,如年龄。与年龄相关的CpG位点已经被鉴定出来,并被描述为在生物样本的年代年龄估计中具有预测价值[15-18]。
目前最常用的识别CpG位点的方法包括使用从DNA甲基化阵列获得的数据,如Infinium HumanMethylation450珠芯片阵列(Illumina, CA)。该平台查询超过45万个单独的CpG位点,并通过测量甲基化和未甲基化探针发出的信号强度来量化DNA甲基化。然后,分析软件将使用这些探针强度计算β值,这将提供估计的甲基化状态。例如,一个β值为0.9的CpG位点估计有90%的甲基化[18]。大多数年龄预测研究使用来自不同组织样本的甲基化原始数据,然后提取每个CpG位点的beta值。然后选取与年龄高度相关的CpG位点,建立年龄预测的统计模型[19]。基于对CpG位点选择的描述,很明显,它们的选择主要不是基于它们在染色体上的位置,也不是基于它们所在基因的功能。相反,CpG站点的选择只基于与年龄的统计相关性。已发表的年龄预测研究通常会列出所选择的位点,并简要提及相关基因。关于已识别的基因,以及它们是否与衰老过程有直接或间接关系,或者统计上的相关性更可能是随机的,似乎缺乏相关信息。 Hence, this study aimed to evaluate the current progress in forensic age prediction based on DNA methylation patterns and to investigate the identified sites/genes and their significance and correlation with human aging.
我们对有关法医年龄预测的文章进行了全面的回顾,以确定之前发表的与年龄相关的DNA甲基化标记,并收集CpG位点、基因、年龄估计误差和样本类型的信息。确定了不同年龄预测模型中最常用的CpG位点,并对这些标记所在的基因进行了研究。通过在国家生物技术信息中心(NCBI)[20]和基因卡[21]数据库中找到的信息,对识别的基因及其与任何衰老过程的相关性进行了评估。
尽管目前在研究DNA甲基化标记的年龄预测方面已经做了很多工作,但基于表观遗传数据的年龄估计的某些方面还需要进一步了解。从迄今发表的研究中可以看出,DNA甲基化和年龄之间似乎存在功能联系,因为随着年龄的增加,一些基因的调控区域有变得更甲基化的趋势。然而,尽管研究报告显示CpG位点与人类衰老有关,但缺乏这些CpG位点所在基因的进一步信息,以及这些位点是否与衰老过程直接或间接相关。
分析了近6年来发表的29篇DNA甲基化年龄标记的研究,以评估目前法医年龄预测的进展,并更好地研究不同作者确定的位点和基因。本次调查的结果如表1所示。大多数年龄预测模型都建立在从血液样本分析中收集的结果上。然而,理想的年龄预测工具应该适用于不同的体液,因此,最近的研究一直致力于扩大所分析的组织类型,至少包括在犯罪现场发现的最常见的体液类型,如唾液和精液[23-47]。
研究 |
基因 |
平均绝对偏差或预测误差 |
样本类型 |
Weidner等[23] |
Itga2b, aspa, pde4c |
4.5年 |
血 |
Yi等。[15] |
Tbox3、gpr137、zic4、zdhhc22、meis1、ube2e1、ptdss2、ubqln1 |
NA |
血 |
Zbiec-Piekarska等[17] |
ELOVL2, C1orf132, TRIM59, KLF14, FHL2 |
3.9年 |
血 |
Lee et al. [24] |
TTC7B, NOX4 |
5.4年 |
精液 |
Bekaert et al. [25] |
Aspa, pde4c, elovl2, edaradd |
3.8岁(血液)4.9岁(牙齿) |
血,牙齿 |
Xu等[26] |
Adar, itga2b, pde4c |
5.1年 |
血 |
黄等。[27] |
Aspa, itga2b, nptx2 |
7.9年 |
血 |
Park等[18] |
Elovl2, znf423, ccdc102b |
3.4年 |
血 |
Friere-Aradas等[28] |
ELOVL2, ASPA, PDE4C, FHL2, CCDC102B, C1orf132 |
3.1年 |
血 |
朱利安尼等人[29] |
Elovl2, fhl2, penk |
2.3年(牙髓),7.1年(牙本质)和2.5年(牙骨质) |
牙齿 |
Zubakov等人[30] |
Dmh1, dmh2, dmh3, fhl2, elovl2 |
4.3年 |
血 |
Hong等[31] |
Sst, cnga3, klf14, tssk6, tbr1, slc12a5, ptpn7 |
3.2年 |
唾液 |
Alghanim等人[32] |
KLF14, SCGN |
7.1年(唾液)和10.3年(血液) |
血液、唾液 |
Cho et al. [33] |
ELOVL2, C1orf132, TRIM59, KLF14, FHL2 |
3.3年 |
血 |
Naue et al. [34] |
Elovl2, f5, klf14, trim59 |
3.6年 |
血 |
Vidaki et al. [35] |
Nhlrc1, scgn, csnk1d |
7.1年(血液)和3.2年(唾液) |
血液、唾液 |
Li et al. [36] |
Nhlrc1, scgn, aspa, edaradd, csnk1d, lag3 |
4.1年(健康样本)和7.1年(患病样本) |
血 |
Alifieri等。[37] |
VGF, TRIP10, KLF14, CSNK1D, FZD9, C21orf63, SSRP1, NHLRC1, ERG, FXN, P2RXL1, SCGN |
4.1年(血液)和7.3年(唾液) |
血液、唾液 |
冯等[38] |
TRIM59, PDE4C, ELOVL2, CCDC102B, C1orf132, RASSF5 |
2.8年 |
血 |
荣格等[39] |
ELOVL2, FHL2, KLF14, C1orf132, TRIM59 |
3.8年 |
血液,唾液,口腔拭子 |
Alsaleh et al. [40] |
FHL2, ELOVL2 |
4.6年 |
血 |
Gentile et al. [41] |
ELOVL2, C1orf132, TRIM59, KLF14, FHL2 |
5.4岁(按年龄组别划分的最高MAD) |
唾液 |
Xu等[42] |
SALL4、MBP、C17orf76、B3GALT6、NOC2L、SNN、NPTX2、SLC22A18、TMEM106A、LEP、SCAP、C16orf30、FLJ25410 |
4.7年 |
骨髓、真皮成纤维细胞、颊部、前列腺NL、精子、唾液、结肠、乳腺NL、肌肉、胎盘、肝脏、脂肪adip、脑枕皮质、脑CRBLM |
Dias et al. [43] |
ELOVL2, FHL2, EDARADD, PDE4C, C1orf132 |
8.8年 |
血 |
海德格尔等[44] |
Elovl2, fhl2, klf14, mir29b2chg, trim59 |
NA |
血 |
Lee et al. [45] |
TMEM51, TRIM59, ELOVL2和EPHA6 |
NA |
骨头 |
Li et al. [46] |
NOX4 |
4.2年(液体精液和新鲜精液),4.4年(陈年精液),3.9年(混合精液) |
精子 |
Pan et al. [47] |
Aspa、edaradd、ccdc102b、znf423、itga2b、klf14、fhl2 |
4.6年 |
血 |
Sukawutthiya等人[22] |
ELOVL2 |
7.1年 |
血 |
表1:DNA甲基化年龄预测研究的信息。
不可用
MAD值显示了验证/训练集
共有59个基因被鉴定为与年龄有关,其中使用最多的5个是ELOVL2,FHL2,KLF14,TRIM59而且C1orf132.所有基因都是蛋白质编码基因,除了C1orf132这是一种ncRNA基因类型。有趣的是,大多数被识别的基因(59个中的44个)并没有被多项研究使用,只是一个年龄预测模型的一部分。引用较少的基因的更多信息也可以在补充表1中找到。
基因 |
使用该基因的研究数量 |
基因的作用 |
GeneCards / NCBI的参考 |
ELOVL2 |
16 |
代谢、转移酶和脂肪酸延长酶活性 |
https://www.genecards.org/cgi-bin/carddisp.pl?gene=ELOVL2 |
FHL2 |
11 |
细胞外膜的组装 |
https://www.genecards.org/cgi-bin/carddisp.pl?gene=FHL2&keywords=FHL2 |
KLF14 |
10 |
转录镇压 |
https://www.genecards.org/cgi-bin/carddisp.pl?gene=KLF14&keywords=KLF14 |
TRIM59 |
8 |
先天免疫信号通路调节剂 |
|
C1orf132 / MIR29B2CHG |
7 |
mir-29 microRNA前体 |
https://www.genecards.org/cgi-bin/carddisp.pl?gene=MIR29B2CHG&keywords=C1orf132 |
ASPA |
6 |
维持白质 |
https://www.genecards.org/cgi-bin/carddisp.pl?gene=ASPA&keywords=ASPA |
PDE4C |
6 |
对cAMP细胞浓度的调节作用 |
|
CCDC102B |
4 |
中心体内聚和中心体连接子组装 |
|
EDARADD |
4 |
外胚层器官的形态发生 |
|
ITGA2B |
4 |
凝血系统 |
|
SCGN |
4 |
kcl刺激的钙通量和细胞增殖 |
https://www.genecards.org/cgi-bin/carddisp.pl?gene=SCGN |
CSNK1D |
3. |
不同的细胞生长和生存过程 |
https://www.genecards.org/cgi-bin/carddisp.pl?gene=CSNK1D |
NHLRC1 |
3. |
通过蛋白质降解抑制细胞毒性 |
https://www.genecards.org/cgi-bin/carddisp.pl?gene=NHLRC1 |
NOX4 |
2 |
信号转导、细胞分化与肿瘤细胞生长 |
https://www.genecards.org/cgi-bin/carddisp.pl?gene=NOX4 |
NPTX2 |
2 |
兴奋性突触的形成 |
https://www.genecards.org/cgi-bin/carddisp.pl?gene=NPTX2&keywords=NPTX2 |
ZNF423 |
2 |
发育过程中的信号转导 |
|
阿达尔月 |
1 |
RNA编辑 |
|
B3GALT6 |
1 |
半乳糖转移和糖胺聚糖合成 |
|
C16orf30 |
1 |
粘附接点的细胞粘附和细胞通透性 |
https://www.genecards.org/cgi-bin/carddisp.pl?gene=TMEM204 |
C17orf76 / LRRC75A |
1 |
蛋白质相互作用 |
|
C21orf63 / EVA1C |
1 |
碳水化合物结合 |
https://www.genecards.org/cgi-bin/carddisp.pl?gene=EVA1C&keywords=C21orf63 |
CNGA3 |
1 |
正常的视觉和嗅觉信号转导 |
https://www.genecards.org/cgi-bin/carddisp.pl?gene=CNGA3 |
DMH |
1 |
中间丝、肌动蛋白和微管细胞骨架网络的整合者 |
https://www.genecards.org/cgi-bin/carddisp.pl?gene=DST&keywords=DMH |
EPHA6 |
1 |
转移酶的活动 |
https://www.genecards.org/cgi-bin/carddisp.pl?gene=EPHA6 |
ERG |
1 |
胚胎发育,细胞增殖,分化,血管生成,炎症和凋亡 |
https://www.genecards.org/cgi-bin/carddisp.pl?gene=ERG |
F5 |
1 |
凝血级联 |
https://www.genecards.org/cgi-bin/carddisp.pl?gene=F5 |
FLJ25410 / SEPTIN12 |
1 |
胞质分裂,胞外分泌,胚胎发育和膜动力学 |
https://www.genecards.org/cgi-bin/carddisp.pl?gene=SEPTIN12 |
FXN |
1 |
线粒体铁转运和呼吸作用 |
https://www.genecards.org/cgi-bin/carddisp.pl?gene=FXN |
FZD9 |
1 |
神经肌肉连接点的组装,神经祖细胞活力和神经母细胞增殖和凋亡细胞死亡 |
https://www.genecards.org/cgi-bin/carddisp.pl?gene=FZD9 |
GPR137 |
1 |
MTORC1复合体易位至溶酶体,自噬和上皮细胞功能 |
https://www.genecards.org/cgi-bin/carddisp.pl?gene=GPR137 |
LAG3 |
1 |
先天免疫系统和I类MHC介导抗原的处理和呈递 |
https://www.genecards.org/cgi-bin/carddisp.pl?gene=LAG3 |
地蜡 |
1 |
调节能量内稳态,免疫和炎症反应,造血,血管生成,生殖,骨形成和伤口愈合 |
https://www.genecards.org/cgi-bin/carddisp.pl?gene=LEP |
MBP |
1 |
蛋白酶与髓鞘的结合及其结构组成 |
https://www.genecards.org/cgi-bin/carddisp.pl?gene=MBP |
MEIS1 |
1 |
造血,巨核细胞谱系发展和血管模式 |
https://www.genecards.org/cgi-bin/carddisp.pl?gene=MEIS1 |
NOC2L |
1 |
组蛋白乙酰转移酶活性的抑制 |
https://www.genecards.org/cgi-bin/carddisp.pl?gene=NOC2L |
P2RXL1 |
1 |
相同的蛋白质结合和离子通道活性 |
https://www.genecards.org/cgi-bin/carddisp.pl?gene=P2RX6 |
PENK |
1 |
生理功能,包括痛觉和对压力的反应 |
https://www.genecards.org/cgi-bin/carddisp.pl?gene=PENK |
PTDSS2 |
1 |
代谢和甘油磷脂生物合成 |
https://www.genecards.org/cgi-bin/carddisp.pl?gene=PTDSS2 |
PTPN7 |
1 |
细胞生长,分化,有丝分裂周期,和致癌转化 |
https://www.genecards.org/cgi-bin/carddisp.pl?gene=PTPN7 |
RASSF5 |
1 |
肿瘤抑制基因 |
https://www.genecards.org/cgi-bin/carddisp.pl?gene=RASSF5 |
SALL4 |
1 |
外展运动神经元的发育及胚胎和造血干细胞的维持和自我更新 |
https://www.genecards.org/cgi-bin/carddisp.pl?gene=SALL4 |
SCAP |
1 |
胆固醇和脂质平衡 |
https://www.genecards.org/cgi-bin/carddisp.pl?gene=SCAP |
SLC12A5 |
1 |
蛋白激酶结合与氯化钾转运体活性 |
https://www.genecards.org/cgi-bin/carddisp.pl?gene=SLC12A5 |
SLC22A18 |
1 |
肿瘤抑制基因 |
|
SNN |
1 |
有机锡的毒性作用和内体成熟 |
https://www.genecards.org/cgi-bin/carddisp.pl?gene=SNN |
SSRP1 |
1 |
染色质转录延伸因子事实 |
https://www.genecards.org/cgi-bin/carddisp.pl?gene=SSRP1 |
风场 |
1 |
激素的活动 |
|
TBOX3 |
1 |
细胞衰老过程中PML的发育过程、肢体模式的形成和功能的调节 |
https://www.genecards.org/cgi-bin/carddisp.pl?gene=TBX3&keywords=T-BOX3 |
TBR1 |
1 |
皮质发育,包括神经元迁移、层状和区域同一性以及轴突投射 |
https://www.genecards.org/cgi-bin/carddisp.pl?gene=TBR1 |
TMEM106A |
1 |
巨噬细胞的激活和极化 |
https://www.genecards.org/cgi-bin/carddisp.pl?gene=TMEM106A |
TMEM51 / C1orf72 |
1 |
可知 |
https://www.genecards.org/cgi-bin/carddisp.pl?gene=TMEM51&keywords=TMEM51 |
TRIP10 |
1 |
相同的蛋白质结合和脂质结合 |
|
TSSK6 |
1 |
精子的产生和功能,以及减数分裂后染色质重塑过程中的DNA凝结 |
https://www.genecards.org/cgi-bin/carddisp.pl?gene=TSSK6 |
TTC7B |
1 |
4-磷酸磷脂酰肌醇(PtdIns(4)P)合成的调控 |
https://www.genecards.org/cgi-bin/carddisp.pl?gene=TTC7B&keywords=TTC7B |
UBE2E1 |
1 |
光动力疗法诱导的未折叠蛋白反应和通过蛋白酶体介导的降解调节激活的PAK-2p34 |
https://www.genecards.org/cgi-bin/carddisp.pl?gene=UBE2E1 |
UBQLN1 |
1 |
蛋白质降解机制和途径 |
https://www.genecards.org/cgi-bin/carddisp.pl?gene=UBQLN1 |
VGF |
1 |
生长因子活性和神经肽激素活性 |
https://www.genecards.org/cgi-bin/carddisp.pl?gene=VGF |
ZDHHC22 |
1 |
蛋白半胱氨酸s -棕榈酰转移酶活性 |
https://www.genecards.org/cgi-bin/carddisp.pl?gene=ZDHHC22 |
ZIC4 |
1 |
发育和x连锁内脏异位和前脑无孔畸形5型 |
https://www.genecards.org/cgi-bin/carddisp.pl?gene=ZIC4 |
补充表1:识别基因及其功能。除C1orf132 (ncRNA基因型)外,所有基因均为蛋白质编码基因。
CpG站点中的ELOVL2基因是多项研究中使用最多的基因(补充表1)ELOVL2基因也是预测模型中平均绝对偏差最小的部分。ELOVL2(延长极长链脂肪酸样2)在代谢中起作用,包括omega-3和omega-6代谢,它也与转移酶而且脂肪酸延长酶活性[48]。Chen等[49]调查了ELOVL2与功能老化和解剖老化有关在活的有机体内,聚焦于小鼠视网膜。ELOVL2与长链omega-3和omega-6多不饱和酸的延伸有关,这两种酸在视网膜功能中起着重要作用。作者报告说ELOVL2在视网膜中,启动子区域随着年龄的增长而不断甲基化,该基因表达的减少可能是视网膜中分子衰老时钟的调节因子。此外,根据Bacalini等人[50],ELOVL2甲基化与细胞复制和细胞内的靶区有关ELOVL2细胞分裂导致高甲基化。基于其他研究[51],作者认为衰老受细胞分裂数量的影响,延长寿命与细胞分裂率的降低有关。同样的作者还提出了自ELOVL2高甲基化发生在不同的组织中;该位点是整个细胞复制过程中甲基转移酶活性的靶点。不同研究中使用最多的第二个基因座是FHL2(4.5 LIM结构域蛋白2)基因,编码在细胞外膜组装中起作用的蛋白质[52]。该基因还与转录活性、细胞增殖、凋亡、粘附、迁移、结构稳定性、组织修复和炎症[53]相关。根据Cao等[54],,FHL2在癌细胞侵袭、迁移和细胞外基质粘附中起着重要作用,该基因的突变和翻译后修饰也可能有助于致癌。
的KLF14(Kruppel Like Factor 14)基因用于十项不同研究提出的年龄预测模型。该基因编码一种蛋白质,其功能是转录辅抑制因子[55]。全基因组关联研究(GWAS)也表明了这一点KLF14在代谢性疾病的发展中发挥重要作用,该基因附近的变异与2型糖尿病(2型糖尿病)和高密度脂蛋白- c(高密度脂蛋白胆固醇)[56]相关。Assuncao等人发现[57]除了是脂质代谢的调节剂,KLF14也调节脂质信号。为了进一步支持这些发现,[56]表明高糖和高胰岛素诱导的葡萄糖摄取抑制可以通过过表达的KLF14.最近,研究表明KLF14参与慢性炎症反应和动脉粥样硬化的发展[58,59]。在这项工作中分析的研究中,第四个使用最多的基因是TRIM59(三部基序含59),一种参与先天免疫信号通路[60]的蛋白质编码基因。TRIM59也被证明通过影响Ras和RB信号通路参与细胞衰老的诱导[61],并在不同类型的癌症中是生长和迁移的启动子[59,62]。
C1orf132(1号染色体开放阅读框132),目前被称为MIR29B2CHG(MIR29B2和MIR29C宿主基因)是第五大被引用的基因。这是lncRNA类的RNA基因部分,也是mir-29 microRNA前体[63]。microRNAs调节蛋白质的翻译,mir-29家族成员在不同类型的癌症中被下调[64]。
如本节和补充材料(补充表1)所述,不同研究选择的有助于年龄预测的位点和基因大多与衰老直接相关,在代谢、细胞增殖、迁移和免疫信号通路中发挥重要作用,也参与炎症反应和癌症发展。
在一生中,人类会接触到许多影响不同基因甲基化水平的环境因素。最有可能的是,染色体中的某些位置对环境的变化更敏感,因此它们与衰老过程的相关性更强,并为预测模型[59]提供了更好的标记。有趣的是,为了在司法实践中创建更准确可靠的年龄预测模型,研究人员还应该着重探索RNA基因,如MIR29B2CHG.这种类型的基因已经被证明对DNA甲基化和蛋白质表达有直接和间接的影响,当与其他强烈年龄相关的基因结合时,可以增加预测模型的价值,如ELOVL2.
虽然在选择目标建立年龄预测模型时,基因的功能并不是首要标准,但很明显,通过甲基化阵列分析得到的DNA甲基化与年龄之间的统计相关性并不是随机的。这项工作中提供的信息表明,研究和讨论预测模型中使用的基因和位点的功能是多么重要。未来的出版物应该包括靶向基因的功能信息,在使用这类调查工具时为法医调查人员提供额外的信息层。
Georgia Karantenislis正在进行一个独立的研究生水平的研究项目,作为高级科学研究(ASR)计划的一部分。
一个也没有。
引用:Silva DSBS和Karantenislis G(2021)用于法医年龄预测的DNA甲基化位点分析及其与人类衰老的相关性。法医腿部调查科学7,054。
版权:©2021 Silva DSBS,等。这是一篇开放获取的文章,根据创作共用署名许可协议(Creative Commons Attribution License)发布,该协议允许在任何媒体上不受限制地使用、分发和复制,前提是注明原作者和来源。