遗传学与基因组科学杂志类别:遗传学类型:研究文章

预测随机采集的血样中检测到的n -乙酰氨基葡糖苷-1-磷酸二酯α - n -乙酰氨基葡糖苷酶(NAGPA)基因变异rs7188856和rs7110的诱变效应

Rajesh Kundapur ¹，查尔斯·西尔维斯特 ¹，Nallur B拉马 ²而且桑托什Maruthy ^3.＊: ¹人类遗传学小组，全印度语言和听力学院，奈米沙姆校区，印度米斯鲁尔，马纳萨甘戈瑟里; ²迈索尔大学遗传学和基因组学实验室，印度迈苏鲁马纳萨甘戈特里; ^3.语言科学系，全印度语言与听力学院，奈米沙姆校区，印度，米斯鲁尔，Manasagangothri

^＊通讯作者(年代):

桑托什Maruthy
语言科学系，全印度语言与听力学院，奈米沙姆校区，印度，米斯鲁尔，Manasagangothri
电话:+ 91 9663922033,
电子邮件:santoshm@aiishmysore.in

收到的日期: 2022年02月07日

接受日期: 2022年2月14日

发布日期: 2022年2月21日

DOI: 10.24966 / GGS-2485/100032

摘要

N-Acetylglucosamine-1-Phosphodiester α - n - acetylglucosaminidase (NAGPA)基因编码揭露酶(UCE)。UCE催化甘露糖-6-磷酸的加入作为识别标记的溶酶体酶直接到溶酶体。突变NAGPA会导致口吃，这是一种常见的语言障碍，病因不明。目前，三个基因的变体GNPTAB [NM_024312.4](编码n-乙酰葡糖胺-1-磷酸转移酶α / β亚基前体)，GNPTG [NM_032520.4](编码n-乙酰葡糖胺-1-磷酸二酯α - n-乙酰葡糖胺酶γ亚基)和NAGPA [NM_016256.3](编码n-乙酰葡糖胺-1-磷酸二酯α - n-乙酰葡糖胺酶)已在美国、英国、巴基斯坦、喀麦隆、巴西和印度的人群中与非综合征性口吃相关。在本研究中，收集了80例无口吃史的参与者的血液样本，并进行离子质子NGS分析，发现两个主要的变异rs7188856位于T465I位置，rs7110位于3'UTR区域NAGPA基因。由于无法获得有关其生物学作用的信息，我们进行了生物信息学分析，以评估其诱变效应，这将有助于预形成生物学分析，并对水解酶靶向溶酶体的途径产生影响，而溶酶体与口吃和其他疾病有关。单核苷酸变异rs7188856的动态分析表明，目前预测的NAGPA 3D结构中，在465位的错义突变，苏氨酸替换为异亮氨酸，将导致失稳和失稳ΔΔG稳定降至-0.46千卡/摩尔。RNA折叠网络服务器对SNV rs7110的输出显示，除了变异位点外，两种结构的环和茎的位置几乎相同。在预测的次级3'UTR NAGPA结构中，环和杆的位置发生了变化。我们还对含有rs7110突变的3'UTR区域进行了扫描，但没有发现任何miRNA靶位点。因此，虽然变效应预测的最终确认必须来自实验和计算方法建议进行什么实验。

关键字

NAGPA;变异;rs7188856;rs7110;口吃;总会在

简介

N-Acetylglucosamine-1-Phosphodiester Alpha-N-Acetylglucosaminidase (NAGPA)揭示酶(UCE)基因编码。UCE催化甘露糖-6-磷酸的加入作为识别标记的溶酶体酶直接到溶酶体。人类的NAGPA基因被转录成两种不同的形式，可能是由于选择性剪接。其中一种被称为大脑异构体，缺少8号外显子(102bp)。研究表明，表达最多的NAGPA大脑异构体的大脑皮层可能是与语言功能[1]相关的区域。突变NAGPA会导致口吃，这是一种常见的语言障碍，病因不明。口吃是一种与大脑发育有关的障碍，被认为是在正常的说话过程中以重复、延长和非自愿停顿的形式出现的中断。与口吃同步的次要行为是眨眼、下巴抽搐和头部运动。据信，这些次要动作的发生是为了减轻口吃的严重程度。然而，迄今为止，人们对口吃的遗传基础知之甚少。未知的遗传模式和口吃的多因子性质使得很难找到负责任的基因改变。目前，三个基因的变体GNPTAB [NM_024312.4](编码n-乙酰葡糖胺-1-磷酸转移酶α / β亚基前体)，GNPTG [NM_032520.4](编码n-乙酰葡糖胺-1-磷酸二酯α - n-乙酰葡糖胺酶γ亚基)和NAGPA [NM_016256.3](编码n-乙酰葡糖胺-1-磷酸二酯α - n-乙酰葡糖胺酶)已在美国、英国、巴基斯坦、喀麦隆、巴西和印度的人群中与非综合征性口吃相关[2-4]。根据先前的研究，6-18%的口吃病例被发现与这些基因[3]的变异有关。在本研究中，收集了80例无口吃史的受试者的血液样本，并进行离子质子NGS分析，发现NAGPA基因中T465I位置的rs7188856和3'UTR区域的rs7110两个主要变异。由于我们无法获得有关其生物学作用的资料NAGPA生物信息学分析的变体，以评估其诱变效应，并预测对蛋白质-蛋白质相互作用的影响，这将有助于预先形成生物分析，并对水解酶靶向溶酶体的途径的影响，这与口吃和其他疾病有关。

材料和方法

研究参与者的选择

本研究纳入的参与者(n = 80)均为非口吃者。所有的研究程序都遵守了《赫尔辛基宣言》的原则，并得到了机构伦理委员会的批准。获得受试者的书面知情同意。

样品采集，DNA分离和NGS分析

从研究参与者(n =80)中采集约5毫升外周静脉血。DNA提取采用蛋白酶- k消化，苯酚-氯仿萃取，乙醇沉淀。量化后，使用Ion Ampliseq Exome RDY面板(Thermo Fisher Scientific)根据制造商协议构建外显子组文库，使用Qubit 3.0 (Thermo Fisher Scientific)进行量化。根据用户指南，大约25 Pico摩尔的文库用于模板生成、富集和芯片加载。测序使用Hi-Q化学在离子质子系统(Thermo Fisher Scientific)上进行。

离子质子系统生成的未对齐二进制数据文件(二进制对齐图，BAM)被上传到离子报告软件(赛默飞雪科学)，并使用默认设置进行分析。使用TMAP比对(赛默飞世尔科学公司)对参照基因组(GRCh38/hg19)进行序列比对。

生物信息学分析

NAGPA的三维蛋白质结构:完整的DNA和蛋白质序列NAGPA基因是从NCBI网站下载的。蛋白质数据库(www.rcsb.org)．为了得到完整的3D结构，我们搜索了其他网站和预测的3D结构在AlphaFold蛋白质结构数据库(https://alphafold.ebi.ac.uk)，登录号为Q9UK23。结构文件被下载并用于进一步的分析。

NAGPA基因3'UTR区结构:NAGPA基因的3'UTR区长约634个碱基，从NCBI的ACE VIEW网站下载(www.ncbi.nlm.nih.gov ieb /研究/ acembly / index . html)．在结构预测之前，DNA序列通过生物模型进一步转录成RNA序列(http://biomodel.uah.es/en/lab/cybertory/analysis/trans.htm)．通过RNA折叠webserver (RNA .tbi.univie.ac.at//cgi-bin/RNAWebSuite/RNAfold.cgi)设计野生型和突变型的3'UTR结构。选取能量最小的最佳拟合进行进一步分析。

预测SNP rs7188856和rs7110的突变/损伤效应:NAGPA蛋白结构和突变位点(T465I)均提交给DynaMut2 (http://biosig.unimelb.edu.au/dynamut2)与野生型和突变型结构进行比较，以预测突变对蛋白质三维结构水平的影响。同样，对3'UTR区另一个突变rs7110进行生物信息学分析。比较野生型和突变型UTR的结构，观察碱基变化后的结构差异。UTR突变通常会产生一个microRNA靶位点，负责相应基因[5]的下调。我们通过targetscan[6]和miRanda[7]扫描含有rs7110突变的3'UTR区域，以寻找任何miRNA位点。

结果

门店数据分析

离子报告软件(Thermo Fisher Scientific)显示两个非常重要的变种rs7188856和rs7110都属于当前研究中的NAGPA基因。rs7188856变异是由于465位的氨基酸由苏氨酸变为异亮氨酸(T465I)而产生的。另一个突变发生在3'UTR区域，观察到的核苷酸变化从“G”到“A”。在目前的研究中，rs7188856变种的出现频率为24%，rs7110的出现频率为100%。

生物信息学分析

NAGPA的三维蛋白质结构:从AlphaFold蛋白结构数据库下载蛋白质结构(图1)，进一步进行诱变致病效应分析。

图1:Alfa折叠预测了人类NAGPA蛋白的3D结构，登录号为Q9UK23(来源:https://alphafold.ebi.ac.uk)。

诱变效应的rs7188856:DynaMut2是一个基于服务器的实用程序，使用正态分析(NMA)方法捕获蛋白质运动，并表示野生型环境，研究单点和多点突变对蛋白质稳定性和动态的影响。DynaMut2预测了错义突变对蛋白质稳定性的影响，在单点上实现了高达0.72 (RMSE: 1.02 kcal/mol)的皮尔逊相关性。DynaMut2预测了吉布斯自由能(ΔΔG)和熔化温度(ΔTm)[8]的变化。dynamut2分析显示，在当前预测的NAGPA 3D结构(图1)中，在465位置的错义突变与苏氨酸替换为异亮氨酸将导致失稳，ΔΔG稳定性降至-0.46 Kcal/mol。野生型蛋白质结构(图2A)为苏氨酸在465位与亮氨酸在461位发生单疏水相互作用，与亮氨酸在461位、462位、异亮氨酸在463位、天冬氨酸在468位、亮氨酸在469位发生多次极性相互作用。在466和467处未发现与丙氨酸的直接接触。离子相互作用为零。相反，突变型(图2B)中出现在465位置的异亮氨酸与亮氨酸(462)表现出两种疏水相互作用，极性相互作用与野生型相同。同样，在突变型中没有观察到离子相互作用。

图2:dynamut2分析显示与野生型的比较(图2A)，以及提交的NAGPA 3D结构中变异型465氨基酸位置的错义突变，苏氨酸替换为异亮氨酸(图2B)。氨基酸的变化用箭头标出。

rs7110的诱变作用:RNA折叠网络服务器输出3'UTR结构设计是基于最小自由能(MFE)概念的二级结构。两种结构中环和茎的位置(图3A和3B)除了变异部位(图3B)外几乎相同。单核苷酸变异(SNV)是残基“G”向残基“a”的变化，而“G”是环的一部分，变异中的“a”残基是茎的一部分。在预测的次级3'UTR NAGPA结构中，环和杆的位置发生了变化。

图3:该图像显示了3'UTR区域二级结构RNA折叠webserver输出的野生型(图3A)和变异型(图3B)。单核苷酸变异(SNV)是残基“G”到残基“a”的变化，其中“G”是环的一部分，“a”残基是茎的一部分，用箭头标出。

3'UTR突变和miRNA位点:3'UTR突变在大多数情况下会产生一个miRNA靶位点。为了寻找c*527G>A(rs7110)变异可能引入的miRNA目标位点，使用了不同的miRNA扫描web服务器。对含有rs7110突变的3'UTR区域的扫描没有发现任何miRNA靶位点。

讨论

根据一些可计数的报告，NAGPA基因突变与非综合征性口吃相关[1,3]。NAGPA基因首次被报道至今已有近40年的历史[9，10]大约20年前，克隆[11]完成，完整的人类3D结构的NAGPA基因尚未发表。由于这一限制，与NAGPA功能相关的几个问题，如其前肽[12]的抑制模式、其催化机制[13]以及其富含半胱氨酸的c端结构域(CTD)[11]的作用仍未得到解答。已知的破坏蛋白质折叠性质和影响其活性的变异很少，在对照组中也发现了一些变异。目前报道的大多数变异缺乏对酶活性影响的信息，其中两个这样的变异是rs7188856和rs7110，我们在研究中观察到这两个变异，我们进一步通过基于in - silica的算法预测来揭示其影响。

错义突变可能是有害的，因为它的形成是由于通常产生在特定位置的氨基酸的改变。每种氨基酸都有其特定的大小、电荷和疏水性值。原始的野生型残体与新引入的突变型残体在这些特性上往往存在差异。在本研究中rs7188856第465位的苏氨酸到异亮氨酸(T465I)是在NAGPA基因中观察到的负责结构失稳的变异。据其他文献报道，心周物质1基因中的苏氨酸对异亮氨酸错义突变与精神分裂症[15]密切相关。这需要通过生物试验进一步证实。一般来说，在分子相互作用位点发现的变异往往会改变结合能，进而影响蛋白质复合体的形成，相反，在非分子相互作用位点发现的变异可能会降低折叠能，从而导致单体结构的不稳定[16]。

3 UTR突变rs7110早前由Chen等人报道，[17]。在中国人群[17]建立口吃候选基因GNPTAB、GNPTG和NAGPA与阅读障碍的相关性时观察到。信使rna (mRNA)的3 '非翻译区(3 ' UTRs)决定了mRNA的位置、翻译及其稳定性，并在蛋白质-蛋白质相互作用(PPIs)中起着重要作用，能够将编码在3 ' UTRs中的遗传信息传递给蛋白质。该功能已被证明可以调节多种蛋白质特征，包括蛋白质复合体的形成或翻译后修饰，但也有望改变蛋白质构象。因此，3’ultra介导的信息传递可以调节氨基酸序列[18]中未编码的蛋白质特征。有趣的是，3 ' utr的差异可以改变神经元突触区附近的mrna定位，从而神经递质合成可由突触需求和活性调节。因为这与口吃是一种神经紊乱的事实有关。虽然变异效应预测的最终确认必须来自实验和计算方法将有助于建议做什么实验。

结论

NAGPA突变和口吃，这些词之间的联系早在十年前就已经确立，但仍然需要强有力的证据。通过GWAS分析报告了数百种snv，但其中大部分snv没有关于其生物学作用的支持信息。这种类型研究将有助于选择更合适的snv，并进一步用于生物测定。在目前的研究中，报道的两种snv及其生物信息学分析表明，这两种变异可以进一步进行生物检测。

确认

作者要感谢全印度语言与听力研究所所长M Pushpavathi博士和前所长S R Savithri博士批准进行这项研究。我们还要感谢JJayashankar饶以及斯里尼瓦斯·科瓦利博士的宝贵支持。

参考文献

引用:Kundapur R, Sylvester C, Ramachandra NB, Maruthy S(2022)预测随机采集的血液样本中检测到的n -乙酰氨基葡糖苷-1-磷酸二酯α - n -乙酰氨基葡糖苷酶(NAGPA)基因变异rs7188856和rs7110的诱变效应。中国生物技术学报(英文版)

杂志强调

预测随机采集的血样中检测到的n -乙酰氨基葡糖苷-1-磷酸二酯α - n -乙酰氨基葡糖苷酶(NAGPA)基因变异rs7188856和rs7110的诱变效应

＊通讯作者(年代):

摘要

关键字

简介

材料和方法

结果

讨论

结论

确认

参考文献

人类遗传学 植物遗传学 动物遗传学 遗传疾病 基因工程 分子遗传学

^＊通讯作者(年代):

人类遗传学

植物遗传学

动物遗传学

遗传疾病

基因工程

分子遗传学