白癜风是一类常见的慢性皮肤病,以患者部分或者全部皮肤因为色素脱失而出现斑片为主要症状[1-2] 。
白癜风不具传染性,但目前无法治愈。
目前白癜风在全球范围内的患病率约为 1% [3] 。既往研究发现白癜风的发病风险在性别上几乎没有差异[4] ,在年龄方面绝大多数白癜风患者会在40 岁前发病[4] 。
既往的病因学研究发现白癜风的主要病因为个体自身免疫系统的改变 [2] ,而这一改变则是由环境和遗传多因素共同作用所致 [5] 。
既往基于家系的研究发现白癜风的遗传度约为 50% [6] 。
而随后针对白癜风的候选基因和全基因组关联研究则确定出了大量白癜风的易感基因 [7-12] 。
近期一项基于巴西人群的候选基因关联分析研究报道位于DDR1 基因的 SNP 位点 rs2267641 与白癜风的疾病状态之间存在着显著性的关联 [13] 。
然而这一研究主要以南美人群为研究对象,该结果尚未在世界其他群体中得到有效的重复验证。
本研究基于中国汉族群体,通过基因分型的实验手段,对 DDR1 基因与白癜风疾病状态的关联性进行研究,结果报告如下。
1 对象和方法
1. 1 研究对象
样本均收集自本院皮肤科的汉族个体,总计 1 264 例纳入本研究。其中,白癜风患者378 例(男 214 例,女 164 例),年龄和性别匹配的健康对照 886 例(男 503 例,女 383 例)。
所有患者的临床诊断,均由至少两名经验丰富的皮肤科医生确认。
所有对照均为健康个体,无白癜风、任何其他自身免疫性疾病或全身性疾病,且无任何白癜风家族史(包括一级、二级和三级亲属)。
从病例和对照中收集的临床特征和人口统计学信息见表
1. 2 SNP 位点选择和基因分型实验
使用千人基因组数据库中的北京汉族人群数据,选取 DDR1 基因区域内最小等位基因频率(minor allele frequency,
MAF)大于 0. 05 的 SNP,共计 37 个。
此后再利用遗传学分析软件 Haploviw [14] 的标签 SNPs 选择功能确定出 12 个标签 SNPs (R 2 > 0. 8)。
依据 DNA 提取试剂盒的说明书(Genomic DNA kit,Axygen ScientificInc. ,CA,USA),经知情同意后从受试者外周血白细胞中提取了基因组 DNA,并将所提取的 DNA 储存在 -80 ℃的环境下以进行进一步的基因分型。
使用 MassARRAY 平台(Sequenom Sequenom,San Die-go,CA,USA) 对选择的标签 SNPs 进行基因分型,使用 Sequenom Typer 4. 0 软件处理结果,以产生最终的基因型数据。
基因分型过程中隐藏了样品的病例/对照状态。
本研究中每个标签 SNP 的基因分型成功率均大于 99%,整体基因分型成功率也大于 99%。
1. 3 统计学处理
利用 χ 2 检验和 t 检验分别对性别、年龄这两个基本因素在白癜风病例和对照组之间的分布差异进行考察。
此外还对白癜风患者的疾病阶段、家族史以及有无自身免疫疾病这三类临床特征进行了描述性分析。作为基础的质量控制手段,对所选 12 个标签 SNPs 在对照样本中的哈迪温伯格平衡进行了检验。
利用 χ 2 检验分别从基因型和等位基因的层次对12 个候选 SNPs 在白癜风和对照受试者中的分布情况进行考察。
此外还针对具有显著性的 SNP 在性别、发病年龄(≤或 > 20 岁)和疾病阶段(活跃期和稳定期)这三个层次进行分层分析,确定这三个临床指标对遗传学关联信号的潜在交互影响。
以上的一般统计学分析由 R 软件进行,而遗传学关联相关分析由 Plink 软件完成[15] 。
利用 Haploview 对所选 12 个标签 SNP 的连锁不平衡图谱进行绘制。
使用 Bonferroni 校正对多重检验问题进行处理,在基于单个位点的遗传学关联分析中,使用的 P 值阈值为 0. 05/12≈0. 004。
2 结果
2. 1 人口学和临床特征分析
一般特征和临床信息分析显示,病例和对照组在年龄(t =0. 22)和性别(χ2=8. 71 × 10-30 )上的分布差异均无统计学意义(P >0. 05)。
378 例白癜风患者中,发病年龄≤20岁的病例占总数的 58. 47%,处于活跃期的病例为301 例,占病例总数的 79. 63%。约有 13. 76% 的白癜风患者具有白癜风家族史,而仅有 1. 59% 的白癜风患者具有其他自身免疫疾病。
2. 2 单位点遗传学关联分析
本次研究纳入的 12个候选 SNPs 有两个处于外显子区域(rs2267641 和rs116772905),其余均处于内含子区域。
所有的SNPs 在本次研究的对照组中均处于哈迪温伯格平衡状态且此等位基因频率均大于 0. 05(表 2)。
基于本次研究所选12 个 SNPs 位点的连锁不平衡图谱如图 1 所示,12 个 SNPs 位点之间均不存在较强的连锁不平衡作用。
基于单位点的遗传学关联分析确定出 SNP 位点 rs2267641 在基因型和等位基因的层次均与白癜风疾病状态存在着显著性关联(χ 2 = 11. 25,P =0. 000 8,OR =1. 37),见表 3,该 SNP 位点的 C 等位基因在白癜风病例组较对照组分布显著增多。
其余的 11 个 SNPs 位点均不存在显著性关联。
2. 3 基于性别、发病年龄和疾病阶段的分层分析
分别针对性别、发病年龄和疾病阶段这三个变量进行了基于单个位点的遗传学关联分层分析(表 4),可以看出,SNP 位点 rs2267641 在三种白癜风临床特征的分层分析差异无统计学意义(P >0. 05)。
3 讨论
DDR1 基因所编码的蛋白为酪氨酸激酶受体蛋白家族中的一种[16] 。受体酪氨酸激酶在细胞的生长、分化及代谢过程中起重要调节作用 [16] 。
学界对于 DDR1 的生物学功能研究尚未完全明确,但是既往发表的大量全基因组关联研究已经将 DDR1 基因的若干 SNP 位点与包括银屑病[9] 、银屑病关节炎[10] 、艾滋病 [7] 以及大动脉炎 [8] 等多种免疫系统相关疾病关联起来。
这些研究结果提示 DDR1 基因所编码的蛋白可能在人类的免疫系统中扮演者重要的角色,而作为一类自身免疫疾病,白癜风的发病发展也可能与该基因的变异存在着一定的关联。
在本次研究中,基于中国汉族人群的遗传学关联分析显示 SNP 位点 rs2267641 的 C 等位基因在白癜风病例组较对照组分布显著增多,这一结果与之前基于南美巴西人群的研究结果基本一致 [13] 。
两者的差异在于本次研究所测算的 C 等位基因在中国人群中的 OR 值为 1. 37,而基于巴西人群的研究则分别为 3. 47(核心家系)和 6. 00(无关人群),考虑到两项研究在样本量和统计效能方面的差异以及单个 SNP 位点的遗传学作用往往比较有限,本项研究所得到的 OR 值可能更加准确。
SNP 位点 rs2267641 处于 DDR1 基因的外显子区,但是该变异为同义突变,因此该 SNP 位点对DDR1 基因所编码的蛋白结构并不产生影响。
因此该位点的遗传学关联信号的来源可能有两种;
第一是该位点可能参与了 DDR1 基因表达调控过程,不同的等位基因可能意味着不同的 DDR1 基因表达水平;
第二是该位点只是某个真正具有生物学作用的遗传学位点的“代理位点”,而真正的具有生物学功能的遗传学位点并未被纳入到本次研究中。
在日后的研究中,开展针对 rs2267641 位点的 eQTL 功能分析以及针对整个 DDR1 基因区域的靶向测序研究可以为 rs2267641 位点生物学作用的确定提供证据。
通过本研究,笔者在中国人群中验证了 DDR1基因的 rs2267641 位点与白癜风疾病状态具有显著性关联。
由此提示 DDR1 基因可能是白癜风的易感基因。
【作者:】