没那么简单,获取古DNA的条件竟如此苛刻
许多人都曾听长辈说过自家祖上曾出了哪些达官贵人,有些人翻翻家谱甚至可以「发现」自己是「皇亲国戚」。而稍对家谱有所了解的人其实都知道,家谱中附会名人的现象实在是太普遍了,就拿常见的王、李、张、刘等大姓来说,每个姓氏均已发现超过一千种以上的不同单倍群类型。即便不考虑因为细化程度不一样而被分到上下游导致单倍群类型不同的情况,每个姓氏也有至少几百种以上的来源。
「这里的来源不同以秦汉时期为界,考虑到时间计算的误差,上限设置略微宽松,以距今 2500年前为界。如 N-Y24355(约 2240 年前分化)与其下游的 N-Y62139(约1500年前分化)、N-Y68723(约 1430 年前分化)均只算一个来源,即全部出自约 2240 年前分化的 N-Y24355 一支。)
此前,在《从基因科学的角度来看,家谱的准确性究竟有多高?》一文中,我们已经详细探讨了家谱有多不靠谱,因而也有不少对基因检测有一定程度了解的人寄希望于古 DNA,希望与古 DNA 进行匹配以找到有力证据,但事情真的如此简单吗?
今天就带大家了解一下,古 DNA 检测到底是怎么一回事。
目前全球的古 DNA 样本不超过 5000 个,国内的古 DNA 样本数量更是稀少,与我国古代社会的复杂状况相去甚远。
这也不能怪相关工作者不给力,古 DNA 检测的样本绝大部分源自考古发掘,因为只有通过考古发掘获得的样本才具有出土环境这一最为重要的信息。
但是,通过考古发掘获得古 DNA 难度远超一般人的想象,可不是随便挖出点骨头就能提取。因为历史名人墓葬能被考古发掘到的少之又少;发掘后遗骸未被损坏的又少之又少;未被损坏且又有明确的身份信息的更是少之又少。
笔者曾参与发掘的某处石器时代遗址,由于年代久远和以及当地环境湿热,出土的大部分遗存来自明清时期,石器时代保留下的线索少之又少。
即便是满足了上述三个少之又少的条件后,古 DNA 能够被检测出来的又是少之又少。这是因为,随着时间的变化,人骨中的有机质也会不断流失,DNA 片段逐渐缩短,直至没有特异性研究价值,特别是在南方湿热环境下的酸性土壤中,人类 DNA 降解更是严重。比如近年发掘的西汉海昏侯刘贺墓,是少有的能有明确身份且还有遗骸的汉代古墓,但相关实验人员耗费数年时间,也未能提取出墓主相应的古 DNA 信息。
另外在发掘出土、入库保存、出库移交、实验提取等诸多环节中,古人类样本还可能出现混淆的情况。如今年发表的晓坞遗址墓 1 的 18 号人骨古 DNA 样本检测结果 Y 单倍群类型为 Q1a1a1 (Ning C , Li T , Wang K , et al. 2020),但查阅试掘报告等一手资料可知,该具人骨的性别应为女性。
△ 晓邬 M1 平剖面图
△ Ning C , Li T , Wang K , et al. 2020 中的检测结果
△ 晓坞遗址墓 M1 人骨保存状况及性别、年龄统计表
古 DNA 的提取分析难度较大,既需要足够好的运气发现保存状况较好的样本,也需要足够好的技术来提取分析出样本中的内源 DNA。另外还存在微生物和现代 DNA 污染到古 DNA 的情况,即便是国内的顶尖学者,也有过费劲心力最后发现提取出的是现代人 DNA 的经历,更不用说大部分的考古工作实际上是由各地文管所/考古所之类的机构在具体执行,同时兼有运气与实力的机构寥寥无几。总体来看,目前国内古 DNA 相关的研究工作进展还比较缓慢。
此外,由于古 DNA 的降解,测序深度往往很低,导致无法在现代人口的 Y 单倍群树上找到比较对应的下游节点。如青海大槽子 M21 断代为 68-128 calCE(距今约 1850 年前),但出土样本的 Y 单倍群类型还只能细化到形成于距今约 6500 年前的 O2a2b1a1a1a2a(在23魔方树上对应 O-F14591),对于研究历史时期的家族并无太大的价值。
而根据现代人的 Y 单倍群树分化及人群分布情况往往可以获取更多的信息(关于这部分知识可以查看往期科普文章《Y 染色体溯源》)。如 O-F8 一支在新石器时代晚期的几百年内产生了至少二三十个较大的下游分支,人口占到现代中国男性人口的 15% 以上,是新石器时代有过较大人口爆发历史的典型支系。其主要下游支系和兄弟支系 Z39974、以及上游兄弟分支 CTS4960 均在晋冀豫等中原地区富集;其下游的 CTS4658 类型,在以羌、傈僳、白、哈尼、纳西、阿昌、景颇、缅、怒、独龙、拉祜、珞巴、藏等为代表等现代藏缅语人群中占高度富集。因此无论是在分化时空,还是在民族分布上,均与考古学中的仰韶文化人群的历史流向较为一致,据此我们曾推测 O-F8 类型很可能是仰韶文化人群的重要父系类型之一。现在陆续发布的仰韶时代相关文化人群的古 DNA 证据也逐渐显现并支持此推测。
这种方法对研究历史时期的家族更为适用,我们已经在 O-F8 下游研究完成了 56 个历史时期的家族研究,其中就有大名鼎鼎的汉高祖刘邦家族。此外还有李、王、张、黄、汤、胡、朱、陆、钟、章、赵、刘、吴、秦、杨、齐、陈等 77 个研究中的家族已经找到了相应的历史文献线索,只需要进行对该家族进行父系深度测试即可确认(具体如何实现的可以参考往期文章的《家族研究其实很简单,你所缺的只是这份指南》)。
诚然古 DNA 检测结果可能是最理想的实证材料,但在古 DNA 样本匮乏或者较少的情况下,我们亦可以根据现代人口的基因分布状况,对古代社会人口的构成进行相对合理的还原推测。这种方法同样会存在一定偏差,但在缺乏其他可靠证据的时候,也不失为研究古代社会人口情况的一种好的探索和尝试。
参考文献:
河南省文化考古研究所,灵宝市文物保护管理所。《河南灵宝市晓坞遗址仰韶文化遗存的试掘》。《考古》2011年第12期。
《中国考古学·新石器时代卷》,中国社会科学出版社。
Ning C , Wang C C . Ancient Genomes Reveal Yamnaya-Related Ancestry and a Potential Source of Indo-European Speakers in Iron Age Tianshan[J]. Current Biology, 2019, 29(15).
Ning C , Li T , Wang K , et al. Supplementary Information Ancient genomes from northern China suggest links between subsistence changes and human migration[J]. Nature Communications, 2020.
Yang M A , Fan X , Sun B , et al. Ancient DNA indicates human population shifts and admixture in northern and southern China[J]. ence, 2020, 369(6501):eaba0909.