12/30/2020

同一家族内部父系单倍群类型竟然普遍不一致?

截至目前已有约 4.4 万用户填写了家族溯源问卷,这 4.4 万人中,58.13% 为男性,41.87% 为女性,近乎 100% 的用户都填写了自己的出生地,92.66% 的用户填写了自己父亲的出生地,71.99% 的用户填写了自己爷爷的出生地,但只有40.35% 的用户能够填写字辈,27.45% 的用户清楚自己的父系家族祖先从何处迁到目前的籍贯地,仅有 7.19% 的用户填写了家谱中能追溯到春秋战国时期(姓氏产生)以来最早的男性祖先姓名。

认领家谱的用户相对较少,排除掉一人认领多部家谱的用户后仅有 9123 人,其中 59.98% 为男性,40.02% 为女性。而所有用户中,女性用户占比为 54%,经过统计检验可发现在认领家谱以及填写家族溯源问卷上,男性的积极性是显著高于女性的。

我们对用户认领家谱的情况以及用户填写的家族溯源问卷进行了进一步的统计分析,发现认领同一家谱或称源于同一祖先的用户中普遍呈现出了一定程度的父系单倍群类型多样性,由于女性没有 Y 染色体,无法通过 Y 单倍群类型评估其父系单倍群类型的多样性,因此仅对剩余的 6 成男性填写的家族溯源问卷以及家谱认领情况进行分析。

男性用户认领家情况族统计分析

排除亲缘关系后有 4760 名男性认领了 3147 个家族,有 912 个家谱有 2 名以上的男性用户认领。我们对认领同一个家谱的用户单倍群类型进行统计,记录分化时间超出秦汉时期的单倍群类型及人数,发现这 912 个家谱中仅其中有 6.25% 的家族只由同一单倍群类型的用户认领,93.75% 的家谱有至少两种不同单倍群类型的用户认领。

我们将认领同一家谱的单倍群种类和最大单倍群人数占比作为评估同一家谱父系单倍群类型多样性的参考指标。结果发现平均认领同一家谱的男性单倍群种类为 2.6 种,最大单倍群人数占比均值为 46.32%,反映出同一家谱下的男性父系单倍群存在多样性是一种常态。

这种多样性在认领人数较多的家族中体现得尤为明显:

微信图片_20201230145004.jpg除「广西壮族自治区韦氏」家族父系单倍群类型相对较为单一外,认领男性数超过 10 人的大家族都呈现了较高的父系单倍群类型多样性,最大的单倍群类型人数占比也不超过 20%。 

男性用户填写的春秋战国后最早男性祖先姓名情况族统计分析

排除亲缘关系后,有 21557 名男性填写家族溯源问卷,2058 人填写了「家谱中能追溯到的「春秋战国时期之后」的最早男性祖先姓名」。有两人及以上用户填写名字相同的先祖姓名有 206 个,由于人数较多,此处仅列出填写最多的「Top10」。我同样将填写同一先祖的男性用户单倍群种类以及最大单倍群人数占比作为衡量多样性的参考指标,并关注填写同一先祖用户姓氏的总体种类以及填写同一祖先用户中第一大姓的姓氏、人数以及占比情况。【我们对同一人的不同称呼进行了整合,如「孔子」、「孔丘」均代指孔子,在统计时均计到「孔子」一条下,另外如「萧」、「肖」这类两姓主要由繁简不同引起的姓氏差异,均会被整合到一起】

捕获.jpg

填写同一先祖的用户中,第一大姓人数占比均值为 86.56%,反映出大部分用户认知中的名人先祖,可能都是根据自己现在的姓氏对应到历史上的同姓名人,这部分名人「后裔」的单倍群类型约高达 18.1 种,最大单倍群人数占比均值仅为 13.33%,比同一家谱下的父系单倍群多样性高得多。

「姜子牙」是个例外,其余 31 个填写「姜子牙/姜尚/姜太公/吕尚」的用户,有高达 17 种不同姓氏(袁义达所著《四百大姓》中,有 64 个姓氏都有出自「姜氏」的来源传说),这部分用户可能并没有仔细看我们问卷中的问题,「姜子牙」已是商末周初的人物,明显不符合问卷「春秋战国时期之后」这一要求,予以排除。

同一先祖或同一家族后裔中呈现父系单倍群类型多样性是一种普遍存在的情况,除去部分攀附联宗的「误认」外,如「孔孟曾颜通天谱」等谱尊「孔子」、「孟子」等先贤为先祖的,更多是基于文化上的心理认同形成的,单倍群自然也不限于某一类型。此外尽管被认领的家谱大多有始祖、始迁祖姓名、生平、堂号、字辈等信息,但亦无法排除有用户不清楚自己家族的信息,仅根据地域和姓氏一致就进行认领的情况,这可能也是导致认领同一家谱的用户单倍群呈现多样性的原因之一。除去上述因素,历史上亦有众多过继、抱养等情况,种种因素的叠加导致了今天呈现出的这种单倍群多样性。造成同一家族内部单倍群多样性的具体原因大多已经湮灭在了时间的长河中,但在基因上的痕迹却以另一种形式保留了下来。