中国苗族群体父系单倍群及民族血统构成情况简介
苗族是我国人口第四大少数民族,总人口为 942 万,使用语言为苗语,属汉藏语系苗瑶语族苗语支,分湘西、黔东和川黔滇三大方言。苗族的世居地主要分布于湘鄂黔渝交界的武陵山区及其毗邻的黔东南的苗岭、月亮山;黔南的大、小麻山;广西的大苗山;滇黔川渝交界的乌蒙山等广大区域,此外在东南亚的老挝、越南、泰国等国家和地区也有一定比例的人口分布。
23魔方祖源研究部对祖源数据库中的苗族群体的父系单倍群数据做一轮清洗和统计,以高区分度的视角下看我国苗族群体的父系类型以及民族血统的构成情况。
统计对象:民族问卷栏目中填写为「苗族」的样本。
数据清洗方法:对所有填写为「苗族」的样本进行基因关系计算,如果样本出现了 2-3 级基因关系亲属对的,则选择保留其中的一个男性样本;如果出现的 2-3 级基因关系亲属,民族为非苗族族的,则视为有晚近的跨民族通婚,则剔除此样本。由此获得了排除近亲关系,无晚近跨民族通婚历史的苗族男性样本 329 个(其中贵州苗族 123 人、湖南苗族 112 人、其他地区苗族 94 人)。以此口径进行统计。
统计结果如下:
一、苗族的民族血统构成情况:(%)
可以看到苗族群体的民族血统成分中,前三位的成分分别为近乎一半比例的南方汉族成分;五分之一以上的苗族成分和近乎八分之一的北方汉族成分,其构成情况与苗族所处的地理位置高度吻合。
二、苗族群体的父系单倍群构成情况:
我们对这 329 名男性苗族的父系单倍群类型进行了统计,发现 329 个样本分成了 203 个父系类型,父系单倍群多样性非常高。
其中 O2a1b2a1a1a1a2a1a2a-N5 类型(含下游)占到了苗族群体人口的 10.64%,为苗族群体的最大的父系类型。根据23魔方的研究显示,该类型的最近共祖时间约在 2960 年前(西周时期),人口占到中国男性总人口的 0.39%,主要分布于贵湘川渝等中西南省市。该类型可以占到贵州当地人口的 3.26%、湖南 1.77%、重庆 1.11%、四川 0.80%。连续高频分布地带位于湘西到黔东北、黔东南、黔南一带,其中在黔东南地区该类型可以占到当地人口的 13.3%。
第二高频的类型为 C2b1b2a-CTS10923 类型(含下游),占到了苗族群体人口的 6.99%。尤其是 C2b1b2a1a2a-F9533 下游,最近共祖时间约在 4260 年前,人口占到了中国男性总人口的 0.69%,主要分布于贵鄂湘川渝等中西南省市。该类型可以占到贵州当地人口的 3.20%、重庆 2.66%、湖北 2.39%、四川 1.74%、湖南 1.73%。连续高频分布地带位于武陵山区,其中在恩施、铜仁、湘西等地区该类型可以占到当地人口的 12%~13%。该类型是武陵山区四千年来最重要的父系类型之一,除在苗族广泛分布外,在当地的汉族、土家族、侗族等民族中也广泛分布。据23魔方之前的研究,中西南的田、向、冉、杨等世居家族均属于该类型。
除上述 2 种类型外,还有如下几种类型在苗族群体中也占比较高:
C1a2a-AM00848 类型,占到了苗族群体人口的 2.13%。该类型的最近共祖时间约在 3940 年前,人口占到中国男性总人口的 0.19%,主要分布于贵桂川渝等中西南省市。该类型可以占到贵州当地人口的 0.74%、广西 0.68%、重庆 0.64%、四川 0.67%。在黔南、湘西、百色、河池等地区该类型可以占到当地人口的 2.5%~3.5%。
D1a2a1a-Z41068 类型,占到了苗族群体人口的 3.04%。该类型的最近共祖时间约在 3580 年前,人口占到中国男性总人口的 0.37%,主要分布于桂贵湘粤川渝等中西南省市。该类型可以占到广西当地人口的 3.35%、贵州 1.21%、湖南 0.99%、广东 0.97%。在梧州、河池、贵港、湘西、桂林等地区该类型可以占到当地人口的 4%~9%。
O-Z23327 类型,占到了苗族群体人口的 1.52%。该类型的最近共祖时间约在 2960 年前(西周时期),人口占到中国男性总人口的 0.19%,主要分布于贵云桂川等中西南省市。该类型可以占到贵州当地人口的 1.50%、云南 1.15%、广西 0.90%、四川 0.33%。在德宏、大理、安顺、保山、黔东南、毕节、普洱等地区该类型可以占到当地人口的 2.5%~5.5%。
O-Z23392 类型,占到了苗族群体人口的 2.74%。该类型的最近共祖时间约在 4920 年前,人口占到中国男性总人口的 0.81%,主要分布于湘川渝粤桂贵赣等中西南省市。该类型可以占到湖南当地人口的 2.67%、重庆 2.26%、四川 2.07%、广东 1.83%、广西 1.76%、贵州 1.39%、江西 1.24%。
O-SK1627 类型,占到了苗族群体人口的 2.43%。该类型的最近共祖时间约在 3730 年前,人口占到中国男性总人口的 0.18%,主要分布于贵桂湘川渝云等中西南省市。该类型可以占到贵州当地人口的 1.57%、广西 0.52%、湖南 0.44%、四川 0.41%、云南 0.41%、重庆 0.25%。在黔东南、黔南、防城港、普洱、河池等地区该类型可以占到当地人口的 2.1%~2.8%。
O-SK1636 类型,占到了苗族群体人口的 2.13%。该类型的最近共祖时间约在 1480 年前,人口占到中国男性总人口的 0.026%,主要分布于贵湘甘川渝云等中西南省市。该类型可以占到贵州当地人口的 0.25%、湖南 0.14%、甘肃 0.13%、四川 0.05%、云南 0.04%、重庆 0.09%。在湘西、铜仁等地区该类型可以占到当地人口的 2%~3%。龙姓占到该类型人口的 21.74%,其下包含了一支湘黔苗族龙氏家族。
此外,N-CTS4714、O-FGC61103、O-F789、O-CTS5492、O-F813、O-SK1730 等类型在苗族群体里也占有一定的比例。
附图:苗族群体父系总体构成情况