最近比较忙,有一两个月没有更新博客内容,统一回复几个相关帖子。
在尚未报道任何东方古人基因组的年代,基因人王冰就已经推测并指出,O-M117所标记的史前人群与西北地区的戎狄族群有关,并与新石器时代的北方彩陶文化和青铜时代早期的花边罐文化因素的扩散密切相关。近些年西北地区和彩陶文化相关的古人基因组数据,初步证实了基因人王冰的推测。
O-M117的众多分支中,O-F17158尚未报告于任何古人基因组中,本文略作讨论。全球最早发现的O-F17158为来自千人基因组计划(1KG)报道的日本东京样本NA19086,该样本与东亚大陆当前样本的最近共祖年代估算大约在距今2750年前,也即弥生人东渡日本的年代,可见这一2750年前的第一位家族男性始祖,大概率生活在距离朝鲜半岛不远的区域,也即最似史料中记载的秽貘系统族群。至于某些网友推测由江浙百越东渡日本的可能性,基因人王冰认为可能性微乎其微,因为当前报道的长江流域新石器期古人基因组以O-M119等高频,尚未见任何M117+样本,而与日本和江浙样本同属于该家族后裔的还有陕西等北方地区样本,北人南下无疑。史料线索也给出了类似的证据,浙江《沈氏族谱》中记载,季聃为受姓祖,食采於沈(今河南汝阳县),以国为姓。考虑到浙江簇最近的亲戚来自北方蒙古族样本,共祖约730年,其家族南下的年代甚至还可能更晚。
笔者基因人王冰本人也属于O-F17158家族,与笔者及父亲是全球范围内可查询的第二第三例O-F17158样本,数据取自于自测的低深度全基因组样本(技术路线对标国际著名的1KG数据库),测序平台为Illumina X Ten。当然,这里需要特别指出的是,O-F17158家族是一个非常不规范的说法,Isogg官方的命名为O2a2b1a1a1c1b1,只是因为yfull等知名数据分析平台将该簇用F17158作为代表性marker。然而,事实上,基因人王冰父子在17158位置未携带突变,属于O2a2b1a1a1c1b1*,实际的树型可更正为如下图所示:
基于Illumina X Ten平台的低深度二代测序(NGS)数据,很多网友持怀疑态度,更有缺乏常识的小白网友说低深度全基因组数据不是高通量测序。事实上,NGS数据的准确率是非常高的,单个碱基读取的准确率在99.9%以上,也就是说,尽管基因人王冰的样本在O2a2b1a1a1c1b1单倍体群被定义的2个位点中,只有2个reads的碱基读取,但它们被测错的可能性只有千分之一的概率,两个位点同时测错的可能性更似微乎其微。这里可以拿本人已经公开的样本作为一个案例,欢迎各位网友验证分析。
比如,有网友说基因人王冰的样本实际分型与浙江簇属于一支。
或者其他猜测也是错误的。
事实上,浙江簇所属于的O-F15367的等价突变中,基因人王冰所有覆盖到的7个位点的读取结果均为阴性,即可以完全排除O-F15367的可能性,更不可能与浙江簇等样本同属一支了。相反,代表着5000多年前就已经分离的O-F17158旁系始祖支系,这一点也侧面进一步印证F17158+的北方戎狄系统族群起源的判断是可靠的。具体数据如下:
部分位点的BAM测序数据Samtools读取结果如下图:
这一分型结果,可以得到父亲测序数据的进一步支持,父亲的F17158测序结果同样为阴性去,且其下游O-F15367的同级突变位点覆盖12个,结果同样均为阴性,分型结果非常可靠。
另外,theytree平台系统处理古人基因组等低深度全基因组数据的急需尽快优化,基因人王冰此前就指出其对蒙古国古人样本的分型有误,其后,该平台修改了错误。这里,基因人王冰父子的分型同样是错误的,请管理员核实并勘误。
编辑“戎狄杂考:古羌系统O-F17158家族发育树探讨与纠错!”
魔方寻源
1 赞