我再次利用了之前的模拟数据,构建了该模拟家系的Y树。在之前的讨论中,已经可以明确每个snp并不代表唯一的男子,而是一个男性群体(家族),他们拥有共同的snp。当然,我们也不否认这个群体可以为一个男子。这就是它固有的迷思之处:测得的snp可以确定它和谁绑定了。但它无法确定唯一性,它仅属于一个群体,而这个群体可以是唯一样本空间,也可以是多样本空间。如果是唯一样本,我们可以很肯定支系的变化;如果不是唯一样本,我们就会出现难以确定。
下面是模拟家族的Y树:
这里可以很清晰的看出白色Y的子代有8叉,它和家族的具体情况差别不小。模拟家族的实际情况是,白色Y在该家族中传递了三代,且白色Y的男子中拥有最大数量儿子的仅仅为四个。但他们展现出来的Y树支系却有8叉,即该家族白色Y拥有的那个时段的最大分叉是8。如果仅仅查看检测样本构建的树形却是5叉,绿色小三角标记的位置。
这两天得空随机设计了这个模拟家族以及snp相关和对应的Y树形,仅有一个目的,就是希望大家能够理解清楚snp和Y树之间的关系。也希望大家能够实现更为准确的预估和判断。
anycome
点赞
anycome
点赞