香菜喜好
香菜,学名芫荽,一种调味蔬菜,多用于提味。有人爱之入骨,有人避之不及,但其实,喜不喜欢香菜也可能与基因有关。
检测结果
通过预测模型计算出 3 组基因结果,分段长度代表每组结果的人群占比。
你喜欢香菜的可能性高
喜欢香菜的人可能有哪些特征?
23魔方研究所的相关研究发现,喜欢香菜的人可能具有如下的一些特征。
香菜,学名芫荽,一种调味蔬菜,多用于提味。有人爱之入骨,有人避之不及,但其实,喜不喜欢香菜也可能与基因有关。
通过预测模型计算出 3 组基因结果,分段长度代表每组结果的人群占比。
你喜欢香菜的可能性高
23魔方研究所的相关研究发现,喜欢香菜的人可能具有如下的一些特征。
* 该结果来自于23魔方研究所,仅基于23魔方的用户样本。
* 该结果来自于23魔方研究所,仅基于23魔方的用户样本。
* 该结果来自于23魔方研究所,仅基于23魔方的用户样本。
香菜,一种天生具有话题度的食物,有人爱之入骨,而有人却避之不及。同样都是香菜,评价却天差地别,其实是由于个体基因在其中有一些影响。
研究发现,嗅觉相关基因的变异可能会使嗅觉对醛类物质异常敏感。香菜中含有约 40 种化合物,其中 82% 是醛类物质。醛类物质的味道大致可分为两种味道,甜味和肥皂味。因此,在嗅觉上对醛类敏感的人来说,闻到香菜就可能会感觉菜肴像是加了肥皂一般,自然成为了「香菜绝缘体」。
很多人小时候很讨厌吃香菜,饭菜中沾一点香菜味都不行。但长大后,却慢慢喜欢上吃香菜,这是为什么呢?
其实这一现象也和嗅觉有关,有研究表明,嗅觉的敏感度会随着年龄的增长而降低。
小的时候,嗅觉相关基因的变异可能使我们对于醛类物质的「肥皂味」异常敏感,而长大后,由于嗅觉退化的原因,我们对一些刺激性的味道也开始变得宽容,也可能由此「叛变」为喜欢吃香菜。
我们的检测是使用极少量 DNA 来检测 70~80 万位点,受检测技术限制会有约 1% 的位点(预计 7~8 千个)无法检出。并且这些位点随机分布,可能会落在用于解释项目结果的位点中,从而影响您此项目的检测结果。
结合研究所问卷收集的数据和签署研究知情同意书的研究志愿者基因数据,研究人员利用计算生物学、机器学习方法,来寻找和性状相关的基因位点,并据此构建预测模型。
研究人员会在研究所持续收集数据来不断校验并优化预测模型。随着数据规模变大,模型获得更充分的校正和验证,此时它会被呈现在正式报告中。
*研究所致力于发现基因和环境对个体在更多方面的具体影响,诚邀并感谢大家参与研究问卷填写。
感谢你参与23研究所此项目的问卷调查,特发荣誉证书。
证书请登录APP查看。
我们在23魔方研究所中收集了香菜喜好程度相关的问答「你讨厌香菜的味道吗」,并选取 18~70 岁样本,去除选择「不确定」的个体;同时为了避免「说不上讨厌或喜欢」的中立回答对后续分析产生影响,也将此选项群体排除在分析外。
最终,为了保障样本量的充足,我们将选择「很喜欢」及「比较喜欢」的人群归为一类作为 Control 组(喜欢香菜),「很讨厌」及「比较讨厌」一类作为 Case 组(不喜欢香菜)。
我们基于上述筛选后的样本及其对应的基因芯片数据,在同时校正年龄和性别的前提下选取了与香菜喜好程度最相关的遗传标记。
根据这些遗传标记和基因性别,我们使用机器学习和大数据统计的方法对训练样本和验证样本构建预测模型,选择出最优的基因分数模型,并在全新的测试集合中测试模型性能(如下)。
上图为香菜喜好的基因分数在测试集的不喜欢香菜人群(Case,橘红色颜色表示)和喜欢人群(Control,淡蓝色颜色表示)中的分布情况。其中纵轴为基因分数。
现阶段根据基因对于香菜喜好的准确预测难度很大,直接根据基因和性别给出是否会喜欢香菜并不合理,而基因对于香菜喜好的影响更多表现为一种明显的倾向性。
为了给出更准确的倾向结果,我们对前面得到的连续数值的基因分数进行离散化分割,最终将基因分数转变为 3 个分箱,计算每个分箱中实际的香菜喜好的比例。
在预测时我们将你的基因分数对应到相应的分箱中,得到你的香菜喜好倾向性;同时展示其他与你基因相似的人的香菜喜好情况分布,并在验证数据集中充分验证了分箱规则的稳定性。
上图,不喜欢香菜(Case,淡蓝色颜色表示) ,说不上讨厌或喜欢(Other,土橘色表示),和喜欢香菜(Control,橘红色颜色表示)。
随着分箱组别上升,不喜欢香菜的基因分数随之上升。可以看到不喜欢香菜的占比呈递增趋势。
研究的过程中发现,研究结果与其他研究得出的遗传标记有相近的基因座,且同样也无法单独根据基因实现高精确的预测。这可能源于 GWAS 传统方法本身的局限性有关,故暂时未能挖掘到更好的结果,也可能受限制于其他组学以及后天环境,例如生活环境的影响以及年龄差异。
此外,在最后的分箱结果中,我们也发现与其维持中立,选择「说不上讨厌或喜欢」的群体占比会随着不喜欢香菜的分箱组别升高而升高,因此推测这一类别在后续研究中或许可以考虑划归于不喜欢香菜的群体。我们也将在后续的研究中继续探索。
通过预测模型共计算出 3 个结果。在和你相同基因结果的23魔方用户(第 1 组)中,有 65% 的人喜欢吃香菜。
喜欢吃香菜
说不清楚喜欢或讨厌
讨厌吃香菜
样本数26137
研究进展中的项目预测结果是通过大数据建模得到的,而 AUC (Area under curve) 是机器学习中评价模型综合性能的常用指标,通常在 0.5~1 之间。
AUC 越高,表示预测模型的整体性能越好。
AUC 与准确率 (Accuracy) 的区别在于,AUC 需同时考虑对于阳性(患病)和阴性(未患病)的准确率。
举个例子:如果一个患病率为 1% 的病,只要预测所有人都不患病,那么准确率也达到了 99%。但这只考虑了阴性情况,这并不能说明预测模型的整体性能好。
因此,用准确率来评判预测模型较为片面,AUC 能更好的评价模型的好坏。