基因身高
在 20~40 岁时,人体的身高基本达到最高,且不再变化。基因身高排除了环境因素的影响,推测基因如何影响你的身高倾向。
检测结果
更可能接近男性平均身高
* 平均身高为 175cm,出自「23魔方在线研究」男性样本
哪些健康的生活方式有助于长高?
实际身高是由基因和外部环境共同影响决定的,其中环境的影响约占 20%~40%。
如果你正处在生长发育期,选择健康的生活方式能帮助你长得更高。
根据23魔方在线研究及相关文献资料,以下健康的生活方式与身高相关:
在 20~40 岁时,人体的身高基本达到最高,且不再变化。基因身高排除了环境因素的影响,推测基因如何影响你的身高倾向。
更可能接近男性平均身高
* 平均身高为 175cm,出自「23魔方在线研究」男性样本
实际身高是由基因和外部环境共同影响决定的,其中环境的影响约占 20%~40%。
如果你正处在生长发育期,选择健康的生活方式能帮助你长得更高。
根据23魔方在线研究及相关文献资料,以下健康的生活方式与身高相关:
相关数据:相比 10~18 岁期间以素食为主的人,以肉食为主的人约高 2~3cm;而每周饮用乳制品 5~7 天的人相比几乎不喝的人约高 3~4cm。
相关数据:10~18 岁期间每天夜间平均睡眠时长在 5 小时以下的人,比 8 小时以上睡眠充足的人约矮 2~4cm。
相关数据:18 岁前有过严重精神创伤的人,身高约矮 1~2cm。
相关数据:排除锻炼的类型,10~18 岁期间每周锻炼 3 天以上的人,相比几乎没有体育锻炼的人约高 1~3cm。
我们的检测是使用极少量 DNA 来检测 70~80 万位点,受检测技术限制会有约 1% 的位点(预计 7~8 千个)无法检出。并且这些位点随机分布,可能会落在用于解释项目结果的位点中,从而影响您此项目的检测结果。
结合研究所问卷收集的数据和签署研究知情同意书的研究志愿者基因数据,研究人员利用计算生物学、机器学习方法,来寻找和性状相关的基因位点,并据此构建预测模型。
研究人员会在研究所持续收集数据来不断校验并优化预测模型。随着数据规模变大,模型获得更充分的校正和验证,此时它会被呈现在正式报告中。
*研究所致力于发现基因和环境对个体在更多方面的具体影响,诚邀并感谢大家参与研究问卷填写。
感谢你参与23研究所此项目的问卷调查,特发荣誉证书。
证书请登录APP查看。
1. 通过23魔方在线研究收集身高相关数据
23魔方在线研究的多个问卷中设计有身高和体重相关的问题。我们整合了所有的回答,选取年龄处于身高稳定期的样本,并排除BMI相较于中国人可能异常的数据(BMI ≤ 12 kg/m2 或 BMI ≥ 45 kg/m2)。
2. 构建基因身高模型
我们基于上述筛选后的样本及其对应的基因芯片数据,选取了超过300个与身高可能相关的遗传标记。根据这些遗传标记和性别,我们使用机器学习方法对11,000训练样本的身高进行拟合,构建出基因身高分数模型,并在全新的测试集合中测试模型性能(图1)。
图1. 基因身高分数模型在测试集合中的表现(r2 = 0.54, MAE = 4.5 cm)。其中横轴为基因分数,纵坐标为实际身高(cm)。
3. 汇总你的基因身高倾向
在仅仅考虑基因的情况下,预测具体的身高数值并不合理,而基因对身高的影响更多表现为倾向性。
为了给出更准确的倾向性结果,在男女两个性别中,我们分别将基因分数以连续整数进行分割,并计算每个分箱对应的实际身高分布以及高于、低于或接近于相应性别平均身高的概率。最终,我们将你的基因分数对应到相应的分箱中,从而给出你的基因身高倾向性结果。同时,我们也给出了每个分箱对应实际身高的分布情况,帮助你更好地了解其他你身高基因相似的人的实际情况。
4. 后天因素
基因能够对身高造成的影响有限,后天的诸多因素会使你实际身高与基因带来的倾向性有所偏差。
为了尽可能详尽地给出哪些因素可能导致偏差,除了参考相关的文献,我们根据23魔方在线研究中的“影响身高的后天因素”问卷,对其中的在身高发育期间可能起较大作用的几个环境因素在校正年龄和性别后进行分析,计算其对实际身高影响值的95%置信区间,并呈现在你的报告中。
参与了研究的用户中,和你基因结果相同的用户实际身高情况如下。
180cm以上
175cm~180cm
170cm~175cm
165cm~170cm
160cm~165cm
160cm以下
研究进展中的项目预测结果是通过大数据建模得到的,而 AUC (Area under curve) 是机器学习中评价模型综合性能的常用指标,通常在 0.5~1 之间。
AUC 越高,表示预测模型的整体性能越好。
AUC 与准确率 (Accuracy) 的区别在于,AUC 需同时考虑对于阳性(患病)和阴性(未患病)的准确率。
举个例子:如果一个患病率为 1% 的病,只要预测所有人都不患病,那么准确率也达到了 99%。但这只考虑了阴性情况,这并不能说明预测模型的整体性能好。
因此,用准确率来评判预测模型较为片面,AUC 能更好的评价模型的好坏。