20年前,基因学家就一直在打赌人类拥有多少基因,赌注从几万个到几十万个不等。如今,掌握了真实数据的科学家仍无法就这一数量达成一致。填补这一空白的最新努力利用了来自上百个人类组织样本的数据,并于日前发表在生命科学领域的预印本服务器BioRxiv上。它包括近5000个此前未被发现的基因,其中近1200个携带制造蛋白质的指令。2.1万个蛋白质编码基因的总数和此前估测(认为这一数字在2万左右)相比有大幅提高。
基因数量依据被分析的数据、利用的工具以及剔除错误信息的标准而有所不同。最新计数利用了一个更大的数据集、另一种不同于此前努力的计算方法,以及定义基因的更宽泛标准。不过,很多遗传学家仍不相信所有最新提出的基因都能经得起仔细推敲,需要更多证据以确信最新目录的准确性。他们的批评强调了辨别新基因甚至定义一个基因的难度。