“通过我的说明,大家理解了蛋白质的含义,以及在物理尺度上究竟有多么微小,还有数量究竟有多么夸张,现在将问题拉回到AlphaFold2这个人工智能系统上。”安无恙开始收束话题。
“谷歌公司正在用AlphaFold2人工智能系统攻克整个蛋白质信息库,这个所谓的蛋白质信息库中大概有2.8亿条蛋白质的序列信息,目前这个人工智能系统已经攻克了超过2亿个蛋白质三维结构信息的预测。”安无恙说明着人工智能系统AlphaFold2的夸张战绩。
“至于为什么只做了2亿多个蛋白质的预测,答案很简单,因为剩余的序列要么太短,要么属于冗余序列,不太具备研究价值,所以被AlphaFold2给筛选去掉而已。”安无恙说明。
“这是什么概念呢,我用大家更容易理解的方式说明。”安无恙试着用更简单的方式说明人工智能系统在医药领域中的重要性。
“在这个【国际蛋白质结构预测大赛】中,它的题库包含了两亿多道题目,每一次大赛只需要取出来几道题或者是几十道题让参赛选手做题,如果是传统的人工分析方式,比如说通过X射线晶体衍射、核磁共振、冷冻电镜等等解题方式.”安无恙稍微停顿了一下。
“通过这些方式分析复杂蛋白质的三维结构信息,哪怕只分析一个复杂蛋白质,那也需要几个月的时间。”安无恙叹气。
“正是因为如此,每一届大赛只需要分析几个复杂蛋白质或者是几十个简单蛋白质的三维结构信息,从而避免出题者都没时间研究正确答案。”安无恙调侃。
“然而谷歌公司的AlphaFold2人工智能系统就打破了传统的局限性,这一个大赛对它来说,那已经成了它的玩具,因为它已经攻破了这个大赛的所有题库,这个大赛对它来说没有任何意义。”安无恙叙述AlphaFold2人工智能系统的强大。
“如果没有意外的话,谷歌公司的这个AlphaFold2人工智能系统,极有可能会获得诺贝尔级别的奖项,可能是化学奖,也有可能是医学奖。”安无恙补充。
“另外,地球上的蛋白质种类有十亿甚至是百亿千亿的数量级别,如果让人类慢慢一个一个研究,那要研究到什么时候?”安无恙说着相关前景。
“但若用这个AlphaFold2人工智能系统,那就可以更轻松的研究蛋白质,从而在更底层的逻辑上研发医药项目。”安无恙说明蛋白质和医药领域的关联。
内容未完,下一页继续阅读