【转帖】我是万万没想到,诺贝尔化学奖也给了程序员。

入得谷来,祸福自求。
Post Reply
笑嘻嘻
Posts: 23416
Joined: 2003-11-22 18:00

【转帖】我是万万没想到,诺贝尔化学奖也给了程序员。

Post by 笑嘻嘻 » 2024-10-11 2:51

我是万万没想到,诺贝尔化学奖也给了程序员。

图没法转帖,大家最好还是去原地址看文章。挺有意思的,生物行业的可能更有见解。
昨天诺奖物理颁给 AI ,大家人都傻了,深度学习也是物理?
尽管有网友也想着找补点,万一今天的化学奖,颁给物理学家了呢?

结果今天化学奖出来,大家再次被惊掉下巴,没完了是吧!

没错, 2024 年诺贝尔化学奖一半授予华盛顿大学医学院生物化学教授、蛋白质设计研究所所长大卫 · 贝克( David Baker ),以表彰其在 “ 计算蛋白质设计 ” 方面的成就;

另一半则共同授予谷歌 DeepMind 首席执行官兼联合创始人德米斯 · 哈萨比斯( Demis Hassabis )和 DeepMind 项目总监约翰 · 江珀( John M.Jumper ),以表彰其在 “ 蛋白质结构预测 ” 中的贡献。

其实就是一半给了设计新的蛋白质;另一半给了我们之前唠过的蛋白质结构预测,也就是上次谷歌 I/O 大会上亮相过的 AlphaFold 。

连着两天把物理奖跟化学奖都发给 AI 相关,这诺奖咋就跟蹭上 AI 了似的,明天文学奖该不会发给 ChatGPT 吧。。。

不少网友也被这波操作闹麻了,合着宇宙尽头真是当程序员啊?

不过该说不说,虽然大伙是又被惊到,但相比昨天的物理奖,这次化学奖倒也没有太过超出圈内的认知。

毕竟诺贝尔化学奖就经常发给蛋白质方面的交叉学科,光蛋白质结构研究就给发了十几次,甚至跟蛋白质研究相关的仪器也发,比如 2017 年给了冷冻电镜。

而且颁奖之前,早在九月中旬,号称诺奖风向标的 2024 年引文桂冠奖( Citation Laureates 2024 )获奖名单里,不少权威人士就预测了这次化学奖的三个方向,排第一的就是蛋白质预测。

所以说,圈内其实是支持认可他们的工作的,虽然人家的主要业务不是这个,但是他们的研究实打实给生物化学这个领域带来了剧变。

比如这次的约翰 · 江珀就学过数学、物理学甚至凝聚态物理,博士的时候才开始做模拟蛋白质折叠,用的还是机器学习;再往早了看, 20 世纪初的时候英国物理学家卢瑟福就因研究元素和放射拿了化学奖,可见对诺贝尔化学奖来说跨界确实是传统艺能了。

不过我发现,今年这仨人里最有意思的哥们,还得是谷歌旗下 DeepMind 的老大哈萨比斯。

虽然大家可能只知道他在谷歌搞 DeepMind ,但殊不知这人跟化学不能说一点交道没有,也只能说边儿都不沾了。

因为相比别人正经科研出身,他的经历堪称魔幻。

为啥呢,这哥们可能是因为有一半华裔血统( 他妈是新加坡华人 ),从小就是个天才, 4 岁时下国际象棋就能下赢他爹跟他叔, 13 岁就当上了国际象棋大师,你就说这天资跟八冠王柯洁比起来也不遑多让是吧。

靠着在国际象棋比赛中赢得奖金, 8 岁时哈萨比斯用 200 英镑给自己买了人生中第一台计算机,开始研究编程。

不过不同于柯洁后来去读了工商管理,哈萨比斯 1992 年考进了剑桥大学计算机系,大学期间就主导过大型游戏设计,毕业以后还组建了游戏公司Elixir Studios ,走上了肖奈的路线。

这公司高峰期员工达到 60 人,做出了像 “ 共和国:革命 ” 、 “ 邪恶天才 ” 这些获奖无数的游戏。

后来他又去读了神经科学的博士,并致力于 AI 研究,创办的 DeepMind 也被谷歌收购,并在 2016 年和 2017 年推出两代 AlphaGo ,击败了李世石和柯洁,从那时开始, AI 将取代人类的声音不绝于耳。

年轻的柯洁此时还并不知道,击败他的会是诺奖得主

再后来, DeepMind 又推出了一系列跟 AI 相关的产品,像语音生成系统 WaveNet , “ 神经计算机 ” ( DNC ),智能医疗系统 DeepMind Health ,以及这次拿了诺奖的 AlphaFold 。

也就是说,哈萨比斯的人生经历跟传统科研路径是差异相当大的。话虽如此,但出成果了可不管你是啥路径。

哥们在计算机领域的突破性研究,你别看表面上跟生物化学毫不相干,但实际给这一领域带来的可不是锦上添花,而是绝对的颠覆。

我们在九年义务教育里都学过,蛋白质是生命的物质基础,生命离不开蛋白质。

而要搞清楚生物分子的底层原理,就必须知道蛋白质具体长啥样,并且知道怎么去利用,乃至创造这些蛋白质。

这么说吧,在 AlphaFold 之前,大伙预测蛋白质结构主要三种办法,一是用 X 光照蛋白质晶体,二是核磁共振 ( NMR ) 光谱,第三种则是昂贵的冷冻电镜拍照建模。

这些传统办法不仅慢,还费钱,每拍一次片子就花好几万美金,抵一辆小米 su7 。

只有那些经验丰富的老师傅、蛋白质仙人,才能更快猜到蛋白质的准确形状,少拍点片子。

所以人们就琢磨,这种需要经验总结的工作能不能靠 AI 解决呢?谷歌 DeepMind 创始人哈撒比斯和总监约翰 · 江珀就来干这事了。

他们不打算拍片子,而是选择了 AI :蛋白质既然由氨基酸构成,那只要利用各处公开的已知蛋白质结构,把这些蛋白质中每一对氨基酸的距离,链接角度,汇总起来做成一张图,再用神经网络消化完他们, AI 就能自己做出预测了。

2018 年第一代 AlphaFold 一经发布,就技惊四座,力压一众实验室老师傅,获得第 13 届蛋白质结构预测大赛 ( CASP ) 冠军。

到了 2020 年发布的 AlphaFold2.0 ,又用上了后来在 ChatGPT 上大火的 Transformer 模型,解决了蛋白质分子长距离预测的问题。

简单来说相当于从一个只会写短文的写手,进化成了能写长篇小说的作家。

因为 Transformer 模型的注意力机制,完美解决了长距离氨基酸的问题,至于进步有多大,这么说吧:

2018 年蛋白质结构预测大赛里 1.0 版本准确度得分不到 60 分,但是 2020 年大赛里 2.0 版本拿到了惊人的 92.4 分,它能生成的范围已经涵盖了人类已知蛋白质的 98% ,更重要的是它完全开源。

可以说, 2.0 版本已经基本解决了单链蛋白质的预测问题,到 2021 年,基于 2.0 改版的 AlphaFold-Multimer 发布,也支持上了多链,准确度上也取得了突破,蛋白质之间作用的预测准确率超过 70% ,能够预测超过 2 亿种、包含了几乎所有已知的蛋白质结构。

到了今年新出的 3.0 版本 AlphaFold 3 ,他们更新了一个更牛逼的全方位模型,不仅能预测蛋白质 DNA RNA 等各种小分子,还能揭示他们之间的互相作用。

这也是为啥诺奖会颁给他们的原因:

自他们取得突破以来,来自 190 个国家的 200 多万人都用上了 AlphaFold2 ,在他们的帮助下,科学家们不仅能够更加深入了解抗生素的耐药性,还设计出了可以消化塑料的酶类蛋白质。

至于本次化学诺奖另一位得主大卫 · 贝克,他的主要贡献是在蛋白质计算和设计上,开发了 Rosetta 和 RoseTTAFold 这些软件,靠这些计算机工具就能够模拟出创造生物的 “ 上帝之手 ” ,设计制造出全新的蛋白质分子。

他的团队不仅设计出了第一个自然界中根本不存在的蛋白质 Top7 ,甚至还做出了具备特殊功能的蛋白质。

比如能够自修复、自组装成纳米材料的蛋白质;还有能够将二氧化碳转化为燃料的酶;还有一些在治疗癌症、传染病等疾病方面具有巨大潜力的蛋白质抗体等等。

而它们在生物化学、医学、材料科学中的应用都很牛逼。。。所以这次,算是诺贝尔化学奖颁给生物化学研究的典型案例了。

仨大佬的这些贡献,按颁奖词里的话来说,就是 “ 没有蛋白质,生命就无法存在。我们现在可以预测蛋白质结构并设计自己的蛋白质,这给人类带来了最大的利益。 ”

所以这也是为啥大家对化学奖的争议,远没有昨天物理奖那么大的原因。

毕竟明眼人都看出来,就凭这方面的突破,唯一不确定的无非只是拿化学奖还是生理学奖而已。

总而言之, AI 的突飞猛进一定会在各个行业实现革新和改进,在委员会看来可能人工智能只算是拐杖,研究的目的和方向才是他们真正关注的东西。

但无论如何,这次诺贝尔奖也算是官宣了,不管辛顿对 “ 人工智能可能毁灭世界 ” 的担忧会不会成真,未来科技树一定会在 AI 应用这方面猛点。

至于 AI 的未来会把人类带向哪里,那也只有以后才能知道了。但就现在来说,本次诺奖的最大赢家那还得是谷歌,昨天前员工拿物理奖,今天现员工又拿化学奖,香槟连开两天了都。

而另一方面,这次诺奖也算是再次告诉我们:21 世纪是____ ( Image )

撰文:纳西
编辑:江江 & 面线 & 大饼
美编:萱萱
图片、资料来源:
中国科技网:科睿唯安公布 2024 年度 “ 引文桂冠奖 ” 名单
新华报业:诺贝尔化学奖再次垂青 AI ?这个研究领域可是得奖 “ 顶流 ” !
麻省理工科技评论:专访 DeepMind CEO 哈萨比斯:我们将看到一种全新的科学复兴
Nobelprize , Wikipedia ,微博等,图源网络

Reads 81.8k
云浆未饮结成冰

tiffany
Posts: 24804
Joined: 2003-11-22 20:59

Re: 【转帖】我是万万没想到,诺贝尔化学奖也给了程序员。

Post by tiffany » 2024-10-11 13:01

说起来吧,这个事情真的是得靠算-----上个世纪末,各种重大的物理天文发现,好多是算出来的,就是说我们对这个世界这个宇宙的宏观理解靠的是数学,那会儿也就是高等数学那点儿事儿吧?到了现在,数学理论发展到如何我(出于能力限制)不能理解,但是大方向就是,对我们来说的微观世界,所谓分子和分子之间的作用力与反作用力,就蛋白质蛋白质之间的相互作用,以及以后蛋白质与核酸之间的相互作用,也是能算出来的了。大概我们对微观世界的理解也会有突飞猛进的进步吧,希望。

蛋白质结构这个事情吧,它难解,据我粗浅的理解,主要是因为蛋白质晶体难养。因为解结构这个事情得养出来晶体,然后拍 X-光片,然后才能拆解结构。我念研究生那个时代,养出来个蛋白质结晶,把结构给算出来,这种论文就能发特别好的杂志,成为踏上 faculty 的第一步。后来我做博士后那些年,有些个解蛋白质结构的软件已经出来了,而养晶体也渐渐的没那么技术限制了,主要难点倒是给到了膜蛋白这类比较特殊的蛋白质。所谓膜蛋白是指这些蛋白是镶嵌在细胞膜里面的蛋白质,细胞膜基本结构是双层磷脂,磷脂类分子一端亲水,一端亲脂,所以放在水里,它们自发自觉地就亲水那头儿朝外跟水分子们亲密结合,亲脂那头儿就聚在一起抱团儿取暖,进而形成一层膜。想象一下儿天地玄黄宇宙洪荒,还没有生物的时代,这种磷脂膜也不知道为啥就形成了,形成了以后也不知道为啥里面就包上了一堆东西,并给里面包住的东西提供了相对稳定的环境,然后这一堆东西就发展出来结构,形成了,细胞。所以细胞膜的主要作用是给里面的结构提供一个房子,然而所谓房子,得有门窗,那膜蛋白的作用就类比门窗----把想放进来的东西放进来需要扔出去的东西扔出去。所以,这种蛋白质难以养出来晶体的一个重大原因就是它既有亲水的部分也有亲脂的部分,所以养晶体的条件就很,难摸。闲话毕。

广义的 AI 这个东西吧,也是根据我粗浅的理解,其实蛮早就应用于制药业了。就,药厂研发的一部分是发现新的有可能拿来治病的新的分子。这个东西早期的时候是根据既有的药物分子的结构,或者是根据药物靶点(通常是某个蛋白质的某个位置)的结构,看看哪个新的小分子,有类似已有药物分子的结构,或者说能跟靶点相互作用。石器时代的化,这些事情是手工操作的;电脑时代以后,这个过程很大部分被电脑接替。AI 时代的化,这个过程应该是无限优化了吧,不过无论算得如何的好,始终还是要回到实处:就是各种前期实验,以及最后最花钱的临床实验。自己设计蛋白质这个事情吧,我觉得是从小分子往大分子设计方向迈进了一大步-----这个也是技术到了,以前合成给蛋白质各种麻烦,现在这个过程已经工业化了,要是蛋白质生产不能工业化,这个技术其实也没有需求,所以说啊,我越老越觉得所谓科技的进步是工业需求推动的,所以要搞科技,得去工业发达的国家,不然自己关在实验室里搞发明创造就很没有前途那个样子。但是还是跟之前说的一样,这个东西还是要回到其应用环境,理论上应该是生物体,这个是个非常复杂的系统,因为毕竟没有啥细胞功能是靠两个蛋白相互作用就达成了的,而一般来说,一个蛋白质发挥作用还经常需要跟别的蛋白(们)组成一个更大的复合体,这个复合体组成的结构又是另外一捆巨大的算数。说起来,当年我坚定坚决的远离生物化学的一个重要原因是,好吧,当初研究生院要考试,我们一群人就聚众复习功课,其中一个大牛就很特立独行的在钻研论文,钻研了半天,跟我们说,这个文章有问题,问题在哪儿呢?在于这个蛋白质复合体的组成顺序应该是蛋白质一跟蛋白质二结合再跟蛋白质三结合;而非该文章说的,蛋白质二跟蛋白质三结合再跟蛋白质一组合。我当时听得两眼发黑,当即决定我的人生不应该化在谁先跟了谁这种问题上,就远离了任何跟生物化学,蛋白质,沾边儿的研究课题。

不论如何,发展到了现在,科技终于进步到了可以算蛋白质的境界,我等着它继续发展到真的能算神经网络。生而为人,我还是挺,与有容焉的,复杂难解的问题,一代一代人积累下来,最终还是能解的。
乡音无改鬓毛衰

tiffany
Posts: 24804
Joined: 2003-11-22 20:59

Re: 【转帖】我是万万没想到,诺贝尔化学奖也给了程序员。

Post by tiffany » 2024-10-11 13:18

又,其实这么发展下去,再过若干代人,humanoids 能造出来是可以预期的。到时候大概又得定义下儿“人类”了。
乡音无改鬓毛衰

tty
Posts: 341
Joined: 2003-12-17 13:51

Re: 【转帖】我是万万没想到,诺贝尔化学奖也给了程序员。

Post by tty » 2024-10-12 23:14

笑嘻嘻 wrote:
2024-10-11 2:51
我是万万没想到,诺贝尔化学奖也给了程序员。

图没法转帖,大家最好还是去原地址看文章。挺有意思的,生物行业的可能更有见解。


他的团队不仅设计出了第一个自然界中根本不存在的蛋白质 Top7 ,甚至还做出了具备特殊功能的蛋白质。

比如能够自修复、自组装成纳米材料的蛋白质;还有能够将二氧化碳转化为燃料的酶;还有一些在治疗癌症、传染病等疾病方面具有巨大潜力的蛋白质抗体等等。

:worthy: :worthy:
这是啥,这不就是巫师嘛。。。 :-P
格格巫也是在罐子炉子前面忙忙碌碌,然后合成各种神奇的。。。potion。。。
化学奖给(现代最厉害的)巫师名至实归,没毛病。。只不过人家的神秘法宝是AI嘛。。

笑嘻嘻
Posts: 23416
Joined: 2003-11-22 18:00

Re: 【转帖】我是万万没想到,诺贝尔化学奖也给了程序员。

Post by 笑嘻嘻 » 2024-10-15 21:41

读了小白的长贴,我震惊道:蛋白质可以工业生产了?

关于物理学我有个感想:就是在工业没跟上能够证明或证伪现在提出的理论之前,还是工程师比科学家有职业前途。 :mrgreen:
云浆未饮结成冰

tiffany
Posts: 24804
Joined: 2003-11-22 20:59

Re: 【转帖】我是万万没想到,诺贝尔化学奖也给了程序员。

Post by tiffany » 2024-10-16 7:07

当然可以啦,不然你以为那些生物公司都在做啥?!当然就算是量产,也没有到日用工业品那个产量,但是,那也是量产啊。
乡音无改鬓毛衰

笑嘻嘻
Posts: 23416
Joined: 2003-11-22 18:00

Re: 【转帖】我是万万没想到,诺贝尔化学奖也给了程序员。

Post by 笑嘻嘻 » 2024-10-16 19:14

量产来蛋白质干啥用啊。
云浆未饮结成冰

tiffany
Posts: 24804
Joined: 2003-11-22 20:59

Re: 【转帖】我是万万没想到,诺贝尔化学奖也给了程序员。

Post by tiffany » 2024-10-17 7:08

我知道的,当然是做药啊。现在一堆抗癌药是蛋白质,双抗体,三抗体,什么什么的。
乡音无改鬓毛衰

Post Reply