17610006179
合肥海立德出版咨詢有限公司
Beijing RuiGe Publishing consultation co., LTD
天道行事 厚德品人(rén)
HEAVEN TAK GOODS PEOPLE ACT
新聞動态
News Information
您現在的(de)位置:

中國科技互聯網企業首次!百度以第一完成單位登頂Nature
發布時(shí)間: 2023-06-10 | 次浏覽 | 分(fēn)享到:

  文|《中國科學報》記者 趙廣立

  近日,國際頂刊《自然》雜(zá)志發表了(le)百度在生物(wù)計算(suàn)領域的(de)突破性研究成果,并以“加速預覽”(Accelerated Article Preview,AAP)形式快(kuài)速發表。

  這(zhè)“待遇”與當初DeepMind提出AlphaGo、AlphaFold2時(shí)相同。

  論文提出mRNA序列優化(huà)算(suàn)法LinearDesign,對(duì)生物(wù)醫學領域意義深遠(yuǎn)。這(zhè)是中國科技互聯網企業首次以第一完成單位的(de)身份發表論文于《自然》正刊,也(yě)是AI應用(yòng)于mRNA領域首篇CNS正刊論文。

  這(zhè)項研究由百度主導,并與論文合作單位斯微生物(wù)公司等共同完成。近期,百度生物(wù)計算(suàn)團隊接受媒體采訪對(duì)這(zhè)一成果作了(le)解讀,并披露成果背後的(de)故事。《中國科學報》擇其精要,特整理(lǐ)如下(xià)。

  《中國科學報》:

  能夠在《自然》正刊發論文,大(dà)家都好奇你們做(zuò)了(le)哪些研究,做(zuò)出了(le)什(shén)麽成果?

  百度生物(wù)計算(suàn)團隊:

  作爲一種全新的(de)疫苗類型,mRNA疫苗在研發中存在一個(gè)棘手問題:如何找到一個(gè)既具有穩定二級結構,而且還(hái)有效的(de)mRNA疫苗。如果用(yòng)“窮舉法”尋找這(zhè)樣的(de)穩定序列,計算(suàn)量将會是天文數字,無異于“大(dà)海撈針”。爲了(le)解決這(zhè)一問題,我們引入了(le)人(rén)工智能技術和(hé)方法。

  受自然語言處理(lǐ)技術啓發,我們設計了(le)LinearDesign算(suàn)法。LinearDesign是一個(gè)mRNA序列優化(huà)算(suàn)法,它最大(dà)的(de)特點就是運用(yòng)自然語言處理(lǐ)中的(de)網格解析技術(lattice parsing),對(duì)mRNA疫苗序列進行優化(huà),來(lái)提升疫苗穩定性和(hé)有效性。

  這(zhè)個(gè)算(suàn)法實現了(le)将AI技術與生物(wù)疫苗研發相結合。簡單來(lái)說,mRNA序列是由堿基序列組成的(de),與一段語句是由單詞排列組成的(de)相類似,兩者都會形成某種“結構”。

  我們用(yòng)AI技術,提前設計穩定mRNA序列的(de)結構,再根據這(zhè)些穩定結構“按圖索骥”,去找到最符合要求的(de)候選序列——這(zhè)個(gè)過程就像是在一連串發音(yīn)相似的(de)詞組裏,找到最貼近語義的(de)那一句。

  這(zhè)一創新思路成效十分(fēn)顯著。

  實驗表明(míng),LinearDesign算(suàn)法隻需11分(fēn)鐘(zhōng),就能鎖定最穩定的(de)新冠mRNA疫苗序列,不僅讓疫苗研發更高(gāo)效,也(yě)讓疫苗研發更有成效——以新冠mRNA疫苗序列設計爲例,對(duì)比疫苗公司提出的(de)序列,百度算(suàn)法設計的(de)序列穩定性最多(duō)提升5倍以上,抗體反應最多(duō)提升128倍。

  《中國科學報》:

  你們做(zuò)了(le)哪些驗證工作?結果如何?

  百度生物(wù)計算(suàn)團隊:

  我們分(fēn)别做(zuò)了(le)新冠mRNA疫苗和(hé)帶狀疱疹mRNA疫苗這(zhè)兩款疫苗的(de)驗證工作,相關的(de)生物(wù)實驗是聯合斯微生物(wù)一起開展的(de)。實驗數據表明(míng),我們設計的(de)序列在穩定性(體外mRNA半衰期)、蛋白質表達和(hé)抗體反應方面,均比傳統方法設計的(de)疫苗的(de)基準序列有顯著提升。這(zhè)也(yě)證明(míng)了(le)我們這(zhè)個(gè)算(suàn)法的(de)有效性、實用(yòng)性和(hé)普适性。

  曾在美(měi)國Moderna 公司工作的(de)計算(suàn)RNA生物(wù)學家戴夫·莫格 (Dave Mauger)了(le)解我們這(zhè)個(gè)工作後,認爲這(zhè)種新方法“非常了(le)不起”,說我們的(de)“計算(suàn)效率确實令人(rén)印象深刻,而且比以往任何時(shí)候都更加複雜(zá)”。

  《中國科學報》:

  這(zhè)項研究是何時(shí)開展的(de)?中間經曆了(le)哪些過程?

  百度生物(wù)計算(suàn)團隊:

  我們從2020年初就啓動了(le)這(zhè)個(gè)項目。

  新冠疫情剛開始的(de)時(shí)候,我們就想利用(yòng)算(suàn)法技術做(zuò)點事。2020年5月(yuè),LinearDesign算(suàn)法就“誕生”了(le)。爲驗證算(suàn)法是否有效,我們邀請斯微生物(wù)作爲合作方,合作推進了(le)大(dà)量的(de)生物(wù)實驗,直到2021年底、2022年初,才形成完整的(de)論文。

  論文投稿是在2022年三四月(yuè)份,沒過多(duō)久,我們就收到了(le)《自然》雜(zá)志非常正面和(hé)積極的(de)第一輪反饋,編輯也(yě)給出了(le)明(míng)确的(de)修改意見。此後我們又補充了(le)一些生物(wù)實驗和(hé)文章(zhāng)内容,到2023年3月(yuè)再次提交了(le)修改稿,之後一個(gè)多(duō)月(yuè)就收到了(le)正式接收函,最終論文在5月(yuè)份被“加速發表”。

  《中國科學報》:

  這(zhè)項研究成果還(hái)有哪些潛在應用(yòng)?

  百度生物(wù)計算(suàn)團隊:

  這(zhè)項研究成果,實現了(le)AI技術和(hé)生物(wù)學的(de)跨學科融合創新,不僅有助于mRNA疫苗的(de)研發,還(hái)将推動mRNA治療藥物(wù)、單克隆抗體和(hé)抗癌藥物(wù)等方向的(de)進展,具有多(duō)方面的(de)實際意義和(hé)廣泛的(de)應用(yòng)前景。

  目前,百度已對(duì)外提供LinearDesign公有雲服務,來(lái)助力科學研究和(hé)藥物(wù)研發。我們認爲,自然語言處理(lǐ)有很多(duō)非常強大(dà)的(de)能力,未來(lái)還(hái)可(kě)以沿著(zhe)LinearDesign這(zhè)個(gè)思路,開發更多(duō)更強大(dà)的(de)算(suàn)法模型,用(yòng)于解決目前制藥、醫療領域的(de)實際問題。

  《中國科學報》:

  設計和(hé)運行這(zhè)個(gè)算(suàn)法,需要什(shén)麽樣的(de)算(suàn)力?

  百度生物(wù)計算(suàn)團隊:

  這(zhè)其實是個(gè)經常被問到的(de)一個(gè)問題。

  大(dà)家會覺得(de),這(zhè)樣一個(gè)高(gāo)效的(de)算(suàn)法,是不是需要很高(gāo)的(de)算(suàn)力?其實恰好相反,我們算(suàn)法對(duì)算(suàn)力的(de)要求并不高(gāo)。借助雲平台的(de)服務器可(kě)以輕松運行,甚至個(gè)人(rén)電腦(nǎo)都可(kě)以“跑”這(zhè)個(gè)程序。

  一般來(lái)講,一台性能不錯的(de)個(gè)人(rén)筆記本電腦(nǎo),跑兩千個(gè)蛋白長(cháng)度的(de)序列是沒問題的(de)。

  該算(suàn)法參考了(le)自然語言處理(lǐ)中Lattice Parsing算(suàn)法《中國科學報》:

  既然如此,那是不是意味著(zhe)普通(tōng)藥廠、初創公司都可(kě)以低成本地采用(yòng)?

  百度生物(wù)計算(suàn)團隊:

  可(kě)以這(zhè)麽說。新興的(de)mRNA技術推進了(le)諸如新冠疫苗、帶狀疱疹疫苗等疫苗和(hé)藥物(wù)研發進程,而生物(wù)計算(suàn)與mRNA技術的(de)結合,正使得(de)這(zhè)一進程更加快(kuài)速、高(gāo)效,并可(kě)能爲未來(lái)的(de)藥物(wù)研發提供全新思路。

  早在2021年,百度就與國際生物(wù)制藥巨頭賽諾菲簽訂許可(kě)協議(yì),賽諾菲可(kě)以利用(yòng)百度LinearDesign平台,優化(huà)mRNA疫苗和(hé)藥物(wù),用(yòng)于相關人(rén)類疾病的(de)治療與預防。爲此,百度提供了(le)多(duō)種服務方式,比如私有化(huà)部署和(hé)雲平台服務,爲藥企和(hé)科研機構賦能。

  《中國科學報》:

  百度在AI+生物(wù)計算(suàn)方面有哪些積累和(hé)投入?

  百度生物(wù)計算(suàn)團隊:

  在AI+生命科學領域,百度已有多(duō)年布局和(hé)投入。

  2018年,百度就開始了(le)對(duì)生物(wù)計算(suàn)領域的(de)探索;2020年1月(yuè),百度對(duì)外開放RNA二級結構預測算(suàn)法LinearFold;2020年5月(yuè),mRNA序列設計算(suàn)法LinearDesign面世;2020年12月(yuè),百度正式發布生物(wù)計算(suàn)平台——飛(fēi)槳螺旋槳PaddleHelix。

  螺旋槳PaddleHelix針對(duì)生命科學領域的(de)重要問題,如藥物(wù)篩選、蛋白設計、疫苗設計、精準診療、機理(lǐ)研究、分(fēn)子合成等,通(tōng)過構建“數據+原理(lǐ)”雙驅動的(de)生物(wù)計算(suàn)大(dà)模型技術,并基于大(dà)模型技術打造面向藥物(wù)研發、疫苗設計、精準醫療等場(chǎng)景的(de)産品工具,輔助生命科學領域的(de)研究者和(hé)從業人(rén)員(yuán)提升研發效率,降低AI技術的(de)使用(yòng)門檻,以更快(kuài)速的(de)推進科研成果轉 化(huà)和(hé)在研管線的(de)上市。

  截止目前,飛(fēi)槳螺旋槳PaddleHelix平台已開放文心·生物(wù)計算(suàn)大(dà)模型技術,及基于大(dà)模型技術開發的(de)多(duō)個(gè)場(chǎng)景模型,包括藥物(wù)篩選、ADMET性質預測、分(fēn)子生成、蛋白結構預測、多(duō)蛋白相互作用(yòng)、多(duō)肽藥物(wù)設計、mRNA序列設計和(hé)藥物(wù)重定向等。

  如前所說,2021年,醫藥巨頭賽諾菲跟百度簽訂協議(yì),利用(yòng)百度的(de)平台來(lái)優化(huà)mRNA疫苗和(hé)藥物(wù)設計,未來(lái)百度在生命科學領域的(de)多(duō)個(gè)算(suàn)法模型,也(yě)有望能夠進入更多(duō)的(de)藥物(wù)研發管線上,賦能科研。

  可(kě)以說,《自然》雜(zá)志發表的(de)LinearDesign算(suàn)法,是百度深耕生物(wù)計算(suàn)領域的(de)一個(gè)标杆性案例。

  《中國科學報》:

  AI技術和(hé)前沿生物(wù)技術結合,需要AI人(rén)才和(hé)生物(wù)人(rén)才密切合作。在研發的(de)過程中,合作是怎樣開展的(de)?不同專業人(rén)才的(de)配比如何?合作過程中有沒有遇到一些困難?

  百度生物(wù)計算(suàn)團隊:

  在AI人(rén)才和(hé)生物(wù)人(rén)才合作過程中,确實遇到了(le)很多(duō)情況,因爲這(zhè)其中存在一個(gè)雙向的(de)“知識鴻溝”(knowledge gap)。

  AI人(rén)才有算(suàn)法模型的(de)經驗,但是往往缺乏對(duì)真實世界中生物(wù)問題的(de)理(lǐ)解和(hé)經驗,存在著(zhe)“舉著(zhe)錘子找釘子”的(de)問題。生物(wù)人(rén)才也(yě)不是非常了(le)解AI領域的(de)一些進展,所以也(yě)存在類似的(de)問題。

  具體到這(zhè)個(gè)研發項目, AI人(rén)才和(hé)生物(wù)人(rén)才的(de)占比接近于1:1,百度這(zhè)邊主要是以AI算(suàn)法的(de)人(rén)才爲主,生物(wù)實驗合作方主要以生物(wù)人(rén)才爲主。當然我們也(yě)有同時(shí)具備生物(wù)計算(suàn)和(hé)生物(wù)實驗雙重背景的(de)專家的(de)指導。

  在這(zhè)個(gè)合作過程中,有兩點非常重要。

  一是要有明(míng)确的(de)分(fēn)工,有明(míng)确的(de)責權。比如在項目之初我們負責算(suàn)法的(de)研發,後續合作方的(de)生物(wù)人(rén)才負責生物(wù)實驗的(de)驗證。

  二是需要互相碰撞、互相學習(xí)、互相叠代。我們在一年多(duō)的(de)時(shí)間裏,會定期召開討(tǎo)論會,研討(tǎo)生物(wù)實驗設計、結果分(fēn)析,雙方都會有更新和(hé)反饋。在這(zhè)個(gè)過程中,大(dà)家都學到很多(duō)。比如,現在我們對(duì)mRNA也(yě)由最初的(de)“小白”變得(de)對(duì)它有一些了(le)解了(le)。

  未來(lái),AI技術還(hái)将和(hé)各個(gè)領域結合,各方都應以更開放的(de)心态不斷碰撞和(hé)交互,這(zhè)樣大(dà)家就有機會成長(cháng)爲具有交叉背景知識和(hé)技術特長(cháng)的(de)綜合性人(rén)才。

  特别聲明(míng):本文轉載僅僅是出于傳播信息的(de)需要,并不意味著(zhe)代表本網站觀點或證實其内容的(de)真實性;如其他(tā)媒體、網站或個(gè)人(rén)從本網站轉載使用(yòng),須保留本網站注明(míng)的(de)“來(lái)源”,并自負版權等法律責任;作者如果不希望被轉載或者聯系轉載稿費等事宜,請與我們接洽。

聯系我們
CONTACT US

24小時(shí)主任咨詢電話(huà):17610006179
24小時(shí)主任投訴電話(huà):17600799069
郵箱:zhuohongxx@163.com