人工智能AI聊天機(jī)器人助力化學(xué)研究:展現(xiàn)預(yù)測(cè)分子性質(zhì)與反應(yīng)的天賦

人工智能AI聊天機(jī)器人助力化學(xué)研究:展現(xiàn)預(yù)測(cè)分子性質(zhì)與反應(yīng)的天賦

近日,研究人員發(fā)現(xiàn),經(jīng)過微調(diào)后的類ChatGPT系統(tǒng)展現(xiàn)出在化學(xué)研究領(lǐng)域的驚人天賦,能夠精確預(yù)測(cè)分子和材料的特性或反應(yīng)的產(chǎn)率。這一發(fā)現(xiàn)為化學(xué)實(shí)驗(yàn)室?guī)砹藦?qiáng)大的新工具,無需復(fù)雜的機(jī)器學(xué)習(xí)模型即可獲得深入的化學(xué)見解。

大型語言模型(LLM)是在大量文本集合上訓(xùn)練的人工神經(jīng)網(wǎng)絡(luò),通過統(tǒng)計(jì)預(yù)測(cè)來生成響應(yīng)。為了探索LLM在化學(xué)領(lǐng)域的應(yīng)用潛力,計(jì)算化學(xué)家Kevin Jablonka及其團(tuán)隊(duì)對(duì)GPT-3進(jìn)行了微調(diào)。他們首先從文獻(xiàn)中收集有關(guān)化合物或材料的信息,并將其格式化為問答形式。然后,將這些數(shù)據(jù)發(fā)送到OpenAI,以添加到LLM的訓(xùn)練集中。經(jīng)過微調(diào)的系統(tǒng)能夠回答有關(guān)原始化合物或材料的預(yù)測(cè)問題,即使這些化合物或材料并未明確包含在輸入數(shù)據(jù)中。

研究團(tuán)隊(duì)測(cè)試了微調(diào)后的GPT-3在回答有關(guān)“高熵”合金查詢方面的能力。高熵合金由大致等量的兩種或多種金屬制成,其金屬如何混合一直是個(gè)謎。然而,經(jīng)過微調(diào)的GPT-3能夠正確猜測(cè)其中一種合金中的金屬如何排列。此外,當(dāng)要求系統(tǒng)回答有關(guān)訓(xùn)練數(shù)據(jù)中未包含的“未知”材料的問題時(shí),其準(zhǔn)確性與更專業(yè)的化學(xué)機(jī)器學(xué)習(xí)工具相當(dāng),甚至與計(jì)算機(jī)模擬的結(jié)果相當(dāng)。

研究人員還證明了,當(dāng)他們微調(diào)GPT-3的開源版本GPT-J時(shí),可以獲得類似的結(jié)果。這意味著預(yù)算較少的實(shí)驗(yàn)室也能夠開發(fā)自己的版本,而無需付費(fèi)或?qū)で笊虡I(yè)幫助。這一技術(shù)的民主化使得更多化學(xué)家能夠受益于機(jī)器學(xué)習(xí)的力量。

化學(xué)工程師Andrew White表示,該技術(shù)能夠僅根據(jù)化合物的化學(xué)式進(jìn)行預(yù)測(cè),這一事實(shí)非常令人驚訝。他已經(jīng)在自己的新項(xiàng)目中使用了這種方法,例如基于微調(diào)LLM設(shè)計(jì)新催化劑。White認(rèn)為,這是他們?cè)陂_展新項(xiàng)目時(shí)嘗試的第一種方法。

盡管該方法需要人類收集信息并準(zhǔn)備LLM輸入,但Jablonka及其團(tuán)隊(duì)的目標(biāo)是設(shè)計(jì)未來的版本,能夠自動(dòng)從現(xiàn)有文獻(xiàn)中挖掘文本并實(shí)現(xiàn)這一步驟。這一進(jìn)步將為化學(xué)研究帶來更高效、更便捷的解決方案,推動(dòng)科學(xué)領(lǐng)域的快速發(fā)展。

總之,經(jīng)過微調(diào)后的類ChatGPT系統(tǒng)展現(xiàn)出在化學(xué)研究領(lǐng)域的驚人天賦,為化學(xué)實(shí)驗(yàn)室提供了強(qiáng)大的新工具。這一技術(shù)的民主化將使得更多化學(xué)家能夠受益于機(jī)器學(xué)習(xí)的力量,推動(dòng)化學(xué)領(lǐng)域的快速發(fā)展。未來,隨著技術(shù)的不斷進(jìn)步和完善,我們期待看到更多創(chuàng)新應(yīng)用的出現(xiàn)。

原創(chuàng)文章,作者:小丸子,如若轉(zhuǎn)載,請(qǐng)注明出處:http://m.2079x.cn/article/629505.html

小丸子的頭像小丸子認(rèn)證作者

相關(guān)推薦

發(fā)表回復(fù)

登錄后才能評(píng)論