آیا LLMS می تواند به طراحی داروها و مواد بعدی ما کمک کند؟ | اخبار MIT

آیا LLMS می تواند به طراحی داروها و مواد بعدی ما کمک کند؟ | اخبار MIT
فهرست مطالب

روند کاوش در مولکول ها با ویژگی هایی برای ایجاد داروها و مواد جدید ، منابع محاسبه گسترده و گران قیمت و کار انسان برای ماه ها برای محدود کردن منطقه عظیم نامزدهای بالقوه است.

مدل های بزرگ زبان مانند ChatGPT (LLMS) می توانند این فرآیند را تسهیل کنند ، اما یک LLM یک مانع علمی ایجاد کرده است تا اطمینان حاصل کند که یک مولکول و پیوندهایی که یک مولکول را تشکیل می دهند و به همان روشی که جملات را تشکیل می دهند ، درک و استدلال می کنند.

محققان آزمایشگاه MIT و MIT-IBM Watson AI یک رویکرد امیدوارکننده را ایجاد کردند که LLM را با سایر مدل های یادگیری ماشین که برای تولید و پیش بینی ساختارهای مولکولی ، معروف به مدلهای مبتنی بر گرافیک طراحی شده است ، افزایش می دهد.

این روشها از LLM اساسی برای تفسیر نمایش داده های زبان طبیعی استفاده می کنند که خصوصیات مولکولی مورد نظر را نشان می دهد. گام به گام برای طراحی یک مولکول ، توضیح منطق و سنتز منطق ، به طور خودکار بین LLM پایه و ماژول های AI مبتنی بر گرافیک عبور می کند. این ترکیب کلمات ، گرافیک و واکنش به یک واژگان مشترک برای مصرف LLM ، نمایش متن ، گرافیک و تولید مرحله تولید است.

در مقایسه با رویکردهای مبتنی بر LLM موجود ، این تکنیک چند حالته مولکول هایی را تولید می کند که مشخصات کاربر را بهتر مطابقت می دهد و یک برنامه سنتز معتبر دارند و احتمال موفقیت بالاتری دارند و میزان موفقیت را از ۵ درصد به ۳۵ درصد افزایش می دهند.

علاوه بر این ، این کار بهتر از LLM ها با مولکول های طراحی و مسیرهای سنتز با تنها تظاهرات مبتنی بر متن ، که بیش از ۱۰ برابر اندازه آن است ، انجام داده است ، که نشان می دهد چندمادینولی بودن کلید موفقیت سیستم جدید است.

وی گفت: “این می تواند یک راه حل برای پایان باشد که در آن می توانیم یک طرح مولکول و فرآیند ساخت را خودکار کنیم. مقاله روی این تکنیکبشر

باند لیو ، دانشجوی فارغ التحصیل دانشگاه نوتردام ، یکی از نویسندگان مشترک Sun است. Wojciech Matusik ، استاد مهندسی برق و علوم کامپیوتر در MIT ، که رهبری گروه طراحی و ساخت محاسباتی در آزمایشگاه علوم کامپیوتر و هوش مصنوعی (CSAIL) است. منگ جیانگ ، استادیار دانشگاه نوتردام ؛ و نویسنده ارشد جی چن ، دانشمند ارشد تحقیقات و مدیر آزمایشگاه MIT-IBM Watson AI. این تحقیق در کنفرانس نمایندگان بین المللی یادگیری ارائه خواهد شد.

بهترین در هر دو جهان

مدل های بزرگ زبان برای درک تفاوت های ظریف شیمی ساخته نشده اند ، که این روند شناسایی ساختارهای مولکولی با کارکردها یا خصوصیات خاص است ، که دلیل آن برای مبارزه آنها در برابر طراحی مولکولی معکوس است.

در یک جمله ، LLM ها کلمه بعدی را به نشانگرها تبدیل می کنند تا کلمه بعدی را پیش بینی کنند. با این حال ، مولکول ها “ساختارهای گرافیکی اتمها و پیوندها بدون ترتیب خاص هستند ، که کدگذاری آنها را به عنوان متن پی در پی برای آنها دشوار می کند.

از طرف دیگر ، مدل های هوش مصنوعی مبتنی بر گرافیک قدرتمند اتم ها و پیوندهای مولکولی را در یک نمودار به عنوان گره ها و لبه های بهم پیوسته نشان می دهند. اگرچه این مدل ها برای طراحی مولکولی معکوس محبوب هستند ، اما به ورودی های پیچیده ای نیاز دارند ، اما نمی توانند زبان طبیعی را درک کنند و نتیجه ای را ارائه دهند که تفسیر آن دشوار است.

محققان MIT یک LLM را با مدل های AI مبتنی بر گرافیک ترکیب کردند ، یک قاب ترکیبی که بهترین ها را از هر دو جهان به دست می آورد.

لامول ، که به معنای یک مدل بزرگ زبان برای کشف مولکولی است ، از یک LLM اساسی به عنوان نگهبان برای درک پرس و جو یک کاربر استفاده می کند-یک زبان مسطح برای یک مولکول با ویژگی های خاص.

به عنوان مثال ، با توجه به اینکه کاربر دارای ۲۰۹ وزن مولکولی و خاصیت پیوند خاص است ، به دنبال یک مولکول است که می تواند به سد خونی مغزی نفوذ کند و HIV را مهار کند.

از آنجا که LLM متن را در پاسخ به پرس و جو تخمین می زند ، بین ماژول های گرافیکی انتقال می یابد.

یک ماژول از یک مدل انتشار گرافیکی برای ایجاد یک ساختار مولکولی بسته به نیاز ورودی استفاده می کند. یک ماژول دوم از یک شبکه عصبی گرافیکی برای رمزگذاری ساختار مولکولی تولید شده به سکه ها برای مصرف LLM استفاده می کند. آخرین ماژول گرافیکی یک جنگل واکنش گرافیکی است که به عنوان یک ساختار مولکولی میانی وارد می شود و یک مرحله واکنش را پیش بینی می کند و یک مرحله کامل را برای ایجاد مولکول از بلوک های اصلی ساختمان جستجو می کند.

محققان نوع جدیدی از نوع ژنتیکی ماشه را تشکیل داده اند که به LLM می گوید چه زمانی هر ماژول را فعال می کند. هنگامی که یک “طراحی” باعث تحریک جتون می شود ، ماژولار را که یک ساختار مولکولی را ترسیم می کند عبور می کند و وقتی یک علامت تحریک کننده “یکپارچهسازی با سیستمعامل” را پیش بینی می کند ، به ماژول برنامه ریزی رتروسنتتیک منتقل می شود ، که مرحله واکنش بعدی را پیش بینی می کند.

وی گفت: “زیبایی این امر این است که همه چیز توسط LLM قبل از فعال کردن یک ماژول خاص ، تغذیه این ماژول به خودش است. این ماژول یاد می گیرد که به طور مداوم با کسانی که قبلاً آمده اند ، کار کند.

به همین ترتیب ، خروجی هر ماژول کدگذاری شده و به فرآیند تولید LLM باز می گردد ، به طوری که هر ماژول متوجه می شود که چه کاری انجام می دهد و با توجه به این داده ها به تخمین نشانگرها ادامه می دهد.

ساختارهای مولکولی بهتر و ساده تر

در پایان ، للامول یک طرح مرحله ای را تهیه می کند که تصویری از ساختار مولکولی ، تعریف متنی از مولکول و نحوه انجام آن را به واکنشهای شیمیایی فردی ارائه می دهد.

در آزمایشات مربوط به طراحی مولکول هایی که مطابق با مشخصات کاربر هستند ، لامول ۱۰ عملکرد بهتری نسبت به یک LLM استاندارد ، چهار LLM خوب و جدید و جدیدترین روش خاص فناوری انجام داده است. در عین حال ، با تولید مولکول های با کیفیت بالاتر ، برنامه ریزی رتروسنتتیک میزان موفقیت خود را از ۵ درصد به ۳۵ درصد افزایش داده است ، این بدان معنی است که آنها ساختارهای ساده تری دارند و بلوک های ساختمانی کمتری دارند.

لیو می گوید: “به خودی خود ، تلاش می شود تا چگونگی سنتز مولکول ها را پیدا کنیم زیرا به تعداد زیادی برنامه ریزی چند مرحله ای نیاز دارد. روش ما می تواند ساختارهای مولکولی بهتری تولید کند که سنتز آن آسان تر باشد.”

به منظور آموزش و ارزیابی لامول ، محققان دو خوشه داده را از ابتدا ساختند ، زیرا مجموعه داده های ساختارهای مولکولی موجود حاوی جزئیات کافی نیستند. آنها صدها هزار مولکول ثبت شده با توضیحات زبان طبیعی و الگوهای توضیحات سفارشی تولید شده توسط هوش مصنوعی را افزایش دادند.

مجموعه داده هایی که آنها برای ایجاد یک تنش خوب به LLM ایجاد می کنند حاوی ۱۰ الگوی مرتبط با ویژگی های مولکولی است ، بنابراین محدودیت للامول برای طراحی مولکول ها با توجه به ۱۰ ویژگی عددی آموزش داده می شود.

در مطالعات آینده ، محققان می خواهند لامول را تعمیم دهند تا هر ویژگی مولکولی را در بر بگیرد. علاوه بر این ، آنها قصد دارند ماژول های گرافیکی را برای افزایش میزان موفقیت retrosynthesis Llamole توسعه دهند.

و در دراز مدت ، آنها امیدوارند که از این روش برای فراتر از مولکول ها استفاده کنند ، به امید ایجاد LLM های چند حالته که می توانند داده های مبتنی بر گرافیکی دیگر مانند یکدیگر یا سایر داده های مبتنی بر گرافیکی را در یک شبکه برق پردازش کنند.

چن می گوید: “ما امکان استفاده از مدل های زبان بزرگ را به عنوان واسط برای داده های پیچیده فراتر از توصیف متن لامول نشان می دهیم ، و انتظار داریم که آنها مبنایی باشند که با سایر الگوریتم های هوش مصنوعی برای حل هرگونه مشکل گرافیکی ارتباط برقرار کنند.

این تحقیق تا حدودی توسط آزمایشگاه MIT-IBM Watson AI ، بنیاد ملی علوم و دفتر تحقیقات دریایی تأمین می شود.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *