کشف مواد و محصولات دارویی جدید، معمولاً شامل یک فرآیند پیچیده است که ممکن است چندین دهه طول بکشد و میلیون ها دلار هزینه داشته باشد. به منظور ساده سازی این فرآیند، دانشمندان اغلب از یادگیری ماشینی برای پیش بینی خواص مولکول ها استفاده می کنند.
به گزارش سیناپرس،محققان MIT چارچوب کاملا جدید و یکپارچه ای را برای پیش بینی ویژگی های مولکولی و سنتز مولکول های جدید به طور همزمان، توسعه داده اند که بسیار کارآمدتر از رویکردهای موجود عمل می کند.
آموزش یک مدل یادگیری ماشینی برای پیش بینی خواص بیولوژیکی یا مکانیکی یک مولکول، نیازمند میلیون ها ساختار مولکولی برچسب گذاری شده است. به دلیل هزینه های کشف مولکول ها و چالش های برچسب گذاری مولکول ها به صورت دستی، کار با مجموعه داده های آموزشی بزرگ، اغلب بسیار پیچیده است و این مسئله، کارایی رویکردهای یادگیری ماشینی را محدود می کند.
در مقابل، سیستم جدید ایجاد شده توسط محققان MIT قادر است خواص مولکولی را به طور موثر و تنها با استفاده از مجموعه کوچکی از داده ها پیش بینی کند. قوانین این سیستم با بررسی شباهت های بین ساختارهای مولکولی، به سیستم کمک می کنند تا مولکول های جدیدی تولید کرده و خواص آنها را به شیوه ای کارآمدتر پیش بینی کند.
در مدل های یادگیری ماشینی، برای دستیابی به نتایج مطلوب، دانشمندان به مجموعه داده های آموزشی با میلیون ها مولکول نیاز دارند که دارای خواص مشابه با مولکول هایی می باشند که به دنبال کشف آنها هستند.به گزارش سیناپرس، محققان ناچارند، از مدل هایی استفاده کنند که از قبل روی مجموعه داده های بزرگ آموزش داده شده اند که به عملکرد ضعیف این مدل ها بر مجموعه داده های کوچک می انجامد.
دانشمندان، در این مطالعه، روش کاملا متفاوتی را در پیش گرفته اند؛ تیم تحقیقاتی برای پیش بینی خواص مولکول ها، از گرامر مولکولی استفاده کرد. گرامر مولکولی، مجموعه ای از قوانین است که نحوه تولید مولکول ها یا پلیمرها را با ترکیبی از اتم ها، تعیین می کند.
به گزارش سیناپرس، پژوهشگران اظهار داشتند: هدف اصلی ما از این پروژه استفاده از برخی روش های مبتنی بر داده، برای سرعت بخشیدن به کشف مولکول های جدید بود. این نمایش مولکولی مبتنی بر دستور زبان، بسیار قدرتمند است و ما در تلاش برای شناسایی کاربردهای دیگر آن، فراتر از شیمی یا علم مواد هستیم.
مترجم: رهاامیدوار
No tags for this post.