استفاده از یادگیری ماشین برای بهبود ارزیابی سمیت مواد شیمیایی
به گزارش سیناپرس، محققان دانشگاه آمستردام به همراه همکارانش در دانشگاه کوئینزلند و موسسه تحقیقات آب نروژی، استراتژی ای را با استفاده از یادگیری ماشینی برای ارزیابی سمیت مواد شیمیایی ایجاد کرده اند.
به گفته محققان، استفاده از یادگیری ماشینی میتواند ارزیابی خطرات مولکولها را، هم در توسعه بیخطر طراحی مواد شیمیایی جدید و هم در ارزیابی مواد شیمیایی موجود، بسیار بهبود بخشد. اهمیت موضوع با این واقعیت نشان داده شده است که آژانسهای شیمیایی اروپا و ایالات متحده تقریباً 800000 ماده شیمیایی را فهرست کردهاند که در طول سالها ساخته شدهاند، اما اطلاعات کمی در مورد سرنوشت یا سمیت محیطی وجود دارد.
از آنجایی که ارزیابی تجربی سرنوشت و سمیت شیمیایی به زمان، تلاش و منابع زیادی نیاز دارد، رویکردهای مدلسازی در حال حاضر برای پیشبینی شاخصهای خطر استفاده میشوند. بهویژه مدلسازی رابطه کمی ساختار-فعالیت (QSAR) اغلب اعمال میشود و ویژگیهای مولکولی مانند آرایش اتمی و ساختار سهبعدی را به خواص فیزیکوشیمیایی و فعالیت بیولوژیکی مرتبط میکند.
بر اساس نتایج مدلسازی (یا دادههای اندازهگیری شده در صورت وجود)، کارشناسان یک مولکول را به دستههایی طبقهبندی میکنند که برای مثال در سیستم جهانی هماهنگ طبقهبندی و برچسبگذاری مواد شیمیایی (GHS) تعریف شده است. برای مقولههای خاص، مولکولها در معرض تحقیقات بیشتر، نظارت فعالتر و در نهایت قانونگذاری قرار میگیرند.
با این حال، این فرآیند دارای اشکالات ذاتی است که بسیاری از آنها را می توان به محدودیت های مدل های QSAR ردیابی کرد. آنها اغلب بر اساس مجموعه های آموزشی بسیار همگن هستند و یک رابطه ساختار-فعالیت خطی را برای برون یابی فرض می کنند. در نتیجه، بسیاری از مواد شیمیایی به خوبی توسط مدلهای QSAR موجود نشان داده نمیشوند و استفاده از آنها میتواند به طور بالقوه منجر به خطاهای پیشبینی قابلتوجه و طبقهبندی اشتباه مواد شیمیایی شود.
در مقاله خود که در Environmental Science & Technology منتشر شده است، دکتر سائر سامانی پور و همکارانش یک استراتژی ارزیابی جایگزین را پیشنهاد می کنند که مرحله پیش بینی QSAR را به کلی نادیده می گیرد.
سامانی پور، دانشمند تجزیه محیطی در مؤسسه علوم مولکولی Van’t Hoff در دانشگاه آمستردام با دکتر آنتونیا پراتوریوس، شیمیدان محیط زیست در موسسه تنوع زیستی و دینامیک اکوسیستم همان دانشگاه همکاری کردند. آنها به همراه همکاران خود در دانشگاه کوئینزلند و موسسه نروژی تحقیقات آب، یک استراتژی مبتنی بر یادگیری ماشینی برای طبقه بندی مستقیم سمیت آبزیان حاد مواد شیمیایی بر اساس توصیفگرهای مولکولی ایجاد کردند.
این مدل از طریق 907 داده تجربی بهدستآمده برای سمیت ماهی به شکل حاد (مقادیر LC50 96 ساعت) توسعه و آزمایش شد. مدل جدید از پیشبینی مقدار سمیت 96 ساعت (LC50) برای هر ماده شیمیایی صرفنظر میکند، اما مستقیماً هر ماده شیمیایی را به تعدادی از دستههای سمیت از پیش تعریفشده طبقهبندی میکند.
این دستهها را میتوان برای مثال با مقررات خاص یا سیستمهای استانداردسازی تعریف کرد، همانطور که در مقاله با دستههای GHS برای خطرات حاد آبزی نشان داده شده است. این مدل حدود 90 درصد از واریانس داده های مورد استفاده در مجموعه آموزشی و حدود 80 درصد را برای داده های مجموعه آزمون توضیح داد.
پیش بینی های با دقت بالاتر
این استراتژی طبقه بندی مستقیم منجر به کاهش پنج برابری در طبقه بندی نادرست در مقایسه با استراتژی مبتنی بر مدل رگرسیون QSAR شد. متعاقبا، محققان استراتژی خود را برای پیشبینی دستهبندی سمیت مجموعه بزرگی از 32000 ماده شیمیایی گسترش دادند.آنها نشان میدهند که رویکرد طبقهبندی مستقیم آنها منجر به پیشبینیهای دقت بالاتری میشود، زیرا مجموعه دادههای تجربی از منابع مختلف و برای خانوادههای شیمیایی مختلف میتوانند برای تولید مجموعههای آموزشی بزرگتر گروهبندی شوند. می توان آن را با دسته های مختلف از پیش تعریف شده مطابق با مقررات بین المللی مختلف و سیستم های طبقه بندی یا برچسب گذاری تطبیق داد.در آینده، رویکرد طبقهبندی مستقیم میتواند به سایر دستههای خطر (به عنوان مثال سمیت مزمن) و همچنین به سرنوشت محیطی (مانند تحرک یا پایداری) گسترش یابد و پتانسیل زیادی برای بهبود ابزارهای درون سیلیکونی برای ارزیابی خطرات شیمیایی و خطر نشان میدهد.
منبع: Phys.org
مترجم: سید سپهر ارومیهء