استفاده از یادگیری ماشین برای بهبود ارزیابی سمیت مواد شیمیایی

به گزارش سیناپرس، محققان دانشگاه آمستردام به همراه همکارانش در دانشگاه کوئینزلند و موسسه تحقیقات آب نروژی، استراتژی ای را با استفاده از یادگیری ماشینی برای ارزیابی سمیت مواد شیمیایی ایجاد کرده اند.

به گفته محققان، استفاده از یادگیری ماشینی می‌تواند ارزیابی خطرات مولکول‌ها را، هم در توسعه بی‌خطر طراحی مواد شیمیایی جدید و هم در ارزیابی مواد شیمیایی موجود، بسیار بهبود بخشد. اهمیت موضوع با این واقعیت نشان داده شده است که آژانس‌های شیمیایی اروپا و ایالات متحده تقریباً 800000 ماده شیمیایی را فهرست کرده‌اند که در طول سال‌ها ساخته شده‌اند، اما اطلاعات کمی در مورد سرنوشت یا سمیت محیطی وجود دارد.

از آنجایی که ارزیابی تجربی سرنوشت و سمیت شیمیایی به زمان، تلاش و منابع زیادی نیاز دارد، رویکردهای مدل‌سازی در حال حاضر برای پیش‌بینی شاخص‌های خطر استفاده می‌شوند. به‌ویژه مدل‌سازی رابطه کمی ساختار-فعالیت (QSAR) اغلب اعمال می‌شود و ویژگی‌های مولکولی مانند آرایش اتمی و ساختار سه‌بعدی را به خواص فیزیکوشیمیایی و فعالیت بیولوژیکی مرتبط می‌کند.

بر اساس نتایج مدل‌سازی (یا داده‌های اندازه‌گیری شده در صورت وجود)، کارشناسان یک مولکول را به دسته‌هایی طبقه‌بندی می‌کنند که برای مثال در سیستم جهانی هماهنگ طبقه‌بندی و برچسب‌گذاری مواد شیمیایی (GHS) تعریف شده است. برای مقوله‌های خاص، مولکول‌ها در معرض تحقیقات بیشتر، نظارت فعال‌تر و در نهایت قانون‌گذاری قرار می‌گیرند.

با این حال، این فرآیند دارای اشکالات ذاتی است که بسیاری از آنها را می توان به محدودیت های مدل های QSAR ردیابی کرد. آنها اغلب بر اساس مجموعه های آموزشی بسیار همگن هستند و یک رابطه ساختار-فعالیت خطی را برای برون یابی فرض می کنند. در نتیجه، بسیاری از مواد شیمیایی به خوبی توسط مدل‌های QSAR موجود نشان داده نمی‌شوند و استفاده از آنها می‌تواند به طور بالقوه منجر به خطاهای پیش‌بینی قابل‌توجه و طبقه‌بندی اشتباه مواد شیمیایی شود.

در مقاله خود که در Environmental Science & Technology منتشر شده است، دکتر سائر سامانی پور و همکارانش یک استراتژی ارزیابی جایگزین را پیشنهاد می کنند که مرحله پیش بینی QSAR را به کلی نادیده می گیرد.

سامانی پور، دانشمند تجزیه محیطی در مؤسسه علوم مولکولی Van’t Hoff در دانشگاه آمستردام با دکتر آنتونیا پراتوریوس، شیمیدان محیط زیست در موسسه تنوع زیستی و دینامیک اکوسیستم همان دانشگاه همکاری کردند. آنها به همراه همکاران خود در دانشگاه کوئینزلند و موسسه نروژی تحقیقات آب، یک استراتژی مبتنی بر یادگیری ماشینی برای طبقه بندی مستقیم سمیت آبزیان حاد مواد شیمیایی بر اساس توصیفگرهای مولکولی ایجاد کردند.

این مدل از طریق 907 داده تجربی به‌دست‌آمده برای سمیت ماهی به شکل حاد (مقادیر LC50 96 ساعت) توسعه و آزمایش شد. مدل جدید از پیش‌بینی مقدار سمیت 96 ساعت (LC50) برای هر ماده شیمیایی صرف‌نظر می‌کند، اما مستقیماً هر ماده شیمیایی را به تعدادی از دسته‌های سمیت از پیش تعریف‌شده طبقه‌بندی می‌کند.

این دسته‌ها را می‌توان برای مثال با مقررات خاص یا سیستم‌های استانداردسازی تعریف کرد، همانطور که در مقاله با دسته‌های GHS برای خطرات حاد آبزی نشان داده شده است. این مدل حدود 90 درصد از واریانس داده های مورد استفاده در مجموعه آموزشی و حدود 80 درصد را برای داده های مجموعه آزمون توضیح داد.

پیش بینی های با دقت بالاتر

این استراتژی طبقه بندی مستقیم منجر به کاهش پنج برابری در طبقه بندی نادرست در مقایسه با استراتژی مبتنی بر مدل رگرسیون QSAR شد. متعاقبا، محققان استراتژی خود را برای پیش‌بینی دسته‌بندی سمیت مجموعه بزرگی از 32000 ماده شیمیایی گسترش دادند.آنها نشان می‌دهند که رویکرد طبقه‌بندی مستقیم آنها منجر به پیش‌بینی‌های دقت بالاتری می‌شود، زیرا مجموعه داده‌های تجربی از منابع مختلف و برای خانواده‌های شیمیایی مختلف می‌توانند برای تولید مجموعه‌های آموزشی بزرگ‌تر گروه‌بندی شوند. می توان آن را با دسته های مختلف از پیش تعریف شده مطابق با مقررات بین المللی مختلف و سیستم های طبقه بندی یا برچسب گذاری تطبیق داد.در آینده، رویکرد طبقه‌بندی مستقیم می‌تواند به سایر دسته‌های خطر (به عنوان مثال سمیت مزمن) و همچنین به سرنوشت محیطی (مانند تحرک یا پایداری) گسترش یابد و پتانسیل زیادی برای بهبود ابزارهای درون سیلیکونی برای ارزیابی خطرات شیمیایی و خطر نشان می‌دهد.

منبع: Phys.org

مترجم: سید سپهر ارومیهء