تویوتا یادگیری ربات‌ها را بهبود می ‌بخشد

sinaadmin۱۴۰۲-۰۶-۳۰

تویوتا، موسسه تکنولوژی ماساچوست و دانشگاه مهندسی کلمبیا نتایج عجیبی را از یک رویکرد یادگیری هوش مصنوعی جدید نشان داده ‌اند که ربات‌ها می ‌توانند به سرعت مهارت‌های جدید به دست آورند.

به گزارش سیناپرس، ما در طلوع عصر رباتیک همه منظوره زندگی می کنیم. اکنون ده‌ها شرکت احساس کرده اند که زمان سرمایه ‌گذاری کلان بر روی ربات‌های انسان ‌نما فرا رسیده که می ‌توانند به ‌طور مستقل راه خود را در محیط‌ های کاری موجود بپیمایند و وظایف را از کارگران انسانی تحویل بگیرند.

برای گسترش قابلیت‌های ربات ها تا جایی که آن ها بتوانند در هر مکان شغلی استفاده شوند و شروع به انجام وظایف مختلف کنند، به روشی برای ارتقای سریع مهارت‌های خود بر اساس دستورالعمل‌ها یا نمایش‌های انسانی نیاز دارند. اینجاست که تویوتا ادعا می ‌کند با رویکرد یادگیری جدید مبتنی بر سیاست انتشار که به گفته این شرکت دری را به روی مفهوم مدل‌های رفتاری بزرگ باز می‌ کند، به پیشرفت عظیمی دست یافته است.

سیاست انتشار مفهومی است که تویوتا با مشارکت مهندسی کلمبیا و MIT توسعه داده است، اینگونه توصیف می شود: روشی جدید برای ایجاد رفتار ربات با نمایش نظارت دیداری و حرکتی یک ربات.

اساساً، جایی که مدل‌های زبان بزرگ (LLM) مانند ChatGPT می ‌توانند میلیاردها کلمه از نوشته ‌های انسانی را بنوشند و به خود بیاموزند که بنویسند و کدنویسی کنند، سیاست انتشار به هوش مصنوعی رباتیک اجازه می ‌دهد تا یک ربات تماشا کند که چگونه یک انسان یک کار فیزیکی معین را در دنیای واقعی انجام می دهد و سپس اساسا خود را طوری برنامه ریزی کند که آن کار را به شیوه ای انعطاف پذیر انجام دهد.

در حالی که برخی از استارتاپ‌ها به ربات‌های خود از طریق حضور از راه دور آموزش می ‌دهند، رویکرد تویوتا بیشتر بر روی لمس متمرکز است. اپراتورها از هدست واقعیت مجازی استفاده نمی‌ کنند، اما بازخورد لمسی را از گیره‌های نرم و انعطاف‌ پذیر ربات از طریق کنترل‌های دستی خود دریافت می‌ کنند که به آنها این امکان را می ‌دهد تا حسی را که ربات هنگام تماس با اشیا احساس می ‌کند، دریابند.

هنگامی که یک اپراتور انسانی به ربات‌ها نشان داد که چگونه یک کار را در چندین زمان مختلف، در شرایط کمی متفاوت انجام دهند، هوش مصنوعی ربات مدل داخلی خود را از ظاهر موفقیت و شکست ساخته و سپس هزاران هزار بار آن را اجرا می‌ کند.

بن بورچفیل (Ben Burchfiel) یکی از اعضای این تیم پژوهشی می گوید: فرآیند با نشان دادن مجموعه کوچکی از مهارت های یاد دهنده از طریق عملیات از راه دور شروع می شود. سیاست انتشار مبتنی بر هوش مصنوعی ما پس از چند ساعت در پس ‌زمینه یاد می ‌گیرد. برای ما معمول است که بعد از ظهر به یک ربات آموزش دهیم، اجازه دهیم یک شبه یاد بگیرد و صبح روز بعد به یک رفتار جدید برسیم.

این تیم تحقیقاتی تاکنون از این روش برای آموزش سریع ربات ها در بیش از ۶۰ کار کوچک و عمدتاً مبتنی بر آشپزخانه استفاده کرده است. هر کدام از این کارها برای یک انسان بالغ نسبتا ساده است، اما هر کدام از ربات ها می خواهند تا خودشان بفهمند چگونه چنگ بزنند و نگه دارند و با استفاده از طیف وسیعی از ابزارها و ظروف، انواع مختلف اقلام را دستکاری کنند.

تویوتا می گوید که صدها کار را تا پایان سال تحت کنترل خواهد داشت و بیش از هزار کار را تا پایان سال ۲۰۲۴ هدف قرار داده است. به این ترتیب، این شرکت در حال توسعه چیزی است که معتقد است اولین مدل رفتار بزرگ یا LBM خواهد بود. چارچوبی که در نهایت گسترش می یابد و به چیزی شبیه ربات معادل ChatGPT تبدیل می شود. به عبارت دیگر، یک مدل کاملاً تولید شده توسط هوش مصنوعی از نحوه تعامل یک ربات با دنیای فیزیکی برای دستیابی به نتایج معین که به صورت انبوهی از داده‌ها و کاملاً غیرقابل درک برای چشم انسان، ظاهر می‌شود.

به گزارش سیناپرس، این تیم پژوهشی به طور موثر رویه ‌ای را ایجاد می ‌کند که به موجب آن مالکان و اپراتورهای ربات‌های آینده در انواع موقعیت‌ها می‌ توانند به سرعت به ربات ‌های خود وظایف جدید را در صورت لزوم آموزش داده و کل ناوگان ربات‌ها را با مهارت‌های جدید ارتقا دهند.

مترجم: مهدی فلاحی پناه

منبع: Toyota

sinaadmin۱۴۰۲-۰۶-۳۰