تویوتا، موسسه تکنولوژی ماساچوست و دانشگاه مهندسی کلمبیا نتایج عجیبی را از یک رویکرد یادگیری هوش مصنوعی جدید نشان داده اند که رباتها می توانند به سرعت مهارتهای جدید به دست آورند.
به گزارش سیناپرس، ما در طلوع عصر رباتیک همه منظوره زندگی می کنیم. اکنون دهها شرکت احساس کرده اند که زمان سرمایه گذاری کلان بر روی رباتهای انسان نما فرا رسیده که می توانند به طور مستقل راه خود را در محیط های کاری موجود بپیمایند و وظایف را از کارگران انسانی تحویل بگیرند.
برای گسترش قابلیتهای ربات ها تا جایی که آن ها بتوانند در هر مکان شغلی استفاده شوند و شروع به انجام وظایف مختلف کنند، به روشی برای ارتقای سریع مهارتهای خود بر اساس دستورالعملها یا نمایشهای انسانی نیاز دارند. اینجاست که تویوتا ادعا می کند با رویکرد یادگیری جدید مبتنی بر سیاست انتشار که به گفته این شرکت دری را به روی مفهوم مدلهای رفتاری بزرگ باز می کند، به پیشرفت عظیمی دست یافته است.
سیاست انتشار مفهومی است که تویوتا با مشارکت مهندسی کلمبیا و MIT توسعه داده است، اینگونه توصیف می شود: روشی جدید برای ایجاد رفتار ربات با نمایش نظارت دیداری و حرکتی یک ربات.
اساساً، جایی که مدلهای زبان بزرگ (LLM) مانند ChatGPT می توانند میلیاردها کلمه از نوشته های انسانی را بنوشند و به خود بیاموزند که بنویسند و کدنویسی کنند، سیاست انتشار به هوش مصنوعی رباتیک اجازه می دهد تا یک ربات تماشا کند که چگونه یک انسان یک کار فیزیکی معین را در دنیای واقعی انجام می دهد و سپس اساسا خود را طوری برنامه ریزی کند که آن کار را به شیوه ای انعطاف پذیر انجام دهد.
در حالی که برخی از استارتاپها به رباتهای خود از طریق حضور از راه دور آموزش می دهند، رویکرد تویوتا بیشتر بر روی لمس متمرکز است. اپراتورها از هدست واقعیت مجازی استفاده نمی کنند، اما بازخورد لمسی را از گیرههای نرم و انعطاف پذیر ربات از طریق کنترلهای دستی خود دریافت می کنند که به آنها این امکان را می دهد تا حسی را که ربات هنگام تماس با اشیا احساس می کند، دریابند.
هنگامی که یک اپراتور انسانی به رباتها نشان داد که چگونه یک کار را در چندین زمان مختلف، در شرایط کمی متفاوت انجام دهند، هوش مصنوعی ربات مدل داخلی خود را از ظاهر موفقیت و شکست ساخته و سپس هزاران هزار بار آن را اجرا می کند.
بن بورچفیل (Ben Burchfiel) یکی از اعضای این تیم پژوهشی می گوید: فرآیند با نشان دادن مجموعه کوچکی از مهارت های یاد دهنده از طریق عملیات از راه دور شروع می شود. سیاست انتشار مبتنی بر هوش مصنوعی ما پس از چند ساعت در پس زمینه یاد می گیرد. برای ما معمول است که بعد از ظهر به یک ربات آموزش دهیم، اجازه دهیم یک شبه یاد بگیرد و صبح روز بعد به یک رفتار جدید برسیم.
این تیم تحقیقاتی تاکنون از این روش برای آموزش سریع ربات ها در بیش از ۶۰ کار کوچک و عمدتاً مبتنی بر آشپزخانه استفاده کرده است. هر کدام از این کارها برای یک انسان بالغ نسبتا ساده است، اما هر کدام از ربات ها می خواهند تا خودشان بفهمند چگونه چنگ بزنند و نگه دارند و با استفاده از طیف وسیعی از ابزارها و ظروف، انواع مختلف اقلام را دستکاری کنند.
تویوتا می گوید که صدها کار را تا پایان سال تحت کنترل خواهد داشت و بیش از هزار کار را تا پایان سال ۲۰۲۴ هدف قرار داده است. به این ترتیب، این شرکت در حال توسعه چیزی است که معتقد است اولین مدل رفتار بزرگ یا LBM خواهد بود. چارچوبی که در نهایت گسترش می یابد و به چیزی شبیه ربات معادل ChatGPT تبدیل می شود. به عبارت دیگر، یک مدل کاملاً تولید شده توسط هوش مصنوعی از نحوه تعامل یک ربات با دنیای فیزیکی برای دستیابی به نتایج معین که به صورت انبوهی از دادهها و کاملاً غیرقابل درک برای چشم انسان، ظاهر میشود.
به گزارش سیناپرس، این تیم پژوهشی به طور موثر رویه ای را ایجاد می کند که به موجب آن مالکان و اپراتورهای رباتهای آینده در انواع موقعیتها می توانند به سرعت به ربات های خود وظایف جدید را در صورت لزوم آموزش داده و کل ناوگان رباتها را با مهارتهای جدید ارتقا دهند.
مترجم: مهدی فلاحی پناه
منبع: Toyota
No tags for this post.