روش جدید برای نقشهبرداری و شناسایی اشیا توسط رباتها برای انجام کارها 🤖✨
مقدمه: رباتها و کارهای روزمره 🏠🧽
تصور کنید باید آشپزخانهای بههمریخته را مرتب کنید؛ مثلاً چند بسته سس روی کانتر پخش شدهاند. اگر هدف شما تمیز کردن کامل کانتر باشد، ممکن است همه بستهها را یکجا جمع کنید. اما اگر بخواهید اول فقط بستههای سس خردل را پیدا کنید، باید با دقت بیشتری به دستهها نگاه کنید. حالا اگر دنبال یک برند خاص، مثلاً “گری پوپون” هستید، جستجوی دقیقتری لازم است.
مهندسان MIT روش جدیدی توسعه دادهاند که به رباتها امکان میدهد تصمیمهای مشابهی بگیرند. این روش جدید به نام “کلیو” (Clio) به رباتها کمک میکند تا اشیای مهم را برای انجام کارهای مختلف شناسایی کنند.
“کلیو”: روشی برای شناسایی اشیا 🔍🗂️
کلیو (Clio) میتواند به ربات کمک کند تا بخشهای مهم صحنه را برای کار مشخص شناسایی کند. این ربات لیستی از کارهایی که با “زبان طبیعی” (Natural Language) توصیف شده است دریافت میکند و سپس تصمیم میگیرد که چه بخشهایی از محیط مهم هستند و باید آنها را “به خاطر بسپارد” (Remember).
تیم MIT از “کلیو” در آزمایشهای واقعی استفاده کرده و توانست با این روش، صحنههای مختلف را به سطوح مختلف از جزئیات تقسیم کند. این آزمایشها شامل محیطهای مختلف از جمله “دفتر کار” (Office) و ساختمانهای دانشگاه MIT بوده است. برای مثال، در یکی از آزمایشها، به ربات وظیفه داده شده بود که یک “اسباببازی سگ” (Dog Toy) را پیدا کند و ربات فقط قسمتهای مرتبط با این کار را شناسایی و نقشهبرداری کرد.
الهام از گذشته برای ساخت کلیو 📜🤔
“کلیو” (Clio) به نام الهه تاریخ در یونان باستان نامگذاری شده است، زیرا میتواند تنها عناصری را که برای یک کار خاص مهم هستند شناسایی و به خاطر بسپارد. محققان امیدوارند که “کلیو” در بسیاری از محیطها مانند عملیات “جستجو و نجات” (Search and Rescue)، خانهها، و حتی “کارخانجات” (Factories) مفید باشد.
به گفته “لوکا کارلون” (Luca Carlone)، استاد دانشگاه MIT، “کلیو به ربات کمک میکند محیط را بهتر درک کرده و تنها چیزهایی را که برای انجام مأموریت لازم است به یاد بیاورد.”
چالشهای شناسایی اشیا در محیط باز 🌍🚧
پیشرفتهای بزرگ در زمینههای “بینایی کامپیوتر” (Computer Vision) و “پردازش زبان طبیعی” (Natural Language Processing) باعث شده که رباتها بتوانند اشیا را شناسایی کنند. اما تا پیش از این، رباتها تنها در “محیطهای بسته” (Closed-Set Environments) که تعداد محدودی از اشیا را پیشتر شناخته بودند قادر به کار بودند.
در سالهای اخیر، محققان تلاش کردهاند تا رباتها بتوانند در “محیطهای باز” (Open Environments) و با اشیای ناشناخته هم کار کنند. با استفاده از “شبکههای عصبی” (Neural Networks)، رباتها میتوانند از تصاویر و متنهای اینترنتی یاد بگیرند و اشیا را در محیطهای جدید شناسایی کنند. اما همچنان چالشهایی برای شناسایی دقیق و مرتبط با کار مورد نظر باقی مانده است.
روش “کلیو”: تنظیم سطح جزئیات بر اساس کار 📝🤖
روش “کلیو” (Clio) به ربات کمک میکند تا بتواند محیط را با سطح جزئیاتی که خودکار و مناسب کار مورد نظر است تفسیر کند. برای مثال، اگر هدف ربات جابهجایی دستهای از کتابها باشد، او باید “دسته کتابها” (Stack of Books) را به عنوان یک شیء کامل شناسایی کند. اما اگر هدف جابهجایی یک “کتاب سبز” (Green Book) باشد، باید آن کتاب را به صورت جداگانه شناسایی و بقیه را نادیده بگیرد.
این روش از ترکیب “بینایی کامپیوتری” (Computer Vision) و “مدلهای زبانی بزرگ” (Large Language Models) استفاده میکند. تیم MIT از “گلوگاه اطلاعاتی” (Information Bottleneck) استفاده کرده که به ربات کمک میکند تا فقط بخشهایی از صحنه را که مهم هستند به یاد بسپارد و بقیه را حذف کند.
آزمایشهای واقعی “کلیو” 🏢🔬
محققان “کلیو” (Clio) را در محیطهای واقعی آزمایش کردند. یکی از آزمایشها در آپارتمان “ماجیو” (Maggio)، یکی از اعضای تیم، انجام شد که او هیچ تمیزکاری قبلی انجام نداده بود. در اینجا، “کلیو” توانست به سرعت صحنههای آپارتمان را “بخشبندی” (Segmentation) کرده و فقط بخشهای مربوط به کار مشخص شده (مثل دسته لباسها) را شناسایی کند.
همچنین، آنها از “کلیو” روی “ربات چهارپای اسپات” (Boston Dynamics’ Quadruped Robot Spot) استفاده کردند. ربات با کمک “کلیو” توانست اشیای مرتبط را شناسایی کرده و کارهای مشخص شده را انجام دهد.
آینده “کلیو”: مأموریتهای پیچیدهتر 🚀🌟
تیم MIT قصد دارد تا “کلیو” (Clio) را برای انجام کارهای پیچیدهتر و با سطح بالاتری از درک انسانی آماده کند. هدف این است که “کلیو” بتواند وظایف پیچیدهتری مانند “پیدا کردن بازماندگان” (Find Survivors) یا “برگرداندن برق” (Get Power Back On) را انجام دهد.
“ماجیو” میگوید: “ما هنوز به کلیو کارهایی نسبتاً ساده میدهیم، اما هدف ما این است که آن را به سطحی برسانیم که بتواند وظایف پیچیدهتری را با درکی شبیه به انسان انجام دهد.”
جمعبندی 📌
روش “کلیو” (Clio) یک قدم بزرگ در جهت هوشمندسازی رباتهاست که به آنها کمک میکند فقط به آنچه که برای انجام کار لازم است توجه کنند و محیط را بهصورت مؤثر تحلیل کنند. این توانایی میتواند در موقعیتهای مختلف از خانهها تا عملیاتهای نجات مورد استفاده قرار گیرد. 🏠🛠️🚑
نویسنده: جنیفر چو، مؤسسه فناوری ماساچوست (MIT)
نظرات کاربران