روش جدید برای نقشه‌برداری و شناسایی اشیا توسط ربات‌ها برای انجام کارها 🤖✨
بازدید 76

روش جدید برای نقشه‌برداری و شناسایی اشیا توسط ربات‌ها برای انجام کارها 🤖✨

مقدمه: ربات‌ها و کارهای روزمره 🏠🧽

تصور کنید باید آشپزخانه‌ای به‌هم‌ریخته را مرتب کنید؛ مثلاً چند بسته سس روی کانتر پخش شده‌اند. اگر هدف شما تمیز کردن کامل کانتر باشد، ممکن است همه بسته‌ها را یکجا جمع کنید. اما اگر بخواهید اول فقط بسته‌های سس خردل را پیدا کنید، باید با دقت بیشتری به دسته‌ها نگاه کنید. حالا اگر دنبال یک برند خاص، مثلاً “گری پوپون” هستید، جستجوی دقیق‌تری لازم است.

مهندسان MIT روش جدیدی توسعه داده‌اند که به ربات‌ها امکان می‌دهد تصمیم‌های مشابهی بگیرند. این روش جدید به نام “کلیو” (Clio) به ربات‌ها کمک می‌کند تا اشیای مهم را برای انجام کارهای مختلف شناسایی کنند.

“کلیو”: روشی برای شناسایی اشیا 🔍🗂️

کلیو (Clio) می‌تواند به ربات کمک کند تا بخش‌های مهم صحنه را برای کار مشخص شناسایی کند. این ربات لیستی از کارهایی که با “زبان طبیعی” (Natural Language) توصیف شده است دریافت می‌کند و سپس تصمیم می‌گیرد که چه بخش‌هایی از محیط مهم هستند و باید آن‌ها را “به خاطر بسپارد” (Remember).

تیم MIT از “کلیو” در آزمایش‌های واقعی استفاده کرده و توانست با این روش، صحنه‌های مختلف را به سطوح مختلف از جزئیات تقسیم کند. این آزمایش‌ها شامل محیط‌های مختلف از جمله “دفتر کار” (Office) و ساختمان‌های دانشگاه MIT بوده است. برای مثال، در یکی از آزمایش‌ها، به ربات وظیفه داده شده بود که یک “اسباب‌بازی سگ” (Dog Toy) را پیدا کند و ربات فقط قسمت‌های مرتبط با این کار را شناسایی و نقشه‌برداری کرد.

الهام از گذشته برای ساخت کلیو 📜🤔

ads - Banner - chatGPT Plus

“کلیو” (Clio) به نام الهه تاریخ در یونان باستان نام‌گذاری شده است، زیرا می‌تواند تنها عناصری را که برای یک کار خاص مهم هستند شناسایی و به خاطر بسپارد. محققان امیدوارند که “کلیو” در بسیاری از محیط‌ها مانند عملیات “جستجو و نجات” (Search and Rescue)، خانه‌ها، و حتی “کارخانجات” (Factories) مفید باشد.

به گفته “لوکا کارلون” (Luca Carlone)، استاد دانشگاه MIT، “کلیو به ربات کمک می‌کند محیط را بهتر درک کرده و تنها چیزهایی را که برای انجام مأموریت لازم است به یاد بیاورد.”

چالش‌های شناسایی اشیا در محیط باز 🌍🚧

پیشرفت‌های بزرگ در زمینه‌های “بینایی کامپیوتر” (Computer Vision) و “پردازش زبان طبیعی” (Natural Language Processing) باعث شده که ربات‌ها بتوانند اشیا را شناسایی کنند. اما تا پیش از این، ربات‌ها تنها در “محیط‌های بسته” (Closed-Set Environments) که تعداد محدودی از اشیا را پیشتر شناخته بودند قادر به کار بودند.

در سال‌های اخیر، محققان تلاش کرده‌اند تا ربات‌ها بتوانند در “محیط‌های باز” (Open Environments) و با اشیای ناشناخته هم کار کنند. با استفاده از “شبکه‌های عصبی” (Neural Networks)، ربات‌ها می‌توانند از تصاویر و متن‌های اینترنتی یاد بگیرند و اشیا را در محیط‌های جدید شناسایی کنند. اما همچنان چالش‌هایی برای شناسایی دقیق و مرتبط با کار مورد نظر باقی مانده است.

روش “کلیو”: تنظیم سطح جزئیات بر اساس کار 📝🤖

روش “کلیو” (Clio) به ربات کمک می‌کند تا بتواند محیط را با سطح جزئیاتی که خودکار و مناسب کار مورد نظر است تفسیر کند. برای مثال، اگر هدف ربات جابه‌جایی دسته‌ای از کتاب‌ها باشد، او باید “دسته کتاب‌ها” (Stack of Books) را به عنوان یک شیء کامل شناسایی کند. اما اگر هدف جابه‌جایی یک “کتاب سبز” (Green Book) باشد، باید آن کتاب را به صورت جداگانه شناسایی و بقیه را نادیده بگیرد.

این روش از ترکیب “بینایی کامپیوتری” (Computer Vision) و “مدل‌های زبانی بزرگ” (Large Language Models) استفاده می‌کند. تیم MIT از “گلوگاه اطلاعاتی” (Information Bottleneck) استفاده کرده که به ربات کمک می‌کند تا فقط بخش‌هایی از صحنه را که مهم هستند به یاد بسپارد و بقیه را حذف کند.

آزمایش‌های واقعی “کلیو” 🏢🔬

محققان “کلیو” (Clio) را در محیط‌های واقعی آزمایش کردند. یکی از آزمایش‌ها در آپارتمان “ماجیو” (Maggio)، یکی از اعضای تیم، انجام شد که او هیچ تمیزکاری قبلی انجام نداده بود. در اینجا، “کلیو” توانست به سرعت صحنه‌های آپارتمان را “بخش‌بندی” (Segmentation) کرده و فقط بخش‌های مربوط به کار مشخص شده (مثل دسته لباس‌ها) را شناسایی کند.

همچنین، آن‌ها از “کلیو” روی “ربات چهارپای اسپات” (Boston Dynamics’ Quadruped Robot Spot) استفاده کردند. ربات با کمک “کلیو” توانست اشیای مرتبط را شناسایی کرده و کارهای مشخص شده را انجام دهد.

آینده “کلیو”: مأموریت‌های پیچیده‌تر 🚀🌟

تیم MIT قصد دارد تا “کلیو” (Clio) را برای انجام کارهای پیچیده‌تر و با سطح بالاتری از درک انسانی آماده کند. هدف این است که “کلیو” بتواند وظایف پیچیده‌تری مانند “پیدا کردن بازماندگان” (Find Survivors) یا “برگرداندن برق” (Get Power Back On) را انجام دهد.

“ماجیو” می‌گوید: “ما هنوز به کلیو کارهایی نسبتاً ساده می‌دهیم، اما هدف ما این است که آن را به سطحی برسانیم که بتواند وظایف پیچیده‌تری را با درکی شبیه به انسان انجام دهد.”

جمع‌بندی 📌

روش “کلیو” (Clio) یک قدم بزرگ در جهت هوشمندسازی ربات‌هاست که به آن‌ها کمک می‌کند فقط به آنچه که برای انجام کار لازم است توجه کنند و محیط را به‌صورت مؤثر تحلیل کنند. این توانایی می‌تواند در موقعیت‌های مختلف از خانه‌ها تا عملیات‌های نجات مورد استفاده قرار گیرد. 🏠🛠️🚑

نویسنده: جنیفر چو، مؤسسه فناوری ماساچوست (MIT)

نظرات کاربران

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *