آیا هوش مصنوعی می‌تواند چهره‌ها را در اشیای بی‌جان ببیند؟

خیلی وقت‌ها پیش می‌آید که ما چهره‌هایی را در اشیای بی‌جان مثل ابرها، ساندویچ‌ها، یا حتی دوشاخه برق می‌بینیم. این پدیده که “پَریدولیا” نام دارد، به معنی دیدن الگوها و چهره‌ها در جاهایی است که واقعاً وجود ندارند.

مثلاً در سال ۱۹۹۴، یک طراح جواهرات در فلوریدا به نام دیانا دایسر چهره‌ای را که شبیه به حضرت مریم بود، در یک ساندویچ پنیر تست شده دید و آن را به قیمت ۲۸،۰۰۰ دلار فروخت. اما چقدر درباره این پدیده و این‌که چرا این اتفاق می‌افتد، می‌دانیم؟

دانشمندان در آزمایشگاه هوش مصنوعی MIT یک مجموعه داده جدید از ۵۰۰۰ تصویر پریدولیک ساخته‌اند که توسط انسان‌ها برچسب‌گذاری شده‌اند و این مجموعه بسیار بزرگ‌تر از هر مجموعه مشابه قبلی است. آن‌ها با استفاده از این مجموعه، چندین نتیجه جالب درباره تفاوت بین درک انسان و ماشین و توانایی دیدن چهره‌ها به دست آورده‌اند.

چه نتایجی به دست آمد؟
یکی از نتایج جالب این بود که مدل‌های هوش مصنوعی نمی‌توانند چهره‌های پریدولیک را مانند انسان‌ها تشخیص دهند. در واقع، وقتی این مدل‌ها برای تشخیص چهره‌های حیوانات آموزش داده شدند، عملکردشان در شناسایی چهره‌های پریدولیک بهبود یافت. این موضوع احتمالاً نشان‌دهنده ارتباطی تکاملی بین توانایی دیدن چهره‌های حیوانات (که برای بقا مهم بوده) و توانایی ما برای دیدن چهره‌ها در اشیای بی‌جان است.

یکی دیگر از کشفیات جالب این تیم چیزی است که آن‌ها “منطقه طلایی پریدولیا” نامیده‌اند. در این منطقه، احتمال دیدن چهره‌ها در اشیای بی‌جان بیشتر است.

ویلیام تی. فریمن، یکی از پژوهشگران اصلی پروژه، می‌گوید: “یک محدوده خاصی از پیچیدگی بصری وجود دارد که در آن احتمال دیدن چهره‌ها بیشتر است؛ اگر تصویر خیلی ساده باشد، جزییات کافی برای تشکیل چهره وجود ندارد و اگر خیلی پیچیده باشد، به نویز تصویری تبدیل می‌شود.”

برای بررسی این موضوع، تیم تحقیقاتی یک معادله برای مدل‌سازی نحوه تشخیص چهره‌ها توسط انسان‌ها و الگوریتم‌ها توسعه دادند و این “اوج پریدولیک” را یافتند، جایی که احتمال دیدن چهره‌ها بیشترین است.

کاربردها و اهمیت این مطالعه
این مطالعه نشان می‌دهد که چگونه می‌توانیم سیستم‌های تشخیص چهره را بهبود دهیم تا اشتباهات کمتری داشته باشند؛ مثل سیستم‌هایی که در خودروهای خودران، ربات‌ها و تعاملات انسان و کامپیوتر استفاده می‌شوند. این مدل‌ها می‌توانند به طراحان محصول نیز کمک کنند تا محصولاتی طراحی کنند که ظاهر دوستانه‌تری داشته باشند.

مارک همیلتون، یکی از پژوهشگران، می‌گوید: “خیلی جالب است که انسان‌ها به طور غریزی اشیای بی‌جان را با ویژگی‌های انسانی تفسیر می‌کنند. مثلاً وقتی به یک دوشاخه برق نگاه می‌کنید، شاید تصور کنید که در حال آواز خواندن است و حتی می‌توانید حرکت لب‌هایش را تجسم کنید! ولی الگوریتم‌ها چنین کاری را به‌طور طبیعی انجام نمی‌دهند.”

این موضوع سؤالات جالبی را مطرح می‌کند: چرا بین ادراک انسان و ماشین تفاوت وجود دارد؟ آیا پریدولیا برای ما مفید است یا مضر؟ چرا ماشین‌ها این پدیده را تجربه نمی‌کنند؟

پژوهشگران در حال آماده‌سازی این مجموعه داده برای اشتراک با جامعه علمی هستند و به دنبال تحقیقات بیشتری هستند. در آینده ممکن است این کار شامل آموزش مدل‌های هوش مصنوعی برای فهم و توصیف چهره‌های پریدولیک باشد، به گونه‌ای که این مدل‌ها بتوانند بیشتر شبیه به انسان‌ها با تصاویر تعامل کنند.