آیا هوش مصنوعی میتواند چهرهها را در اشیای بیجان ببیند؟ ![🤖](https://s.w.org/images/core/emoji/15.0.3/svg/1f916.svg)
![🔍](https://s.w.org/images/core/emoji/15.0.3/svg/1f50d.svg)
خیلی وقتها پیش میآید که ما چهرههایی را در اشیای بیجان مثل ابرها، ساندویچها، یا حتی دوشاخه برق میبینیم. این پدیده که “پَریدولیا” نام دارد، به معنی دیدن الگوها و چهرهها در جاهایی است که واقعاً وجود ندارند.
مثلاً در سال ۱۹۹۴، یک طراح جواهرات در فلوریدا به نام دیانا دایسر چهرهای را که شبیه به حضرت مریم بود، در یک ساندویچ پنیر تست شده دید و آن را به قیمت ۲۸،۰۰۰ دلار فروخت. اما چقدر درباره این پدیده و اینکه چرا این اتفاق میافتد، میدانیم؟
دانشمندان در آزمایشگاه هوش مصنوعی MIT یک مجموعه داده جدید از ۵۰۰۰ تصویر پریدولیک ساختهاند که توسط انسانها برچسبگذاری شدهاند و این مجموعه بسیار بزرگتر از هر مجموعه مشابه قبلی است. آنها با استفاده از این مجموعه، چندین نتیجه جالب درباره تفاوت بین درک انسان و ماشین و توانایی دیدن چهرهها به دست آوردهاند.
چه نتایجی به دست آمد؟
یکی از نتایج جالب این بود که مدلهای هوش مصنوعی نمیتوانند چهرههای پریدولیک را مانند انسانها تشخیص دهند. در واقع، وقتی این مدلها برای تشخیص چهرههای حیوانات آموزش داده شدند، عملکردشان در شناسایی چهرههای پریدولیک بهبود یافت. این موضوع احتمالاً نشاندهنده ارتباطی تکاملی بین توانایی دیدن چهرههای حیوانات (که برای بقا مهم بوده) و توانایی ما برای دیدن چهرهها در اشیای بیجان است.
یکی دیگر از کشفیات جالب این تیم چیزی است که آنها “منطقه طلایی پریدولیا” نامیدهاند. در این منطقه، احتمال دیدن چهرهها در اشیای بیجان بیشتر است.
ویلیام تی. فریمن، یکی از پژوهشگران اصلی پروژه، میگوید: “یک محدوده خاصی از پیچیدگی بصری وجود دارد که در آن احتمال دیدن چهرهها بیشتر است؛ اگر تصویر خیلی ساده باشد، جزییات کافی برای تشکیل چهره وجود ندارد و اگر خیلی پیچیده باشد، به نویز تصویری تبدیل میشود.”
برای بررسی این موضوع، تیم تحقیقاتی یک معادله برای مدلسازی نحوه تشخیص چهرهها توسط انسانها و الگوریتمها توسعه دادند و این “اوج پریدولیک” را یافتند، جایی که احتمال دیدن چهرهها بیشترین است.
کاربردها و اهمیت این مطالعه
این مطالعه نشان میدهد که چگونه میتوانیم سیستمهای تشخیص چهره را بهبود دهیم تا اشتباهات کمتری داشته باشند؛ مثل سیستمهایی که در خودروهای خودران، رباتها و تعاملات انسان و کامپیوتر استفاده میشوند. این مدلها میتوانند به طراحان محصول نیز کمک کنند تا محصولاتی طراحی کنند که ظاهر دوستانهتری داشته باشند.
مارک همیلتون، یکی از پژوهشگران، میگوید: “خیلی جالب است که انسانها به طور غریزی اشیای بیجان را با ویژگیهای انسانی تفسیر میکنند. مثلاً وقتی به یک دوشاخه برق نگاه میکنید، شاید تصور کنید که در حال آواز خواندن است و حتی میتوانید حرکت لبهایش را تجسم کنید! ولی الگوریتمها چنین کاری را بهطور طبیعی انجام نمیدهند.”
این موضوع سؤالات جالبی را مطرح میکند: چرا بین ادراک انسان و ماشین تفاوت وجود دارد؟ آیا پریدولیا برای ما مفید است یا مضر؟ چرا ماشینها این پدیده را تجربه نمیکنند؟
پژوهشگران در حال آمادهسازی این مجموعه داده برای اشتراک با جامعه علمی هستند و به دنبال تحقیقات بیشتری هستند. در آینده ممکن است این کار شامل آموزش مدلهای هوش مصنوعی برای فهم و توصیف چهرههای پریدولیک باشد، به گونهای که این مدلها بتوانند بیشتر شبیه به انسانها با تصاویر تعامل کنند.
نوشته شده توسط ریچل گوردون، مؤسسه فناوری ماساچوست (MIT)
نظرات کاربران