آیا چت جیپیتی میتواند چهرهها را شناسایی کند؟ 🤖
مقدمه
در طول یک سال گذشته، ChatGPT به قابلیت تجزیه و تحلیل تصاویر و متن افزوده شده است، که ویژگی جدید آن، GPT-4V(ision) نام دارد. 📷
برای مثال، اگر عکسی از محتویات یخچال خود بارگذاری کنید، ChatGPT میتواند توصیف کند که در عکس چه چیزی وجود دارد و سپس ایدههای غذایی مناسب را بر اساس آن مواد غذایی ارائه دهد. یا میتوانید عکسی از یک طراحی دستنویس از وبسایت جدید خود بفرستید و ChatGPT به شما کد HTML مربوطه را میدهد. 🔗
آزمایشات بر روی شناسایی چهرهها
به عنوان یک پژوهشگر در زمینه ادراک چهره، من به نحوه عملکرد ChatGPT در شناسایی تصاویر چهرهها، مثلاً تطابق دو تصویر متفاوت از یک شخص، علاقهمند هستم. اما چگونه میتوانیم بفهمیم که این چتبات چقدر در شناسایی چهرهها خوب است؟
تست «خواندن ذهن در چشمان»
اولین تستی که بر روی ChatGPT انجام دادم، تست «خواندن ذهن در چشمان» (Reading the Mind in the Eyes Test) بود. در این کار، تنها نواحی چشمان عکسها ارائه میشود و چهار کلمه توصیفی به عنوان گزینهها به نمایش در میآید، که یکی از آنها پاسخ صحیح است.
این تست به عنوان معیاری برای «نظریه ذهن» (Theory of Mind) در نظر گرفته میشود، که به توانایی کسی در تفسیر رفتار دیگری بر اساس وضعیت ذهنی آن شخص اشاره دارد. معمولاً افراد امتیاز حدود ۲۶ تا ۳۱ از ۳۶ کسب میکنند. ChatGPT به ۲۹ سوال به درستی پاسخ داد، که کمی بیشتر از امتیاز در یک مطالعه اخیر بود که محققان دیگر همین تست را به آن دادند. 🧠
تست تطابق چهره گلاسکو
در مرحله بعد، ChatGPT را بر روی تست «تطابق چهره گلاسکو» (Glasgow Face Matching Test) آزمایش کردم. در این تست، شرکتکنندگان با ۴۰ جفت تصویر چهره مواجه میشوند. نیمی از جفتها شامل دو عکس از یک شخص هستند که با دوربینهای مختلف گرفته شدهاند، و نیمی دیگر شامل دو عکس از دو فرد متفاوت اما شبیه به هم هستند.
وقتی از ChatGPT خواستم که تصمیم بگیرد آیا تصاویر همان شخص را نشان میدهند یا نه، میانگین امتیاز شرکتکنندگان ۸۱.۳٪ است. ChatGPT در این تست امتیاز ۹۲.۵٪ را کسب کرد. 🌟
تست دوقلوهای معروف
در نهایت، خواستم به شناسایی چهرهها بپردازم. ChatGPT طراحی شده است تا در برابر شناسایی افراد در تصاویر مقاومت کند. اما زمانی که به آن فشار آوردم تا بهترین «حدس» خود را ارائه دهد، در تست «دوقلوهای معروف» (Famous Faces Doppelgangers Test) آمادگی پاسخ دادن داشت.
در این تست، یک جفت چهره در هر یک از ۴۰ آزمایش نشان داده میشود، همراه با نام یک سلبریتی، و از شرکتکنندگان خواسته میشود که مشخص کنند کدام چهره متعلق به آن سلبریتی است. این کار دشوار است زیرا چهره دیگر بسیار شبیه به سلبریتی است. افراد معمولاً در این آزمایشات امتیاز حدود ۸۱.۵٪ برای آن دسته از سلبریتیها که میشناسند، کسب میکنند.
چندان شگفتانگیز است که ChatGPT در تمامی آزمایشات این تست، ۱۰۰٪ پاسخهای صحیح را کسب کرد. 😲
جمعبندی
بر اساس تجربیات من، به نظر میرسد ChatGPT به خوبی قادر به انجام وظایف مرتبط با شناسایی و شناسایی چهرههای انسانی، از جمله بیان احساسات آنها باشد. آن در این سه تست، به خوبی یا حتی بهتر از افراد عمل کرد.
البته اینها تنها آزمایشهای اولیه من هستند و نیاز به تحقیقات بیشتری وجود دارد تا تواناییهای آن به طور قطعی مشخص شود. اما این موضوع نشان میدهد که ChatGPT میتواند با تصاویر چهرهها به خوبی برخورد کند. 👀
عملکرد ChatGPT
ChatGPT بر اساس نوعی برنامه هوش مصنوعی (Artificial Intelligence – AI) به نام مدل زبان بزرگ (Large Language Model – LLM) ساخته شده است. این به این معناست که این مدل بر روی مقدار زیادی از دادههای متنی (و اکنون تصویری) آموزش دیده است.
ChatGPT میگوید که تصاویر چهره نیز بخش قابل توجهی از دادههای آموزشی آن بودهاند، اگرچه آنها تصاویر خاصی را ذخیره و به خاطر نمیسپارد. به نظر میرسد که آن بیشتر بر روی الگوها و ارتباطات کلی که در طول آموزش خود یاد گرفته، تکیه دارد.
بنابراین، با قرار گرفتن در معرض تصاویر چهرههای متعدد به همراه متنی که شامل کلمه «مشکوک» (Suspicious) است، ChatGPT توانست نمایی از آن حالت چهره توسعه دهد که با دیگر حالات مانند «طعنهآمیز» (Sarcastic) متمایز باشد.
به همین ترتیب، پالایش نمایهاش از چهره یک سلبریتی از طریق قرار گرفتن در معرضهای متعدد به این معنی بود که این مدل میتوانست آنها را از سایر چهرههای مشابه تشخیص دهد.
با توجه به نتایج من و دیگر نمایشها از این نسخه جدید چتبات، به نظر میرسد که عملکرد شگفتانگیز ChatGPT در سراسر وظایف مختلف با هر نسخه جدیدی که منتشر میشود، همچنان بهبود خواهد یافت. 📈
نویسنده: رابین کمر
کلمات تخصصی:
- Artificial Intelligence (AI) – هوش مصنوعی
- Large Language Model (LLM) – مدل زبان بزرگ
- Face Recognition – شناسایی چهره
- Theory of Mind – نظریه ذهن
- Doppelganger – دوقلو
- Glasgow Face Matching Test – تست تطابق چهره گلاسکو
- Suspicious – مشکوک
- Sarcastic – طعنهآمیز
- Image Analysis – تجزیه و تحلیل تصویر
- Emotional Expression – بیان احساسات
نظرات کاربران