آیا چت جی‌پی‌تی می‌تواند چهره‌ها را شناسایی کند؟ 🤖
بازدید 41

آیا چت جی‌پی‌تی می‌تواند چهره‌ها را شناسایی کند؟ 🤖

مقدمه

در طول یک سال گذشته، ChatGPT به قابلیت تجزیه و تحلیل تصاویر و متن افزوده شده است، که ویژگی جدید آن، GPT-4V(ision) نام دارد. 📷

برای مثال، اگر عکسی از محتویات یخچال خود بارگذاری کنید، ChatGPT می‌تواند توصیف کند که در عکس چه چیزی وجود دارد و سپس ایده‌های غذایی مناسب را بر اساس آن مواد غذایی ارائه دهد. یا می‌توانید عکسی از یک طراحی دست‌نویس از وب‌سایت جدید خود بفرستید و ChatGPT به شما کد HTML مربوطه را می‌دهد. 🔗

آزمایشات بر روی شناسایی چهره‌ها

به عنوان یک پژوهشگر در زمینه ادراک چهره، من به نحوه عملکرد ChatGPT در شناسایی تصاویر چهره‌ها، مثلاً تطابق دو تصویر متفاوت از یک شخص، علاقه‌مند هستم. اما چگونه می‌توانیم بفهمیم که این چت‌بات چقدر در شناسایی چهره‌ها خوب است؟

تست «خواندن ذهن در چشمان»

اولین تستی که بر روی ChatGPT انجام دادم، تست «خواندن ذهن در چشمان» (Reading the Mind in the Eyes Test) بود. در این کار، تنها نواحی چشمان عکس‌ها ارائه می‌شود و چهار کلمه توصیفی به عنوان گزینه‌ها به نمایش در می‌آید، که یکی از آن‌ها پاسخ صحیح است.

این تست به عنوان معیاری برای «نظریه ذهن» (Theory of Mind) در نظر گرفته می‌شود، که به توانایی کسی در تفسیر رفتار دیگری بر اساس وضعیت ذهنی آن شخص اشاره دارد. معمولاً افراد امتیاز حدود ۲۶ تا ۳۱ از ۳۶ کسب می‌کنند. ChatGPT به ۲۹ سوال به درستی پاسخ داد، که کمی بیشتر از امتیاز در یک مطالعه اخیر بود که محققان دیگر همین تست را به آن دادند. 🧠

تست تطابق چهره گلاسکو

در مرحله بعد، ChatGPT را بر روی تست «تطابق چهره گلاسکو» (Glasgow Face Matching Test) آزمایش کردم. در این تست، شرکت‌کنندگان با ۴۰ جفت تصویر چهره مواجه می‌شوند. نیمی از جفت‌ها شامل دو عکس از یک شخص هستند که با دوربین‌های مختلف گرفته شده‌اند، و نیمی دیگر شامل دو عکس از دو فرد متفاوت اما شبیه به هم هستند.

وقتی از ChatGPT خواستم که تصمیم بگیرد آیا تصاویر همان شخص را نشان می‌دهند یا نه، میانگین امتیاز شرکت‌کنندگان ۸۱.۳٪ است. ChatGPT در این تست امتیاز ۹۲.۵٪ را کسب کرد. 🌟

ads - Banner - chatGPT Plus

آیا چت جی‌پی‌تی می‌تواند چهره‌ها را شناسایی کند؟ 🤖

تست دوقلوهای معروف

در نهایت، خواستم به شناسایی چهره‌ها بپردازم. ChatGPT طراحی شده است تا در برابر شناسایی افراد در تصاویر مقاومت کند. اما زمانی که به آن فشار آوردم تا بهترین «حدس» خود را ارائه دهد، در تست «دوقلوهای معروف» (Famous Faces Doppelgangers Test) آمادگی پاسخ دادن داشت.

در این تست، یک جفت چهره در هر یک از ۴۰ آزمایش نشان داده می‌شود، همراه با نام یک سلبریتی، و از شرکت‌کنندگان خواسته می‌شود که مشخص کنند کدام چهره متعلق به آن سلبریتی است. این کار دشوار است زیرا چهره دیگر بسیار شبیه به سلبریتی است. افراد معمولاً در این آزمایشات امتیاز حدود ۸۱.۵٪ برای آن دسته از سلبریتی‌ها که می‌شناسند، کسب می‌کنند.

چندان شگفت‌انگیز است که ChatGPT در تمامی آزمایشات این تست، ۱۰۰٪ پاسخ‌های صحیح را کسب کرد. 😲

جمع‌بندی

بر اساس تجربیات من، به نظر می‌رسد ChatGPT به خوبی قادر به انجام وظایف مرتبط با شناسایی و شناسایی چهره‌های انسانی، از جمله بیان احساسات آن‌ها باشد. آن در این سه تست، به خوبی یا حتی بهتر از افراد عمل کرد.

البته این‌ها تنها آزمایش‌های اولیه من هستند و نیاز به تحقیقات بیشتری وجود دارد تا توانایی‌های آن به طور قطعی مشخص شود. اما این موضوع نشان می‌دهد که ChatGPT می‌تواند با تصاویر چهره‌ها به خوبی برخورد کند. 👀

عملکرد ChatGPT

ChatGPT بر اساس نوعی برنامه هوش مصنوعی (Artificial Intelligence – AI) به نام مدل زبان بزرگ (Large Language Model – LLM) ساخته شده است. این به این معناست که این مدل بر روی مقدار زیادی از داده‌های متنی (و اکنون تصویری) آموزش دیده است.

ChatGPT می‌گوید که تصاویر چهره نیز بخش قابل توجهی از داده‌های آموزشی آن بوده‌اند، اگرچه آن‌ها تصاویر خاصی را ذخیره و به خاطر نمی‌سپارد. به نظر می‌رسد که آن بیشتر بر روی الگوها و ارتباطات کلی که در طول آموزش خود یاد گرفته، تکیه دارد.

بنابراین، با قرار گرفتن در معرض تصاویر چهره‌های متعدد به همراه متنی که شامل کلمه «مشکوک» (Suspicious) است، ChatGPT توانست نمایی از آن حالت چهره توسعه دهد که با دیگر حالات مانند «طعنه‌آمیز» (Sarcastic) متمایز باشد.

به همین ترتیب، پالایش نمایه‌اش از چهره یک سلبریتی از طریق قرار گرفتن در معرض‌های متعدد به این معنی بود که این مدل می‌توانست آن‌ها را از سایر چهره‌های مشابه تشخیص دهد.

با توجه به نتایج من و دیگر نمایش‌ها از این نسخه جدید چت‌بات، به نظر می‌رسد که عملکرد شگفت‌انگیز ChatGPT در سراسر وظایف مختلف با هر نسخه جدیدی که منتشر می‌شود، همچنان بهبود خواهد یافت. 📈

نویسنده: رابین کمر


کلمات تخصصی:

  1. Artificial Intelligence (AI) – هوش مصنوعی
  2. Large Language Model (LLM) – مدل زبان بزرگ
  3. Face Recognition – شناسایی چهره
  4. Theory of Mind – نظریه ذهن
  5. Doppelganger – دوقلو
  6. Glasgow Face Matching Test – تست تطابق چهره گلاسکو
  7. Suspicious – مشکوک
  8. Sarcastic – طعنه‌آمیز
  9. Image Analysis – تجزیه و تحلیل تصویر
  10. Emotional Expression – بیان احساسات

 

نظرات کاربران

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *