حراج واقعی! برای دریافت کتاب الکترونیکی رایگان با 25 دستور العمل برتر ما.

عملکرد بهتر هوش مصنوعی Gemini نسبت به GPT-4 در جواب سوال یادگیری ماشین چیست

به گزارش سرویس تازه های دنیای فناوری مجله عصر اطلاعات در اسفند ۱۴۰۲

تیرنان ری/ZDNET

گاهی اوقات، بهترین راه برای بررسی چیزی در زمینه چیزهایی است که قبلاً کمی درباره آنها می دانید. یا، حداقل، فکر کنید که دارید.

با این روحیه، من اخیراً ربات چت Gemini گوگل را که قبلاً Bard بود، در برابر ChatGPT-4 OpenAI آزمایش کردم. این آزمون بخشی از بحث در مورد یک عنصر کلیدی در اشکال مدرن یادگیری عمیق هوش مصنوعی (AI) بود. این عنصر نوعی هوش مصنوعی است که زیربنای ChatGPT و Gemini است. آن عنصر “نزول گرادیان تصادفی” (SGD) نامیده می شود.

همچنین: ChatGPT در مقابل Microsoft Copilot در مقابل Gemini: بهترین چت ربات هوش مصنوعی کدام است؟

نویسندگان، به‌ویژه روزنامه‌نگاران، تمایل دارند برای توضیح چیزهای پیچیده به استعاره و قیاس تکیه کنند. درک مفاهیم انتزاعی مانند SGD برای افراد عادی سخت است. بنابراین، به این نتیجه رسیدم که توضیح یک مفهوم علمی بسیار سخت در استعاره، آزمون خوبی برای هر دو برنامه بود.

من از Gemini و ChatGPT یک سوال ساده پرسیدم که ممکن است هنگام تلاش برای درک یک منطقه از طریق قیاس بپرسید:

آیا تشبیه یا استعاره خوبی برای نزول گرادیان تصادفی وجود دارد؟

تا آنجا که هدف از توضیح SGD از طریق قیاس برآورده شد، گوگل برنده شد. گوگل قادر به رسیدگی به درخواست های مکرر بود که به دنبال اصلاح راه حل بودند. در مقابل، ChatGPT OpenAI گیر کرد و به سادگی تکه هایی از اطلاعات را به روش های مختلف بدون پیشبرد راه حل تکرار کرد.

یکی از دلایل این تفاوت ممکن است این باشد که Gemini گوگل قادر به مقابله با یک “چرا؟” بود. سوال به جای “چی؟” هنگامی که ChatGPT با این سوال مواجه شد، “چرا از آن راه حل استفاده کردید؟”، خروجی رضایت بخش نبود — و این یک نتیجه گیری مهم است.

همچنین: چگونه گوگل و OpenAI GPT-4 را به ارائه پاسخ های به موقع تر وادار کردند

اما ابتدا، برخی زمینه ها. نزول گرادیان تصادفی یک روش ریاضی است که در آموزش شبکه های عصبی استفاده می شود. گاهی اوقات از آن به عنوان یک “قانون یادگیری” یاد می شود، مکانیزم اصلی که توسط آن روند آموزشی برنامه را اصلاح می کند.

یک شبکه عصبی خروجی تولید می کند و آموزش شامل مقایسه آن خروجی با یک خروجی خوب شناخته شده و تغییر شبکه عصبی تا جایی است که تا حد امکان به خروجی خوب شناخته شده نزدیک شود. برای بستن شکاف بین خروجی واقعی و مثال طلایی، یک سری تغییرات در تنظیمات شبکه عصبی ایجاد می شود.

آن سری از تغییرات به صورت شبه تصادفی (یا تصادفی) در فضایی انتزاعی از راه‌حل‌های ممکن یا گرادیان پیش می‌رود. دانشمندان به این فرآیند به عنوان تلاش برای یافتن حداقل تفاوت بین خروجی واقعی و مطلوب – پایین ترین نقطه گرادیان اشاره می کنند.

تشبیه کلاسیک برای این وضعیت، مورچه ای است که سعی می کند با عبور تصادفی از زمین، مسیر خود را از تپه به پایین ترین نقطه بیابد، در حالی که مورچه نمی تواند کل زمین را ببیند.

هر دو Gemini و ChatGPT-4 در پاسخ به سوال اصلی من خروجی مناسب و مشابهی ارائه دادند. جمینی از تشبیه یافتن گنج در انتهای دره استفاده کرد، که گنج استعاره ای برای محدود کردن تفاوت بین خروجی مطلوب و خروجی واقعی است:

اسکرین شات توسط Tiernan Ray/ZDNET

از سوی دیگر، OpenAI از تشبیه یک کوهنورد استفاده کرد که در مه غلیظ در پایین یک کوه سرگردان است، که هنگام تلاش برای رسیدن به ته دره قادر به دیدن فاصله زیادی نیست:

اسکرین شات توسط Tiernan Ray/ZDNET

هر دو نتیجه به اندازه کافی منصفانه بودند. اما من سپس درخواست های چالش برانگیزتری را وارد می کنم. و در اینجا بود که نتایج متفاوت شد.

من جوزا را به چالش کشیدم تا توضیح دهد که چرا گنج در قیاس در پایین یک دره است. چرا گنج را روی یک قله قرار نمی دهیم؟ جمینی در پاسخ گفت: “حق با شماست.”

اسکرین شات توسط Tiernan Ray/ZDNET

به گفته جمینی، جمینی سپس پیشنهاد داد که قیاس را با داستانی از گنج پنهان در یک اتاق مخفی در خرابه‌های باستان‌شناسی تنظیم کند، به طوری که “به طور شهودی” منطقی‌تر به نظر برسد. من فکر می کنم که این رویکرد روش خوبی برای ترکیب “چرا؟” بود. از اعلان برای حرکت قیاس به جلو.

به طور مشابه، من در ChatGPT-4 تایپ کردم: “این یک تشبیه بسیار خوب است، اما چرا کوهنورد تلاش می کند به انتهای دره برسد؟ آنها ممکن است به همان اندازه سعی کنند به بالای دره برسند؟”

همچنین: بر اساس یک مطالعه، GPT-4 در طول زمان به طور قابل توجهی احمقانه تر می شود

خروجی ChatGPT-4 به این سوال غافلگیرکننده بود. ChatGPT-4 به جای اینکه به دنبال بهبود قیاس باشد، به روشی که جمینی انجام داد، صرفاً توضیحی درباره اینکه چرا قیاس به این شکل صورت‌بندی شده است، ارائه کرد. نتیجه یک توضیح دقیق و پرمخاطب بود، اما کار فرمول‌بندی مجدد خروجی را برای ایجاد راه‌حل بهتر پیش نبرد:

اسکرین شات توسط Tiernan Ray/ZDNET

البته، راه‌های زیادی وجود دارد که می‌توان همه اعلان‌ها را اصلاح کرد تا هر دو برنامه را برای ارائه انواع مختلف پاسخ‌ها شرطی کنند.

با این حال، از یک شروع سرد، خروجی Gemini توانایی دنبال کردن یک کار را تا راه حل بعدی در صورت درخواست نشان داد. برنامه OpenAI طرح را از دست داد و صرفاً اطلاعات مربوط به پاسخی که قبلا ایجاد کرده بود را تکرار کرد.

و از آنجایی که SGD یک عنصر کلیدی در یادگیری عمیق هوش مصنوعی است، منصفانه است که نتیجه بگیریم که Gemini برنده این چالش است.

بمنظور اطلاع از دیگر خبرها به صفحه اخبار فناوری مراجعه کنید.