به گزارش سرویس تازه های دنیای فناوری مجله عصر اطلاعات در اسفند ۱۴۰۲
گاهی اوقات، بهترین راه برای بررسی چیزی در زمینه چیزهایی است که قبلاً کمی درباره آنها می دانید. یا، حداقل، فکر کنید که دارید.
با این روحیه، من اخیراً ربات چت Gemini گوگل را که قبلاً Bard بود، در برابر ChatGPT-4 OpenAI آزمایش کردم. این آزمون بخشی از بحث در مورد یک عنصر کلیدی در اشکال مدرن یادگیری عمیق هوش مصنوعی (AI) بود. این عنصر نوعی هوش مصنوعی است که زیربنای ChatGPT و Gemini است. آن عنصر “نزول گرادیان تصادفی” (SGD) نامیده می شود.
همچنین: ChatGPT در مقابل Microsoft Copilot در مقابل Gemini: بهترین چت ربات هوش مصنوعی کدام است؟
نویسندگان، بهویژه روزنامهنگاران، تمایل دارند برای توضیح چیزهای پیچیده به استعاره و قیاس تکیه کنند. درک مفاهیم انتزاعی مانند SGD برای افراد عادی سخت است. بنابراین، به این نتیجه رسیدم که توضیح یک مفهوم علمی بسیار سخت در استعاره، آزمون خوبی برای هر دو برنامه بود.
من از Gemini و ChatGPT یک سوال ساده پرسیدم که ممکن است هنگام تلاش برای درک یک منطقه از طریق قیاس بپرسید:
آیا تشبیه یا استعاره خوبی برای نزول گرادیان تصادفی وجود دارد؟
تا آنجا که هدف از توضیح SGD از طریق قیاس برآورده شد، گوگل برنده شد. گوگل قادر به رسیدگی به درخواست های مکرر بود که به دنبال اصلاح راه حل بودند. در مقابل، ChatGPT OpenAI گیر کرد و به سادگی تکه هایی از اطلاعات را به روش های مختلف بدون پیشبرد راه حل تکرار کرد.
یکی از دلایل این تفاوت ممکن است این باشد که Gemini گوگل قادر به مقابله با یک “چرا؟” بود. سوال به جای “چی؟” هنگامی که ChatGPT با این سوال مواجه شد، “چرا از آن راه حل استفاده کردید؟”، خروجی رضایت بخش نبود — و این یک نتیجه گیری مهم است.
همچنین: چگونه گوگل و OpenAI GPT-4 را به ارائه پاسخ های به موقع تر وادار کردند
اما ابتدا، برخی زمینه ها. نزول گرادیان تصادفی یک روش ریاضی است که در آموزش شبکه های عصبی استفاده می شود. گاهی اوقات از آن به عنوان یک “قانون یادگیری” یاد می شود، مکانیزم اصلی که توسط آن روند آموزشی برنامه را اصلاح می کند.
یک شبکه عصبی خروجی تولید می کند و آموزش شامل مقایسه آن خروجی با یک خروجی خوب شناخته شده و تغییر شبکه عصبی تا جایی است که تا حد امکان به خروجی خوب شناخته شده نزدیک شود. برای بستن شکاف بین خروجی واقعی و مثال طلایی، یک سری تغییرات در تنظیمات شبکه عصبی ایجاد می شود.
آن سری از تغییرات به صورت شبه تصادفی (یا تصادفی) در فضایی انتزاعی از راهحلهای ممکن یا گرادیان پیش میرود. دانشمندان به این فرآیند به عنوان تلاش برای یافتن حداقل تفاوت بین خروجی واقعی و مطلوب – پایین ترین نقطه گرادیان اشاره می کنند.
تشبیه کلاسیک برای این وضعیت، مورچه ای است که سعی می کند با عبور تصادفی از زمین، مسیر خود را از تپه به پایین ترین نقطه بیابد، در حالی که مورچه نمی تواند کل زمین را ببیند.
هر دو Gemini و ChatGPT-4 در پاسخ به سوال اصلی من خروجی مناسب و مشابهی ارائه دادند. جمینی از تشبیه یافتن گنج در انتهای دره استفاده کرد، که گنج استعاره ای برای محدود کردن تفاوت بین خروجی مطلوب و خروجی واقعی است:
از سوی دیگر، OpenAI از تشبیه یک کوهنورد استفاده کرد که در مه غلیظ در پایین یک کوه سرگردان است، که هنگام تلاش برای رسیدن به ته دره قادر به دیدن فاصله زیادی نیست:
هر دو نتیجه به اندازه کافی منصفانه بودند. اما من سپس درخواست های چالش برانگیزتری را وارد می کنم. و در اینجا بود که نتایج متفاوت شد.
من جوزا را به چالش کشیدم تا توضیح دهد که چرا گنج در قیاس در پایین یک دره است. چرا گنج را روی یک قله قرار نمی دهیم؟ جمینی در پاسخ گفت: “حق با شماست.”
به گفته جمینی، جمینی سپس پیشنهاد داد که قیاس را با داستانی از گنج پنهان در یک اتاق مخفی در خرابههای باستانشناسی تنظیم کند، به طوری که “به طور شهودی” منطقیتر به نظر برسد. من فکر می کنم که این رویکرد روش خوبی برای ترکیب “چرا؟” بود. از اعلان برای حرکت قیاس به جلو.
به طور مشابه، من در ChatGPT-4 تایپ کردم: “این یک تشبیه بسیار خوب است، اما چرا کوهنورد تلاش می کند به انتهای دره برسد؟ آنها ممکن است به همان اندازه سعی کنند به بالای دره برسند؟”
همچنین: بر اساس یک مطالعه، GPT-4 در طول زمان به طور قابل توجهی احمقانه تر می شود
خروجی ChatGPT-4 به این سوال غافلگیرکننده بود. ChatGPT-4 به جای اینکه به دنبال بهبود قیاس باشد، به روشی که جمینی انجام داد، صرفاً توضیحی درباره اینکه چرا قیاس به این شکل صورتبندی شده است، ارائه کرد. نتیجه یک توضیح دقیق و پرمخاطب بود، اما کار فرمولبندی مجدد خروجی را برای ایجاد راهحل بهتر پیش نبرد:
البته، راههای زیادی وجود دارد که میتوان همه اعلانها را اصلاح کرد تا هر دو برنامه را برای ارائه انواع مختلف پاسخها شرطی کنند.
با این حال، از یک شروع سرد، خروجی Gemini توانایی دنبال کردن یک کار را تا راه حل بعدی در صورت درخواست نشان داد. برنامه OpenAI طرح را از دست داد و صرفاً اطلاعات مربوط به پاسخی که قبلا ایجاد کرده بود را تکرار کرد.
و از آنجایی که SGD یک عنصر کلیدی در یادگیری عمیق هوش مصنوعی است، منصفانه است که نتیجه بگیریم که Gemini برنده این چالش است.
بمنظور اطلاع از دیگر خبرها به صفحه اخبار فناوری مراجعه کنید.
سلام!! نام من سارا است
من عاشق غذا خوردن ، مسافرت و خوردن برخی دیگر هستم! من با مرد رویاهای من ازدواج کرده ام و دختر بچه ای زیبا دارم که لبخندهایش می تواند روز همه را درخشان کند!