قابلیت جدید هوش مصنوعی برای تولید تصاویر بر اساس کپشن

به گزارش سرویس تازه های دنیای فناوری مجله تک تایمز ،

 پژوهشگران مؤسسه‌ی هوش مصنوعی آلن (AI2)، الگوریتم یادگیری ماشینی را طراحی کردند که قادر است تنها بر اساس کپشن‌های متنی، تصاویری را تولید کند. نتایج کمی ترسناک هستند اما گامی مهم در جهت پژوهش‌های هوش مصنوعی و پردازش تصویر به شمار می‌روند. بر خلاف الگوریتم‌های دیگر یادگیری ماشین، این الگوریتم صرفا آزمایشی در جهت اثبات قابلیت‌های هوش مصنوعی است. ایده‌ی اصلی ساخت مدل بینایی کامپیوتری بود که قادر است تصاویر را بر اساس آنچه در تصویر می‌بیند کپشن‌گذاری کند یا برعکس تصاویر را بر اساس کپشن آن‌ها تولید کند.

مدل به دست‌آمده، محدودیت‌های الگوریتم‌های بینایی کامپیوتر را ثابت کرد. حتی یک کودک هم می‌تواند تصاویر را با کلمات توصیف کند یا با شنیدن کلمه‌ای تصویر آن را در ذهن خود تجسم کند؛ اما پژوهشگران مؤسسه‌ی آلن در پیاده‌سازی این فرآیند روی  مدلی به نام LXMERT به نتایج خوبی نرسیدند. این سیستم با دریافت کپشن، خروجی‌های عجیب و دور از واقعیتی را برگرداند.

در ادامه بخوانید:

پژوهشگران با اعمال تغییراتی در LXMERT مدلX-LXMERT را ساختند. با اینکه نتایج X-LXMERT کاملا منطبق با کپشن ورودی نبودند، حداقل تصاویر قابل درکی تولید کرد. با اینکه محدودیت‌ها و نتایج X-LXMERT چندان الهام بخش تحولات AI نیستند، روش ماسک‌گذاری به کار رفته در این سیستم، اولین گام مهم در آموزش عمل «جای گذاری» به هوش مصنوعی است. یکی از پیامدهای مثبت پژوهش فوق، بهبود بینایی کامپیوتر و تشخیص چهره است. به بیان دیگر هرچقدر توانایی کامپیوتر در درک مفاهیم توصیفی یک تصویر یا ویرایش تصویر افزایش پیدا کند، قادر به اعمال وظایف پیچیده‌تری روی تصاویر خواهد بود.

بمنظور اطلاع از دیگر خبرها به صفحه اخبار فناوری مراجعه کنید.
منبع خبر

برچسب ها

نوشته های مشابه

بستن