مدل M2M-100 فیس بوک ؛ اولین مترجم ماشینی چندزبانه در جهان

به گزارش سرویس تازه های دنیای فناوری مجله تک تایمز

رسانه تک تایمز – مترجم چند زبانی جدید فیس بوک به نام M2M-100 اولین مدل جهان است که می تواند بدون واسطه گری زبان انگلیسی، دو زبان مختلف را به یکدیگر بازگردانی کند.

فیس بوک با استفاده از ترجمه ماشینی خودکار، می تواند هر محتوای نوشته شده در پلتفرم خود را به طور مجازی به یک زبان محلی تبدیل کند. این سیستم از زبان انگلیسی به عنوان یک زبان واسطه جهت ترجمه بهره می گیرد، مثلا برای ترجمه چینی به فرانسوی، ابتدا چینی را به انگلیسی، و سپس انگلیسی را به فرانسوی تبدیل می کند. اما این کار، علاوه بر افزایش پیچیدگی فرایند، اغلب موجب کاهش دقت در ترجمه می شود. به همین خاطر، فیسبوک یک مدل MT جدید را به وجود آورده که می تواند به طور مستقیم، دو زبان مختلف را به یکدیگر بازگردانی کند، بدون اینکه به واسطه گری زبان انگلیسی نیاز باشد.

طبق گفته فیسبوک، مدل جدید با نام M2M-100 اولین مدل ترجمه ماشینی چندزبانی (MMT) است که می تواند هر زوج از زبان های مختلف را به هم بازگردانی کند. هوش مصنوعی فیس بوک یک مجموعه داده عظیم حاوی 7.5 میلیارد جمله را از 100 زبان مختلف به وجود آورده است. با استفاده از این مجموعه داده، تیم پژوهشی یک مدل ترجمه جهانی را با بیش از 15 میلیارد پارمتر آموزش داده اند که اطلاعات را از زبان های مربوطه گرفته و متن متنوع تری از زبان ها و مورفولوژی را منعکس می کند. فیس بوک با استفاده از روش های جدید، کل داده های موجود در دسترس عموم را در طول سال ها جمع آوری کرده است.

در ایجاد مدل M2M-100 فیس بوک، روش های مختلفی از جمله CommonCrawl برای جمع آوری نمونه های متنی در وب، و FastText برای شناسایی و کلاس بندی زبان ها به کار رفته است. تیم پژوهشی فیس بوک برای ترجمه داده ها به سیستم LASER تکیه کرده اند، که جملات با معنای مشابه را به یک تفکر مشابه نگاشت می شوند. بنابراین اگر یک جمله به زبان چینی و فرانسوی وجود داشته باشد که معنای مشابهی داشته باشند، با یکدیگر همپوشانی داشته و ناحیۀ همپوشان در واقع همان جملات هم تراز هستند. 

مدل M2M-100 فیس بوک فعلا در حال آموزش بوده و دسترسی به آن به میزان منابعی بستگی دارد که در اختیار هوش مصنوعی قرار می گیرد. زبان های اصلی دارای منابع و داده های عظیمی هستند، پس آموزش مدل برای ترجمه این زبان ها به یکدیگر چندان با مشکل مواجه نمی شود. با این حال، ترجمه زبان هایی مثل آفریقایی و زولو به دلیل کمبود منابع کافی، چالش برانگیز است.

کمپانی فیس بوک برای کمک به پیشرفت های بیشتر، مجموعه داده ها، مدل، مراحل آموزشی و ارزیابی را به طور منبع باز در اختیار انجمن های تحقیقاتی قرار داده است. با این حال این شرکت قصد دارد تا سیستم خود را به طور مستقل توسعه بخشد و در نهایت از این فناوری در عملیات روزانه استفاده کند.

بمنظور اطلاع از دیگر خبرها به صفحه اخبار تکنولوژی مراجعه کنید.
منبع خبر