هوش مصنوعی با حافظه محدود، دستور زبان را بهتر یاد می‌گیرد؛ کشف شگفت‌انگیز دانشمندان درباره راز یادگیری زبان

به گزارش آماج، پژوهشگران در مطالعه‌ای جدید نشان داده‌اند که اعمال محدودیت‌هایی مشابه حافظه انسان بر مدل‌های هوش مصنوعی می‌تواند توانایی آن‌ها را در یادگیری زبان و درک ساختارهای گرامری به شکل قابل‌توجهی افزایش دهد. این یافته می‌تواند مسیر تازه‌ای را برای توسعه نسل آینده مدل‌های زبانی و سیستم‌های هوش مصنوعی باز کند.

در حالی که مدل‌های زبانی امروزی از پنجره‌های متنی بسیار بزرگ و حافظه تقریباً نامحدود برای پردازش اطلاعات استفاده می‌کنند، پژوهشگران دریافته‌اند که فراموشی تدریجی اطلاعات، برخلاف تصور رایج، می‌تواند به یادگیری بهتر قواعد زبان کمک کند.

هوش مصنوعی با حافظه محدود چگونه بهتر یاد می‌گیرد؟

محققان دانشگاه آمستردام و مؤسسه ماکس پلانک با الهام از نحوه عملکرد حافظه در انسان، معماری جدیدی با عنوان «Fleeting Memory Transformer» یا «ترنسفورمر با حافظه گذرا» طراحی کرده‌اند. در این مدل، اطلاعات قدیمی به‌تدریج از حافظه حذف می‌شوند و تنها بخشی از داده‌های اخیر در دسترس باقی می‌مانند.

بر اساس نتایج این پژوهش، محدود کردن دسترسی مدل به اطلاعات گذشته باعث می‌شود سیستم به جای حفظ کردن واژه‌ها و جملات، بر کشف الگوهای گرامری و ساختارهای انتزاعی زبان تمرکز کند.

نقش مهم حافظه کوتاه‌مدت ۳ تا ۷ کلمه‌ای

یکی از مهم‌ترین یافته‌های این تحقیق، اهمیت وجود یک «بافر حافظه پژواکی» کوتاه‌مدت است. این بخش از حافظه تنها سه تا هفت کلمه آخر را به‌صورت دقیق نگه می‌دارد و سپس فرآیند فراموشی آغاز می‌شود.

پژوهشگران دریافتند که مزایای یادگیری تنها زمانی ظاهر می‌شود که فراموشی تدریجی با این حافظه کوتاه‌مدت ترکیب شود. در غیر این صورت، مدل نمی‌تواند ارتباط میان واژه‌ها و ساختارهای زبانی را به‌درستی تشخیص دهد.

آزمایش روی داده‌هایی در مقیاس یادگیری کودکان

برای ارزیابی عملکرد این مدل، محققان از مجموعه داده BabyLM استفاده کردند؛ مجموعه‌ای که حجم آن تقریباً معادل میزان زبانی است که یک کودک در سال‌های ابتدایی زندگی می‌شنود.

نتایج نشان داد مدل‌های دارای حافظه گذرا در مقایسه با ترنسفورمرهای استاندارد، عملکرد بهتری در یادگیری زبان و تعمیم قواعد نحوی از خود نشان می‌دهند؛ آن هم در شرایطی که داده‌های آموزشی محدود باشند.

پارادوکس عجیب در پیش‌بینی رفتار انسان

با وجود بهبود چشمگیر در یادگیری زبان، پژوهشگران با یک نتیجه غیرمنتظره روبه‌رو شدند. مدل‌های دارای حافظه گذرا در پیش‌بینی زمان مطالعه و پردازش متن توسط انسان عملکرد ضعیف‌تری داشتند.

این یافته با یکی از فرضیات رایج در علوم شناختی در تضاد است؛ فرضیه‌ای که می‌گوید هرچه یک مدل در پردازش زبان قوی‌تر باشد، باید رفتار زبانی انسان را نیز بهتر پیش‌بینی کند.

به گفته محققان، این نتیجه نشان می‌دهد سازوکارهایی که به یادگیری مؤثر زبان کمک می‌کنند، الزاماً همان سازوکارهایی نیستند که مغز انسان هنگام پردازش لحظه‌ای زبان از آن‌ها استفاده می‌کند.

چرا این کشف اهمیت دارد؟

این پژوهش نشان می‌دهد که داشتن حافظه نامحدود لزوماً بهترین راه برای یادگیری زبان نیست. در برخی شرایط، محدودیت‌های شناختی مشابه انسان می‌توانند باعث شوند سیستم‌های هوش مصنوعی کارآمدتر، کم‌مصرف‌تر و توانمندتر در درک قواعد زبانی عمل کنند.

این یافته همچنین می‌تواند الهام‌بخش طراحی نسل جدید مدل‌های زبانی باشد؛ مدل‌هایی که به جای اتکا به حجم عظیم داده و حافظه، از سازوکارهای نزدیک‌تر به مغز انسان برای یادگیری استفاده می‌کنند.

جمع‌بندی

نتایج این مطالعه نشان می‌دهد فراموشی کنترل‌شده و محدودیت حافظه می‌تواند به بهبود یادگیری زبان در شبکه‌های عصبی مدرن کمک کند. مدل‌های «حافظه گذرا» با تمرکز بر ساختارهای گرامری به جای حفظ اطلاعات خام، عملکرد بهتری در یادگیری زبان از خود نشان داده‌اند. این دستاورد می‌تواند در آینده مسیر توسعه هوش مصنوعی را به سمت مدل‌هایی کارآمدتر و نزدیک‌تر به شیوه یادگیری انسان هدایت کند.

به نظر شما آیا تقلید بیشتر از سازوکارهای مغز انسان می‌تواند نسل بعدی هوش مصنوعی را قدرتمندتر کند؟ دیدگاه خود را با مخاطبان آماج به اشتراک بگذارید.

“`

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

پانزده − 1 =

آخرین اخبار آماج

ترند ترین

آخرین مقالات آماج

ویدیو ها