5 مورد اختلاف که باعث پیشی گرفتن GPT-4 از ChatGPT شده است
نسخه جدید هوش مصنوعی GPT-4 اولین کار بزرگ خود را انجام داده است و در حال حاضر همه چیز را از یک داوطلب مجازی برای افراد کمبینا گرفته تا یک ربات یادگیری زبان بهبود یافته در Duolingo ارائه میدهد. اما چه چیزی GPT-4 را از نسخههای قبلی مانند ChatGPT و GPT-3.5 متمایز میکند؟ در ادامه پنج تفاوت بزرگ بین این سیستمهای محبوب را بررسی میکنیم.
اگرچه ChatGPT در ابتدا به عنوان GPT-3.5 توصیف میشد، این خود نسخهای از مدل زبان بزرگ OpenAI نیست، بلکه یک رابط مبتنی بر چت برای هر مدلی است که آن را قدرت میدهد. سیستم ChatGPT که در چند ماه گذشته محبوبیت زیادی پیدا کرد راهی برای تعامل با GPT-3.5 بود و اکنون راهی برای تعامل با GPT-4 است.
با این اوصاف، بیایید به تفاوتهای بین چتباتی که میشناسید و دوستش دارید و جانشین تازهاش بپردازیم.
GPT-4 میتواند تصاویر را ببیند و درک کند
قابلتوجهترین تغییر در این سیستم یادگیری ماشین همهکاره این است که «چندوجهی» است، به این معنی که میتواند بیش از یک وجه از اطلاعات را درک کند. ChatGPT و GPT-3 محدود به متن بودند: آنها میتوانستند بخوانند و بنویسند – که البته برای بسیاری از برنامهها بیش از اندازه کافی بود.
با این حال، به GPT-4 میتوان تصاویری داد و آنها را برای یافتن اطلاعات مرتبط پردازش میکند. البته میتوانید به سادگی از آن بخواهید که آنچه را در یک عکس است، توصیف کند، اما مهمتر از آن درک آن است. مثال ارائه شده توسط OpenAI در واقع جوکی را در تصویری از یک رابط خندهدار بزرگ آیفون توضیح میدهد، اما همکاری با Be My Eyes، برنامهای که توسط افراد نابینا و کمبینا استفاده میشود تا به داوطلبان اجازه دهد آنچه را که تلفنشان میبیند برای آنها توصیف کنند، این تفاوت را آشکار میکند.
در ویدیوی Be My Eyes، GPT-4 الگوی یک لباس را توصیف میکند، یک گیاه را شناسایی میکند، نحوه رسیدن به یک دستگاه خاص در باشگاه را توضیح میدهد، یک برچسب را ترجمه میکند (و یک دستور غذا ارائه میدهد)، یک نقشه میخواند. همچنین کارهای دیگری نیز انجام میدهد که نشان میدهد واقعاً آنچه را در یک تصویر است دریافت میکند – اگر سؤالات درستی از آن پرسیده شود. این میداند که لباس چه شکلی است، اما ممکن است نداند که آیا این لباس برای مصاحبه شما مناسب است یا خیر.
فریب دادن هوش مصنوعی GPT-4 سختتر است
با وجود همه چیزهایی که چت رباتهای امروزی به درستی انجام میدهند، اما به راحتی گمراه میشوند. کمی اغماض میتواند آنها را متقاعد کند که اعتراف کنند یک «هوش مصنوعی بد» چه کاری انجام میدهد، یا یک داستان کوچک دیگر که به مدل اجازه میدهد انواع چیزهای عجیبوغریب و رکوپوستکنده را بیان کند.
از سوی دیگر، GPT-4 در مورد بسیاری از پیامهای مخرب آموزش دیده است – که کاربران به کمک OpenAI در یکی دو سال گذشته به آنها دادهاند. با در نظر گرفتن این موارد، مدل جدید در «واقعیت، فرمانپذیری و امتناع از بیرون رفتن از حفاظها» بسیار بهتر از مدلهای قبلی خود است.
GPT-4 حافظه طولانیتری دارد
این مدلهای زبان بر روی میلیونها صفحه وب، کتاب و سایر دادههای متنی آموزش داده میشوند، اما زمانی که در واقع با یک کاربر مکالمه میکنند، محدودیتی برای اینکه چقدر میتوانند «در حافظه» داشته باشند، وجود دارد. این محدودیت در GPT-3.5 و نسخه قدیمی 4096 «ژتون» بود که حدود 8000 کلمه یا تقریباً چهار تا پنج صفحه از یک کتاب است.
GPT-4 دارای حداکثر تعداد توکن 32768 است – اگر این عدد آشنا به نظر میرسد، این عدد 2^15 است. این به حدود 64,000 کلمه یا 50 صفحه متن ترجمه میشود که برای کل یک نمایشنامه یا داستان کوتاه کافی است.
این به این معنی است که در مکالمه یا تولید متن، میتواند تا 50 صفحه یا بیشتر را در ذهن نگه دارد؛ بنابراین آنچه را که درباره 20 صفحه چت پشت سر گذاشتید به خاطر میآورد، یا در نوشتن یک داستان یا مقاله، ممکن است به رویدادهایی اشاره کند که 35 صفحه پیش رخ دادهاند. این یک توصیف بسیار تقریبی از نحوه عملکرد مکانیسم توجه و شمارش نشانه است، اما ایده کلی حافظه گسترش یافته و قابلیتهای همراه با آن است.
هوش مصنوعی GPT-4 چندزبانه است
دنیای هوش مصنوعی تحت سلطه انگلیسیزبانان است و همه چیز از دادهها گرفته تا آزمایش و مقالات تحقیقاتی به آن زبان است. اما مسلماً قابلیتهای مدلهای زبان در هر زبان نوشتاری قابل اجرا است و باید در آنها نیز در دسترس باشد.
GPT-4 با نشان دادن اینکه قادر به پاسخگویی به هزاران سوال چندگزینهای با دقت بالا در 26 زبان، از ایتالیایی گرفته تا اوکراینی و کرهای است، گامی به سوی انجام این کار برمیدارد. در زبانهای رومی و ژرمنی بهترین است، اما به خوبی به دیگران تعمیم مییابد.
این آزمایش اولیه برای زبانهای مختلف امیدوارکننده است، اما به دور از پذیرش کامل قابلیتهای چندزبانه است. معیارهای تست برای شروع از انگلیسی ترجمه شدند و سوالات چندگزینهای واقعاً بیانگر گفتار معمولی نیستند. اما در موردی که واقعاً برای آن آموزش ندیده بود، کار بسیار خوبی انجام داد، که نشان میدهد GPT-4 فضایی بسیار دوستانهتر برای غیرانگلیسیزبانان فراهم کرده است.
GPT-4 شخصیتهای متفاوتی دارد
«هدایتپذیری» (Steerability) یک مفهوم جالب در هوش مصنوعی است که به ظرفیت آنها برای تغییر رفتار خود در صورت تقاضا اشاره دارد. این میتواند مفید باشد، مثلاً در نقش یک شنونده دلسوز، یا خطرناک باشد، مانند زمانی که افراد مدل را متقاعد میکنند که شیطان یا افسرده است.
GPT-4 فرمانپذیری را به صورت بومیتر از GPT-3.5 ادغام میکند و کاربران میتوانند «شخصیت کلاسیک ChatGPT با پرحرفی، لحن و سبک ثابت» را به چیزی که بیشتر با نیازهایشان سازگار است، تغییر دهند.
این کار را میتوان با پرکردن ربات چت با پیامهایی مانند «به گونهای پاسخ دهید که گویی فردی هستید که برای اخبار مصاحبه میکنید» انجام شود. اما شما فقط به شخصیت پیشفرض GPT-3.5 پیشنهاد میدادید. اکنون توسعهدهندگان میتوانند از همان ابتدا در یک دیدگاه، سبک مکالمه، لحن یا روش تعامل کار کنند.
سخن پایانی
تفاوتهای بسیار بیشتری بین GPT-4 و پیشینیان آن وجود دارد که از اینها ظریفتر یا فنیتر است. بدون شک با گذشت ماهها و استفاده کاربران از جدیدترین مدل زبان، چیزهای بیشتری یاد خواهیم گرفت. هر چه هست دنیا به مکانی عجیب تبدیل شده است.
منبع: techcrunch
دیدگاه ارسال شده توسط شما، پس از تایید توسط مدیران سایت منتشر خواهد شد.
استفاده از کلمات و محتوای توهینآمیز و غیراخلاقی به هر شکل و هر شخص ممنوع است.
انتشار هرگونه دیدگاه غیراقتصادی، تبلیغ سایت، تبلیغ صفحات شبکههای اجتماعی، قراردادن اطلاعات تماس و لینکهای نامرتبط مجاز نیست.