اخبار کوتاه را در بخش اخبار فوری ارز دیجیتال سایت آکادمی بیت پین دنبال کنید!
صرافی کوینکس آدرس‌های واریزی شبکه ترون (TRON) را ارتقا داد
درآمد 3350 اتریوم برای آربیتروم DAO حاصل از کارمزد تراکنش‌ها

نسخه جدید هوش مصنوعی GPT-4 اولین کار بزرگ خود را انجام داده است و در حال حاضر همه چیز را از یک داوطلب مجازی برای افراد کم‌بینا گرفته تا یک ربات یادگیری زبان بهبود یافته در Duolingo ارائه می‌دهد. اما چه چیزی GPT-4 را از نسخه‌های قبلی مانند ChatGPT و GPT-3.5 متمایز می‌کند؟ در ادامه پنج تفاوت بزرگ بین این سیستم‌های محبوب را بررسی می‌کنیم.

اگرچه ChatGPT در ابتدا به عنوان GPT-3.5 توصیف می‌شد، این خود نسخه‌ای از مدل زبان بزرگ OpenAI نیست، بلکه یک رابط مبتنی بر چت برای هر مدلی است که آن را قدرت می‌دهد. سیستم ChatGPT که در چند ماه گذشته محبوبیت زیادی پیدا کرد راهی برای تعامل با GPT-3.5 بود و اکنون راهی برای تعامل با GPT-4 است.

با این اوصاف، بیایید به تفاوت‌های بین چت‌باتی که می‌شناسید و دوستش دارید و جانشین تازه‌اش بپردازیم.

GPT-4 می‌تواند تصاویر را ببیند و درک کند

قابل‌توجه‌ترین تغییر در این سیستم یادگیری ماشین همه‌کاره این است که «چندوجهی» است، به این معنی که می‌تواند بیش از یک وجه از اطلاعات را درک کند. ChatGPT و GPT-3 محدود به متن بودند: آنها می‌توانستند بخوانند و بنویسند – که البته برای بسیاری از برنامه‌ها بیش از اندازه کافی بود.

با این حال، به GPT-4 می‌توان تصاویری داد و آنها را برای یافتن اطلاعات مرتبط پردازش می‌کند. البته می‌توانید به سادگی از آن بخواهید که آنچه را در یک عکس است، توصیف کند، اما مهم‌تر از آن درک آن است. مثال ارائه شده توسط OpenAI در واقع جوکی را در تصویری از یک رابط خنده‌دار بزرگ آیفون توضیح می‌دهد، اما همکاری با Be My Eyes، برنامه‌ای که توسط افراد نابینا و کم‌بینا استفاده می‌شود تا به داوطلبان اجازه دهد آنچه را که تلفنشان می‌بیند برای آن‌ها توصیف کنند، این تفاوت را آشکار می‌کند.

5 مورد اختلاف که باعث پیشی گرفتن GPT-4 از ChatGPT شده است

در ویدیوی Be My Eyes، GPT-4 الگوی یک لباس را توصیف می‌کند، یک گیاه را شناسایی می‌کند، نحوه رسیدن به یک دستگاه خاص در باشگاه را توضیح می‌دهد، یک برچسب را ترجمه می‌کند (و یک دستور غذا ارائه می‌دهد)، یک نقشه می‌خواند. همچنین کارهای دیگری نیز انجام می‌دهد که نشان می‌دهد واقعاً آنچه را در یک تصویر است دریافت می‌کند – اگر سؤالات درستی از آن پرسیده شود. این می‌داند که لباس چه شکلی است، اما ممکن است نداند که آیا این لباس برای مصاحبه شما مناسب است یا خیر.

فریب دادن هوش مصنوعی GPT-4 سخت‌تر است

با وجود همه چیزهایی که چت ربات‌های امروزی به درستی انجام می‌دهند، اما به راحتی گمراه می‌شوند. کمی اغماض می‌تواند آنها را متقاعد کند که اعتراف کنند یک «هوش مصنوعی بد» چه کاری انجام می‌دهد، یا یک داستان کوچک دیگر که به مدل اجازه می‌دهد انواع چیزهای عجیب‌وغریب و رک‌وپوست‌کنده را بیان کند.

از سوی دیگر، GPT-4 در مورد بسیاری از پیام‌های مخرب آموزش دیده است – که کاربران به کمک OpenAI در یکی دو سال گذشته به آنها داده‌اند. با در نظر گرفتن این موارد، مدل جدید در «واقعیت، فرمان‌پذیری و امتناع از بیرون رفتن از حفاظ‌ها» بسیار بهتر از مدل‌های قبلی خود است.

GPT-4 حافظه طولانی‌تری دارد

این مدل‌های زبان بر روی میلیون‌ها صفحه وب، کتاب و سایر داده‌های متنی آموزش داده می‌شوند، اما زمانی که در واقع با یک کاربر مکالمه می‌کنند، محدودیتی برای اینکه چقدر می‌توانند «در حافظه» داشته باشند، وجود دارد. این محدودیت در GPT-3.5 و نسخه قدیمی 4096 «ژتون» بود که حدود 8000 کلمه یا تقریباً چهار تا پنج صفحه از یک کتاب است.

GPT-4 دارای حداکثر تعداد توکن 32768 است – اگر این عدد آشنا به نظر می‌رسد، این عدد 2^15 است. این به حدود 64,000 کلمه یا 50 صفحه متن ترجمه می‌شود که برای کل یک نمایشنامه یا داستان کوتاه کافی است.

این به این معنی است که در مکالمه یا تولید متن، می‌تواند تا 50 صفحه یا بیشتر را در ذهن نگه دارد؛ بنابراین آنچه را که درباره 20 صفحه چت پشت سر گذاشتید به خاطر می‌آورد، یا در نوشتن یک داستان یا مقاله، ممکن است به رویدادهایی اشاره کند که 35 صفحه پیش رخ داده‌اند. این یک توصیف بسیار تقریبی از نحوه عملکرد مکانیسم توجه و شمارش نشانه است، اما ایده کلی حافظه گسترش یافته و قابلیت‌های همراه با آن است.

هوش مصنوعی GPT-4 چندزبانه است

دنیای هوش مصنوعی تحت سلطه انگلیسی‌زبانان است و همه چیز از داده‌ها گرفته تا آزمایش و مقالات تحقیقاتی به آن زبان است. اما مسلماً قابلیت‌های مدل‌های زبان در هر زبان نوشتاری قابل اجرا است و باید در آن‌ها نیز در دسترس باشد.

GPT-4 با نشان دادن اینکه قادر به پاسخگویی به هزاران سوال چندگزینه‌ای با دقت بالا در 26 زبان، از ایتالیایی گرفته تا اوکراینی و کره‌ای است، گامی به سوی انجام این کار برمی‌دارد. در زبان‌های رومی و ژرمنی بهترین است، اما به خوبی به دیگران تعمیم می‌یابد.

این آزمایش اولیه برای زبان‌های مختلف امیدوارکننده است، اما به دور از پذیرش کامل قابلیت‌های چندزبانه است. معیارهای تست برای شروع از انگلیسی ترجمه شدند و سوالات چندگزینه‌ای واقعاً بیانگر گفتار معمولی نیستند. اما در موردی که واقعاً برای آن آموزش ندیده بود، کار بسیار خوبی انجام داد، که نشان می‌دهد GPT-4 فضایی بسیار دوستانه‌تر برای غیرانگلیسی‌زبانان فراهم کرده است.

GPT-4 شخصیت‌های متفاوتی دارد

5 مورد اختلاف که باعث پیشی گرفتن GPT-4 از ChatGPT شده است

«هدایت‌پذیری» (Steerability) یک مفهوم جالب در هوش مصنوعی است که به ظرفیت آنها برای تغییر رفتار خود در صورت تقاضا اشاره دارد. این می‌تواند مفید باشد، مثلاً در نقش یک شنونده دلسوز، یا خطرناک باشد، مانند زمانی که افراد مدل را متقاعد می‌کنند که شیطان یا افسرده است.

GPT-4 فرمان‌پذیری را به صورت بومی‌تر از GPT-3.5 ادغام می‌کند و کاربران می‌توانند «شخصیت کلاسیک ChatGPT با پرحرفی، لحن و سبک ثابت» را به چیزی که بیشتر با نیازهایشان سازگار است، تغییر دهند.

این کار را می‌توان با پرکردن ربات چت با پیام‌هایی مانند «به گونه‌ای پاسخ دهید که گویی فردی هستید که برای اخبار مصاحبه می‌کنید» انجام شود. اما شما فقط به شخصیت پیش‌فرض GPT-3.5 پیشنهاد می‌دادید. اکنون توسعه‌دهندگان می‌توانند از همان ابتدا در یک دیدگاه، سبک مکالمه، لحن یا روش تعامل کار کنند.

سخن پایانی

تفاوت‌های بسیار بیشتری بین GPT-4 و پیشینیان آن وجود دارد که از اینها ظریف‌تر یا فنی‌تر است. بدون شک با گذشت ماه‌ها و استفاده کاربران از جدیدترین مدل زبان، چیزهای بیشتری یاد خواهیم گرفت. هر چه هست دنیا به مکانی عجیب تبدیل شده است.

منبع: techcrunch

5/5 - (5 امتیاز)

دیدگاه ها

دیدگاهتان را بنویسید

دیدگاه ارسال شده توسط شما، پس از تایید توسط مدیران سایت منتشر خواهد شد.

استفاده از کلمات و محتوای توهین‌آمیز و غیراخلاقی به هر شکل و هر شخص ممنوع است.

انتشار هرگونه دیدگاه غیراقتصادی، تبلیغ سایت، تبلیغ صفحات شبکه‌های اجتماعی، قراردادن اطلاعات تماس و لینک‌های نامرتبط مجاز نیست.