ماسک، آندری کارپاتی، محقق افسانهای هوش مصنوعی را به یک رقابت کدنویسی هوش مصنوعی در برابر گروک ۵ دعوت میکند
ایلان ماسک یک مسابقه کدنویسی عمومی بین گروک ۵ از xAI و آندری کارپاتی، محقق ارشد سابق OpenAI، پیشنهاد کرده است و آن را با رویارویی سال ۱۹۹۷ گری کاسپاروف و دیپ بلو IBM مقایسه میکند. کارپاتی این پیشنهاد را رد کرد و گفت ترجیح میدهد با گروک همکاری کند تا اینکه با آن رقابت کند.
این چالش در پاسخ به کلیپی از مصاحبه اخیر کارپاتی در پادکست Dwarkesh مطرح شد، جایی که او استدلال کرد AGI احتمالاً هنوز یک دهه فاصله دارد و گروک ۵ را چندین ماه عقبتر از GPT-4 توصیف کرد.
ماسک، که گفته است گروک ۵ شانس ۱۰ درصدی و رو به رشدی برای رسیدن به AGI دارد، این را به عنوان یک دعوت تلقی کرد: «آیا برای یک مسابقه کدنویسی هوش مصنوعی آمادهای؟» او در X پست کرد و کارپاتی را مستقیماً تگ کرد.
کارپاتی پاسخ داد که سهم او در چنین رقابتی «نزدیک به صفر» خواهد بود و تأکید کرد که مدلهای فعلی را بیشتر به عنوان همکار میبیند تا رقیب.
ایده یک مسابقه رسمی کدنویسی مدل در برابر انسان دور از ذهن نیست. DeepMind اوایل امسال اعلام کرد که Gemini 2.5 ده از دوازده مسئله را تحت شرایط فینال جهانی ICPC حل کرده و آن را در سطح مدال طلا قرار داده است. هم OpenAI و هم DeepMind اکنون با استفاده از GPT-4 و GPT-5 به امتیازات کامل ۱۲/۱۲ در همان معیار دست یافتهاند. این مسائل از مسابقات الگوریتم در سطح دانشگاهی گرفته شدهاند که هم از نظر صحت و هم از نظر عملکرد زمان اجرا قضاوت میشوند و در محدودیتهای سختگیرانه منابع و زمان اجرا میشوند.
اوایل امسال، یک برنامهنویس لهستانی در یک فینال ۱۰ ساعته رو در رو در مسابقات جهانی AtCoder، مدل سفارشی OpenAI را شکست داد، که این گمانهزنی را برانگیخت که ممکن است این آخرین پیروزی انسان در بالاترین سطح باشد. آن مسابقه به شدت کنترل شده و کاملاً شفاف بود.
اگر ماسک میخواهد گروک ۵ در این رده جدی گرفته شود، باید آن را تحت همان شرایط قرار دهد. مقایسه با دیپ بلو تنها در صورتی کارآمد است که مسابقه قابل اندازهگیری باشد. این بدان معناست که مسابقات با طول ثابت با استفاده از مجموعه مسائل عمومی، دسترسی یکسان به ابزارها و محاسبات، و بدون استنتاج خارجی یا کمک انسانی برگزار شود. نتایج باید به طور مستقل امتیازدهی و به طور کامل منتشر شوند.
تصمیم کارپاتی برای عدم شرکت، منعکسکننده یک تغییر گستردهتر در نحوه صحبت متخصصان یادگیری ماشین در مورد عملکرد است. به جای برگزاری مسابقات رو در رو، بسیاری اکنون بر این تمرکز دارند که مدلها چقدر میتوانند خروجی انسانی را تسریع کنند. اما برنامهنویسی رقابتی همچنان یک معیار واضح و مشخص ارائه میدهد. و تاکنون، گروک هنوز امتیازی ثبت نکرده است.
اگر xAI میخواهد برابری یا برتری خود را نشان دهد، یک اجرای رسمی بر روی وظایف در سطح ICPC نقطه شروع واضحی خواهد بود.
- کولبات
- مهر 30, 1404
- 35 بازدید






