بایگانی‌های AI Inference Hardware - کول بایت | فروشگاه لوازم و قطعات کامپیوتر

اوپن‌ای‌آی GPT-5.3-Codex-Spark را روی تراشه‌های سربرس عرضه کرد

اوپن‌ای‌آی مدل جدید GPT-5.3-Codex-Spark را بر روی تراشه‌های Cerebras Systems عرضه کرده است که اولین استقرار تولیدی این شرکت بر روی سخت‌افزاری خارج از پشته اصلی انویدیا را نشان می‌دهد. این مدل، نسخه‌ای کم‌مصرف از Codex است که برای کارهای کدنویسی تعاملی و سریع بهینه‌سازی شده و در ابتدا برای مشترکین ChatGPT Pro در دسترس است. سخت‌افزار Cerebras با موتور مقیاس ویفر نسل سوم خود، با هسته‌های هوش مصنوعی فراوان و حافظه روی تراشه، برای به حداقل رساندن تأخیر در بارهای کاری استنتاج تعاملی طراحی شده است.

این اقدام، اگرچه جایگزین نقش انویدیا در آموزش نمی‌شود، اما یک رده اختصاصی برای پاسخگویی سریع فراهم می‌کند. اوپن‌ای‌آی همچنین قراردادهایی با AMD برای ۶ گیگاوات تراشه و با Broadcom برای توسعه شتاب‌دهنده‌های هوش مصنوعی سفارشی امضا کرده است که نشان‌دهنده استراتژی تنوع‌بخشی به اکوسیستم سخت‌افزاری هوش مصنوعی خود است. با این حال، اوپن‌ای‌آی بر ادامه همکاری قوی با انویدیا تأکید کرده و آن را ستون فقرات پشته آموزش و استنتاج خود می‌داند.

کول‌بات
بهمن 24, 1404
- تکنولوژی

گمان می‌رود OpenAI مشتری مرموز ۱۰ میلیارد دلاری پردازنده‌های سفارشی هوش مصنوعی Broadcom باشد

برادکام قراردادی ۱۰ میلیارد دلاری برای تامین سخت‌افزار سفارشی مرکز داده هوش مصنوعی با یک مشتری نامعلوم امضا کرده است که گمان می‌رود OpenAI باشد. OpenAI قصد دارد از میلیون‌ها پردازنده هوش مصنوعی سفارشی (XPU) برای بارهای کاری استنتاجی خود استفاده کند. این سخت‌افزار، شامل شتاب‌دهنده‌ها و تراشه‌های شبکه، به عنوان بلوک‌های ساختمانی برای زیرساخت‌های هوش مصنوعی در مقیاس بزرگ عمل می‌کند. برادکام تایید کرده که سخت‌افزار “واجد شرایط” است و سفارش‌های تولیدی صادر شده‌اند و خرید تجاری آغاز شده است.

تحویل این سخت‌افزار در سه ماهه سوم سال ۲۰۲۶ پیش‌بینی می‌شود. پردازنده سفارشی OpenAI احتمالاً از معماری آرایه سیستولیک، حافظه HBM و فناوری فرآیند ۳ نانومتری TSMC استفاده می‌کند. این سرمایه‌گذاری عظیم، نشان‌دهنده تغییر استراتژیک OpenAI به سمت زیرساخت داخلی با سیلیکون سفارشی Broadcom است. هدف این اقدام، کنترل هزینه و بهینه‌سازی استنتاج است و می‌تواند اهرم مذاکره با تامین‌کنندگان را افزایش دهد، هرچند هنوز هیچ تایید رسمی در این خصوص وجود ندارد.

کول‌بات
شهریور 15, 1404
- تکنولوژی

فناوری جدید حافظه سه‌بعدی پشته‌ای به دنبال برکناری HBM در استنتاج هوش مصنوعی

استارتاپ d-Matrix فناوری حافظه سه‌بعدی پشته‌ای 3DIMC را معرفی کرده که ادعا می‌کند در استنتاج هوش مصنوعی (AI inference) تا ۱۰ برابر سریع‌تر و کارآمدتر از HBM است. این فناوری محاسبات درون حافظه‌ای، گلوگاه حافظه در مدل‌های هوش مصنوعی را هدف قرار می‌دهد. d-Matrix نمونه اولیه Pavehawk را در آزمایشگاه فعال کرده و نسل بعدی Raptor را توسعه می‌دهد که وعده می‌دهد HBM را با ۱۰ برابر سرعت بیشتر و ۹۰ درصد مصرف انرژی کمتر در وظایف استنتاج پشت سر بگذارد. این شرکت معتقد است سخت‌افزار اختصاصی برای وظایف خاصی مانند استنتاج هوش مصنوعی ضروری است.

جایگزینی برای HBM از نظر مالی نیز جذاب است. HBM توسط تعداد محدودی از شرکت‌ها تولید شده و قیمت بالایی دارد. با رشد ۳۰ درصدی سالانه بازار HBM تا سال ۲۰۳۰ و افزایش قیمت‌ها، یک جایگزین مقرون‌به‌صرفه برای خریداران هوش مصنوعی جذاب خواهد بود، هرچند حافظه‌های اختصاصی ممکن است برای برخی مشتریان ریسک‌پذیر به نظر برسند.