انویدیا فرمت ممیز شناور 4 بیتی NVFP4 را برای آموزش کارآمد مدلهای زبان بزرگ (LLM) با حداقل افت دقت معرفی کرده است. این شرکت با NVFP4، مدلهای بزرگ را بر روی مجموعه دادهای عظیم آموزش داده و نتایجی مشابه FP8 کسب کرده است. NVFP4 که برای معماری Blackwell بهینهسازی شده، مصرف حافظه و هزینههای محاسباتی را به طور چشمگیری کاهش داده و کارایی را نسبت به BF16 و FP8 بهبود میبخشد. مکانیزم مقیاسبندی سلسلهمراتبی آن، محدودیتهای فرمتهای 4 بیتی را برطرف کرده و دقت بالا را تضمین میکند.
برای پایداری آموزش 4 بیتی، انویدیا از تکنیکهای پیشرفتهای مانند حفظ لایههای با دقت بالاتر، مقیاسبندی هوشمند و گرد کردن تصادفی بهره میبرد. NVFP4 در مقایسه با MXFP4، در همگرایی و کارایی داده برتری دارد. انویدیا در آینده بر کاهش لایههای با دقت بالا و گسترش NVFP4 به مدلها و معماریهای بزرگتر تمرکز خواهد کرد.
شرکت AFOX کارت گرافیک GeForce RTX 5090 32GB Professional را با طراحی خنککننده Blower و قیمت 5,999 دلار در یک خردهفروشی آمریکایی عرضه کرده است. این کارت گرافیک با طراحی دو اسلات و خنککننده Blower، برای پیکربندیهای چند GPU در کاربردهای هوش مصنوعی و سرورها ایدهآل است. AFOX که سابقه طولانی در تولید این نوع کارتها دارد، به نظر میرسد به دلیل عدم شراکت رسمی با انویدیا، از محدودیتهای این شرکت در مورد طراحیهای Blower مستثنی است.
موضع رسمی انویدیا در قبال کارتهای RTX 5090 Blower هنوز مشخص نیست، اما کارخانههای چینی پیش از این تراشههای RTX 5090 را برای سرورهای هوش مصنوعی در محفظههای Blower نصب کردهاند. این کارت AFOX با فرکانسهای مشابه نسخه Founders Edition عمل میکند و از کانکتور برق 16 پین 12VHPWR بهره میبرد.
قیمت 5,999 دلاری این کارت بسیار بالا است، به طوری که با این مبلغ میتوان دو کارت RTX 5090 استاندارد را خریداری کرد. این محصول بیشتر برای متخصصان و کاربردهای خاص هوش مصنوعی با بودجه بالا مناسب است و جنبه گارانتی از AFOX را ارائه میدهد.