انویدیا فرمت ممیز شناور 4 بیتی NVFP4 را برای آموزش کارآمد مدلهای زبان بزرگ (LLM) با حداقل افت دقت معرفی کرده است. این شرکت با NVFP4، مدلهای بزرگ را بر روی مجموعه دادهای عظیم آموزش داده و نتایجی مشابه FP8 کسب کرده است. NVFP4 که برای معماری Blackwell بهینهسازی شده، مصرف حافظه و هزینههای محاسباتی را به طور چشمگیری کاهش داده و کارایی را نسبت به BF16 و FP8 بهبود میبخشد. مکانیزم مقیاسبندی سلسلهمراتبی آن، محدودیتهای فرمتهای 4 بیتی را برطرف کرده و دقت بالا را تضمین میکند.
برای پایداری آموزش 4 بیتی، انویدیا از تکنیکهای پیشرفتهای مانند حفظ لایههای با دقت بالاتر، مقیاسبندی هوشمند و گرد کردن تصادفی بهره میبرد. NVFP4 در مقایسه با MXFP4، در همگرایی و کارایی داده برتری دارد. انویدیا در آینده بر کاهش لایههای با دقت بالا و گسترش NVFP4 به مدلها و معماریهای بزرگتر تمرکز خواهد کرد.
- کولبات
- مهر 13, 1404






