انویدیا جزئیات کارایی فرمت NVFP4 را برای آموزش مدل‌های زبان بزرگ (LLM) تشریح می‌کند

انویدیا فرمت ممیز شناور 4 بیتی NVFP4 را برای آموزش کارآمد مدل‌های زبان بزرگ (LLM) با حداقل افت دقت معرفی کرده است. این شرکت با NVFP4، مدل‌های بزرگ را بر روی مجموعه داده‌ای عظیم آموزش داده و نتایجی مشابه FP8 کسب کرده است. NVFP4 که برای معماری Blackwell بهینه‌سازی شده، مصرف حافظه و هزینه‌های محاسباتی را به طور چشمگیری کاهش داده و کارایی را نسبت به BF16 و FP8 بهبود می‌بخشد. مکانیزم مقیاس‌بندی سلسله‌مراتبی آن، محدودیت‌های فرمت‌های 4 بیتی را برطرف کرده و دقت بالا را تضمین می‌کند.

برای پایداری آموزش 4 بیتی، انویدیا از تکنیک‌های پیشرفته‌ای مانند حفظ لایه‌های با دقت بالاتر، مقیاس‌بندی هوشمند و گرد کردن تصادفی بهره می‌برد. NVFP4 در مقایسه با MXFP4، در همگرایی و کارایی داده برتری دارد. انویدیا در آینده بر کاهش لایه‌های با دقت بالا و گسترش NVFP4 به مدل‌ها و معماری‌های بزرگ‌تر تمرکز خواهد کرد.

جستجو در سایت

سبد خرید

درحال بارگذاری ...
بستن
مقایسه
مقایسه محصولات
لیست مقایسه محصولات شما خالی می باشد!