مدل جدید Deepseek با تبدیل متن و اسناد به تصاویر، مصرف منابع را به شدت کاهش می‌دهد

هوش مصنوعی Deepseek مدل جدید DeepSeek-OCR را معرفی کرده که با تبدیل متن و اسناد به تصاویر، کارایی پردازش داده‌های متنی حجیم و پیچیده را به طرز چشمگیری بهبود می‌بخشد. این رویکرد نوآورانه، موسوم به «فشرده‌سازی بینایی-متن»، مصرف توکن را ۷ تا ۲۰ برابر کاهش می‌دهد، در حالی که دقت بالایی را حفظ می‌کند؛ مثلاً در فشرده‌سازی ۱۰ برابر، دقت ۹۷ درصدی گزارش شده است. این پیشرفت می‌تواند هزینه‌های محاسباتی مدل‌های پیشرفته هوش مصنوعی را کاهش داده و توانایی آن‌ها را در مدیریت اطلاعات با زمینه طولانی افزایش دهد.

مدل DeepSeek-OCR، شامل DeepEncoder و DeepSeek3B-MoE-A570M، برای داده‌های ساختاریافته مانند جداول و نمودارها بسیار مؤثر است و کاربردهای مهمی در حوزه‌های مالی، علمی و پزشکی دارد. با وجود کاهش دقت در فشرده‌سازی‌های بالاتر، پتانسیل صرفه‌جویی در منابع، حتی با فشرده‌سازی متوسط، بسیار زیاد است. این مدل برای توسعه‌دهندگان از طریق پلتفرم‌های Hugging Face و GitHub در دسترس است و راه را برای کاربردهای هوش مصنوعی کارآمدتر هموار می‌کند.

مقامات چینی ظاهراً از DeepSeek خواسته‌اند مدل جدید را روی سخت‌افزار هواوی آموزش دهد

گزارش‌ها نشان می‌دهد که DeepSeek، پس از آموزش موفق مدل R1 بر روی سخت‌افزار انویدیا، تحت فشار مقامات چینی قرار گرفت تا مدل R2 را با استفاده از سخت‌افزار Huawei Ascend توسعه دهد. اما این اقدام با شکست‌های مداوم سخت‌افزاری هواوی مواجه شد که منجر به تأخیر در عرضه R2 گردید. در نتیجه، DeepSeek مجبور شد برای بخش آموزش مدل به تراشه‌های انویدیا بازگردد، در حالی که از سخت‌افزار هواوی برای عملیات استنتاج (inference) استفاده می‌کند.

مشکلات اصلی شامل عملکرد ناپایدار، اتصال کندتر بین تراشه‌ها و محدودیت‌های کیت ابزار نرم‌افزاری CANN هواوی بود. با وجود اعزام مهندسان هواوی، DeepSeek نتوانست آموزش کاملاً موفقی را روی پلتفرم Ascend به دست آورد. این ناتوانی، عامل اصلی تأخیر در عرضه R2 از تاریخ برنامه‌ریزی شده آن در ماه می بود.

این رویکرد ترکیبی، یعنی استفاده از انویدیا برای آموزش و هواوی برای استنتاج، از روی ضرورت و نه ترجیح اتخاذ شده است. با توجه به کمبود شدید پردازنده‌های انویدیا در چین، اطمینان از سازگاری مدل‌های هوش مصنوعی با سخت‌افزار داخلی هواوی برای DeepSeek حیاتی است، زیرا بسیاری از مشتریان این شرکت از R2 بر روی پلتفرم‌های هواوی استفاده خواهند کرد.

پلتفرم هوش مصنوعی DeepSeek به طور خاص برای سخت‌افزار انویدیا بهینه‌سازی شده است. این وابستگی، شرکت را در برابر نوسانات عرضه پردازنده‌های گرافیکی انویدیا آسیب‌پذیر می‌کند. بنابراین، تلاش برای کارآمد کردن عملیات استنتاج R2 بر روی پلتفرم‌های داخلی مانند Ascend هواوی، گامی مهم برای افزایش انعطاف‌پذیری و استقلال DeepSeek در آینده محسوب می‌شود.

جستجو در سایت

سبد خرید

درحال بارگذاری ...
بستن
مقایسه
مقایسه محصولات
لیست مقایسه محصولات شما خالی می باشد!