هوش مصنوعی Deepseek مدل جدید DeepSeek-OCR را معرفی کرده که با تبدیل متن و اسناد به تصاویر، کارایی پردازش دادههای متنی حجیم و پیچیده را به طرز چشمگیری بهبود میبخشد. این رویکرد نوآورانه، موسوم به «فشردهسازی بینایی-متن»، مصرف توکن را ۷ تا ۲۰ برابر کاهش میدهد، در حالی که دقت بالایی را حفظ میکند؛ مثلاً در فشردهسازی ۱۰ برابر، دقت ۹۷ درصدی گزارش شده است. این پیشرفت میتواند هزینههای محاسباتی مدلهای پیشرفته هوش مصنوعی را کاهش داده و توانایی آنها را در مدیریت اطلاعات با زمینه طولانی افزایش دهد.
مدل DeepSeek-OCR، شامل DeepEncoder و DeepSeek3B-MoE-A570M، برای دادههای ساختاریافته مانند جداول و نمودارها بسیار مؤثر است و کاربردهای مهمی در حوزههای مالی، علمی و پزشکی دارد. با وجود کاهش دقت در فشردهسازیهای بالاتر، پتانسیل صرفهجویی در منابع، حتی با فشردهسازی متوسط، بسیار زیاد است. این مدل برای توسعهدهندگان از طریق پلتفرمهای Hugging Face و GitHub در دسترس است و راه را برای کاربردهای هوش مصنوعی کارآمدتر هموار میکند.
گزارشها نشان میدهد که DeepSeek، پس از آموزش موفق مدل R1 بر روی سختافزار انویدیا، تحت فشار مقامات چینی قرار گرفت تا مدل R2 را با استفاده از سختافزار Huawei Ascend توسعه دهد. اما این اقدام با شکستهای مداوم سختافزاری هواوی مواجه شد که منجر به تأخیر در عرضه R2 گردید. در نتیجه، DeepSeek مجبور شد برای بخش آموزش مدل به تراشههای انویدیا بازگردد، در حالی که از سختافزار هواوی برای عملیات استنتاج (inference) استفاده میکند.
مشکلات اصلی شامل عملکرد ناپایدار، اتصال کندتر بین تراشهها و محدودیتهای کیت ابزار نرمافزاری CANN هواوی بود. با وجود اعزام مهندسان هواوی، DeepSeek نتوانست آموزش کاملاً موفقی را روی پلتفرم Ascend به دست آورد. این ناتوانی، عامل اصلی تأخیر در عرضه R2 از تاریخ برنامهریزی شده آن در ماه می بود.
این رویکرد ترکیبی، یعنی استفاده از انویدیا برای آموزش و هواوی برای استنتاج، از روی ضرورت و نه ترجیح اتخاذ شده است. با توجه به کمبود شدید پردازندههای انویدیا در چین، اطمینان از سازگاری مدلهای هوش مصنوعی با سختافزار داخلی هواوی برای DeepSeek حیاتی است، زیرا بسیاری از مشتریان این شرکت از R2 بر روی پلتفرمهای هواوی استفاده خواهند کرد.
پلتفرم هوش مصنوعی DeepSeek به طور خاص برای سختافزار انویدیا بهینهسازی شده است. این وابستگی، شرکت را در برابر نوسانات عرضه پردازندههای گرافیکی انویدیا آسیبپذیر میکند. بنابراین، تلاش برای کارآمد کردن عملیات استنتاج R2 بر روی پلتفرمهای داخلی مانند Ascend هواوی، گامی مهم برای افزایش انعطافپذیری و استقلال DeepSeek در آینده محسوب میشود.