شرکت دیپ سیک 1.6 میلیارد دلار برای هوش مصنوعی هزینه نموده است
به گزارش وبلاگ خلیج اپ، در صحنه رقابتی و پرتحول هوش مصنوعی، همیشه شاهد ظهور و سقوط بازیگران نو بوده ایم. شرکت چینی دیپ سیک، به عنوان یکی از این بازیگران نوظهور، با ادعاهایی بلندپروازانه مبنی بر کاهش چشمگیر هزینه های آموزش مدل های پیشرفته هوش مصنوعی، در کانون توجه قرار گرفته است. این شرکت ادعا می نماید که مدل R1 خود را با بودجه ای 6 میلیون دلاری و با بهره گیری از 2048 پردازنده گرافیکی آموزش داده است. این در حالی است که رقبای آمریکایی برای دستیابی به مدل های مشابه، هزینه هایی چندین برابر و بالغ بر میلیاردها دلار را متحمل می شوند. اما آیا این ادعاها تا چه حد قابل اتکا هستند؟

بر اساس گزارش منتشر شده به وسیله موسسه تحقیقاتی SemiAnalysis، دیپ سیک برای ایجاد زیرساخت های مورد احتیاج خود، حدود 1.6 میلیارد دلار سرمایه گذاری نموده و از مجموعه ای قدرتمند شامل 50 هزار پردازنده گرافیکی Hopper، از جمله 10 هزار H800 و 10 هزار H100، بهره می برد. این داده های ارائه شده به وسیله SemiAnalysis، با ادعاهای اولیه دیپ سیک مبنی بر هزینه های ناچیز آموزش مدل ها، در تضاد است. به نظر می رسد که رقم 6 میلیون دلار، تنها بخشی از هزینه های آموزش، به طور معین هزینه مربوط به زمان پردازش گرافیکی در مرحله پیش آموزش مدل را منعکس می نماید و هزینه های سنگین تر تحقیق و توسعه، پردازش حجم انبوه داده ها و زیرساخت های گسترده را نادیده گرفته است.
شایان ذکر است که دیپ سیک در واقع از دل شرکت سرمایه گذاری چینی High-Flyer سر برآورده است. این شرکت از سال ها پیش، سرمایه گذاری های قابل توجهی را در حوزه های هوش مصنوعی و پردازنده های گرافیکی به انجام رسانده بود. در سال 2023، High-Flyer تصمیم گرفت دیپ سیک را به عنوان یک نهاد مستقل و متخصص در زمینه هوش مصنوعی بنیان کند. یکی از ویژگی های متمایز دیپ سیک، اتخاذ رویکردی خوداتکا در قیاس با بسیاری از استارت آپ های مشابه است. دیپ سیک به جای وابستگی به سرویس های ابری، مراکز داده اختصاصی خود را راهبری می نماید. این استقلال عمل به دیپ سیک امکان می دهد تا فرایند آزمایش و بهینه سازی مدل های هوش مصنوعی خود را به طور کامل مدیریت کند و بدون احتیاج به تعامل با شرکت های بیرونی، تغییرات ضروری را به سرعت اعمال نماید.
یکی دیگر از نقاط قوت کلیدی دیپ سیک، توانایی جذب نخبگان و استعدادهای برتر از داخل مرزهای چین است. این شرکت با ارائه بسته های جبرانی رقابتی و وسوسه انگیز، متخصصان برجسته هوش مصنوعی را از دانشگاه های معتبر چینی، نظیر دانشگاه پکن و دانشگاه ژجیانگ، به خدمت می گیرد. گزارش ها نشان می دهند که بعضی از پژوهشگران هوش مصنوعی در دیپ سیک، سالانه بالغ بر 1.3 میلیون دلار دستمزد دریافت می نمایند که حتی از سطوح پرداختی شرکت های بزرگ هوش مصنوعی چینی مانند مون شات نیز فراتر می رود.
دیپ سیک به جای تمرکز صرف بر افزایش مقیاس سخت افزاری، استراتژی متفاوتی را پیاده سازی نموده و بر ارتقای الگوریتم ها و نوآوری های فنی تاکید دارد. برای مثال، این شرکت الگوریتم Multi-Head Latent Attention (MLA) را توسعه داده است که حاصل ماه ها تلاش پژوهشی و بهره گیری گسترده از پردازنده های گرافیکی بوده است. مدیرعامل دیپ سیک خاطرنشان می نماید که با اتخاذ روینمودهای هوشمندانه و الگوریتم های کارآمد، می توان با صرف منابع محدودتر، به نتایجی هم تراز یا حتی برتر دست یافت.
با این حال، دستاوردهای دیپ سیک تنها معلول نوآوری های فنی نیست، بلکه سرمایه گذاری های بزرگ و جذب استعدادهای نخبه نیز در این میان نقش مشخص نماینده ای ایفا می نمایند. از منظر بسیاری از متخصصان حوزه سخت افزار، ادعاهای اولیه این شرکت پیرامون هزینه های بسیار اندک آموزش مدل های هوش مصنوعی، بیشتر جنبه تبلیغاتی داشته و از واقعیت فاصله دارد. در حقیقت، دیپ سیک نیز همانند سایر شرکت های پیشرو در عرصه هوش مصنوعی، برای حفظ جایگاه رقابتی خود، احتیاجمند سرمایه گذاری های هنگفت و تلاش های پیگیر و مداوم است.
منبع: Toms Hardware
منبع: دیجیکالا مگ