DevSparks 2026 में NVIDIA DGX स्पार्क के साथ GenAI विकास पर पुनर्विचार

एक डेवलपर की महत्वाकांक्षा और उनके लिए उपलब्ध हार्डवेयर के बीच का अंतर लंबे समय से एआई की शांत निराशाओं में से एक रहा है। आपके पास एक विचार, एक मॉडल, खोज के लायक उपयोग का मामला है, लेकिन प्रयोग चलाने से पहले आपके सामने वाली मशीन की मेमोरी खत्म हो जाती है।

यह वह समस्या थी जिसने एक असाधारण सत्र के लिए माहौल तैयार किया देवस्पार्क्स पुणे 202628 फरवरी को हयात रीजेंसी, पुणे में आयोजित किया गया। इस कार्यक्रम ने दिन भर की तकनीकी गहराई और व्यावहारिक बातचीत के लिए डेवलपर्स, वास्तुकारों और प्रौद्योगिकीविदों को एक साथ लाया, और NVIDIA के साथ GenAI को गति देने पर तकनीकी गहनता ने दिन के दोपहर के भोजन के बाद के समय में एक खचाखच, व्यस्त कमरे को आकर्षित किया।

सत्र का नेतृत्व कर रहे थे सुनील पटेलNVIDIA में सॉल्यूशंस आर्किटेक्चर और इंजीनियरिंग के प्रबंधक, जिन्होंने परिचय देने के लिए समय का उपयोग किया डीजीएक्स स्पार्कएक डेस्क-साइड पर्सनल सुपरकंप्यूटर जिसे विशेष रूप से डेवलपर्स को ध्यान में रखकर डिज़ाइन किया गया है।

रैक से रूकसाक तक

NVIDIA दो नाटकीय चरम सीमाओं पर काम करता है। एक जेटसन मॉड्यूल केवल 7 वाट खींचता है, जो लगभग एक ऊर्जा-बचत करने वाला बल्ब उपयोग करता है। एक जीबी200 रैक क्लस्टर 140 किलोवाट बिजली खींचता है, जो 140 घरों में एक साथ चलने वाले एक ही माइक्रोवेव को बिजली देने के लिए पर्याप्त है।

वर्षों से, बड़े मॉडलों पर काम करने वाले डेवलपर्स के पास उन दो वास्तविकताओं के बीच कोई आरामदायक मध्य मार्ग नहीं था।

डीजीएक्स स्पार्क उस अंतर के लिए बनाया गया है। इसका वजन बमुश्किल एक किलोग्राम है, यह 140 वॉट खींचता है और एफपी4 पर एक पेटाफ्लॉप कंप्यूटिंग शक्ति प्रदान करता है। संदर्भ के लिए, मूल डीजीएक्स वन ने 2016 में एफपी16 पर समान हेडलाइन आंकड़ा हासिल किया था, लेकिन इसका वजन 70 किलोग्राम के करीब था और इसकी खपत 3.2 किलोवाट थी। उन दो उपकरणों के बीच की दूरी इस बात का माप है कि सिलिकॉन कितनी दूर आ गया है।

असल में अंदर क्या है

एक ब्लैकवेल जीपीयू एक चिप-टू-चिप इंटरकनेक्ट के माध्यम से एआरएम-आधारित सीपीयू से जुड़ा होता है जो मानक पीसीआईई की तुलना में पांच गुना तेज चलता है। वह चुस्त युग्मन 128 जीबी एकीकृत मेमोरी पूल को उसका वास्तविक मूल्य देता है: सीपीयू और जीपीयू एक ही स्थान साझा करते हैं, जिससे अलग-अलग पूलों के बीच डेटा शटल करने की बाधा दूर हो जाती है। डेवलपर्स बड़े मॉडलों को पूर्ण रूप से लोड कर सकते हैं और वर्तमान में समर्थित किसी भी असतत वर्कस्टेशन जीपीयू की तुलना में लंबे इनपुट अनुक्रमों के साथ काम कर सकते हैं।

पीछे एक कनेक्टएक्स-7 पोर्ट दो स्पार्क इकाइयों को 200 जीबीपीएस पर लिंक करने की अनुमति देता है। दो को एक साथ रखें, और आप 400-बिलियन-पैरामीटर मॉडल पर अनुमान चला सकते हैं। नेटवर्क स्विच में और जोड़ें, और आपके पास एक छोटा क्लस्टर है जो अभी भी मानक MPI और NCCL इंटरफेस का उपयोग करता है, इसलिए मौजूदा PyTorch प्रशिक्षण कोड पुनर्लेखन के बिना स्थानांतरित हो जाता है।

वही उपकरण, कोई प्रतीक्षा नहीं

पटेल का स्पष्ट मानना ​​था कि सॉफ्टवेयर अनुभव पहले दिन से ही परिचित होना चाहिए। एक NeMo कंटेनर, एक Isaac रोबोटिक्स छवि, या एक DeepStream वातावरण को खींचने से किसी भी अन्य NVIDIA मशीन के समान डॉकर कमांड का उपयोग होता है। कॉम्फीयूआई, अनस्लोथ और हगिंग फेस इंटीग्रेशन लीक से हटकर काम करते हैं।

पटेल ने दर्शकों से कहा, “आप अपने पिछले वर्कस्टेशन में जो कुछ भी कर रहे थे, वह वैसे ही काम करेगा।” “कुछ भी नहीं बदलता।”

जिन उपयोग के मामलों का उन्होंने अध्ययन किया वे ठोस थे। एफपी16 पर फ्लक्स 12-बिलियन-पैरामीटर मॉडल को फाइन-ट्यून करने के लिए लगभग 100 जीबी मेमोरी की आवश्यकता होती है, जो वर्तमान टॉप-एंड वर्कस्टेशन जीपीयू की 96 जीबी सीमा से अधिक है। यह DGX स्पार्क पर चलता है। वीडियो खोज और सारांश पाइपलाइन जो दृष्टि-भाषा मॉडल, बड़े भाषा मॉडल और वेक्टर डेटाबेस को एक ही डिवाइस पर स्थापित कर सकती हैं। पांडा और स्किकिट-लर्न के लिए RAPIDS, cuDF, या CUDA-त्वरित विकल्पों का उपयोग करके डेटा विज्ञान वर्कलोड मूल रूप से चलता है।

प्रोटोटाइपिंग उपकरण, उत्पादन विकल्प नहीं

प्रश्नोत्तरी ने तस्वीर को और अधिक स्पष्ट कर दिया। एक श्रोता सदस्य ने सीधे पूछा कि अलग-अलग जीपीयू के साथ फाइन-ट्यूनिंग गति की तुलना कैसे की जाती है। पटेल ने बिना किसी हिचकिचाहट के उत्तर दिया: एक समर्पित प्रशिक्षण कार्ड अभी भी अधिक थ्रूपुट और कम विलंबता प्रदान करेगा। एकीकृत मेमोरी बड़े कार्यभार को संभव बनाती है जो अन्यथा कहीं भी फिट नहीं होता, लेकिन यह उद्देश्य-निर्मित प्रशिक्षण हार्डवेयर की कच्ची गति को दोहराता नहीं है।

“इससे आपको प्रोटोटाइप बनाने में मदद मिलेगी,” उन्होंने कहा। “यह आपको यथासंभव सर्वोत्तम गति प्रदान नहीं करेगा।”

वह भेद धारण करने योग्य है। डीजीएक्स स्पार्क को क्लाउड या सर्वर इंफ्रास्ट्रक्चर के प्रतिस्थापन के रूप में तैनात नहीं किया गया है। यह वह उपकरण है जिसके पास आप तब पहुंचते हैं जब आपको यह सत्यापित करने की आवश्यकता होती है कि कोई विचार स्केल करने लायक है या नहीं, यह पता लगाने के लिए कतार में इंतजार किए बिना या बिल चलाने के बिना।

DGX स्पार्क भारत में NVIDIA के पार्टनर राशी के माध्यम से उपलब्ध है। पूर्वनिर्मित ब्लूप्रिंट, कंटेनर लिंक और सेटअप दस्तावेज़ीकरण सहित संसाधन यहां हैं build.nvidia.com/spark.

Source link


Discover more from News Link360

Subscribe to get the latest posts sent to your email.

Leave a Reply

Discover more from News Link360

Subscribe now to keep reading and get access to the full archive.

Continue reading