चैटजीपीटी, डीपसीक को टक्कर देने के लिए भारत अपना LLM फाउंडेशनल मॉडल बनायेगा:
चर्चा में क्यों है?
- एक नई चीनी आर्टिफिशियल इंटेलिजेंस (एआई) लैब द्वारा कम लागत वाले फाउंडेशनल मॉडल ‘डीपसीक’ को लॉन्च करने के कुछ दिनों बाद, आईटी मंत्री अश्विनी वैष्णव ने 30 जनवरी को कहा कि भारत सरकार ने 10,370 करोड़ रुपये के ‘इंडियाएआई मिशन’ के हिस्से के रूप में अपना खुद का एक घरेलू बड़ा भाषा मॉडल (LLM) बनाने का फैसला किया है।
- आईटी मंत्री ने कहा कि भारत सरकार विश्व स्तरीय फाउंडेशनल AI मॉडल बनाने, जिसमें 4-8 महीने लग सकते हैं, के लिए कम से कम छह डेवलपर्स के संपर्क में है।
भारत में एक कॉमन कंप्यूटिंग सुविधा का विकास:
- भारत में एक कॉमन कंप्यूटिंग सुविधा को विकसित करने के बारे में, आईटी मंत्री ने कहा कि जिन 18,693 GPU को पैनल में शामिल करने की मंजूरी दी गई है, उनमें से लगभग 10,000 GPU आज स्थापित होने के लिए तैयार हैं।
- भारत सरकार ने 10 कंपनियों का भी चयन किया है जो 18,693 ग्राफिक्स प्रोसेसिंग यूनिट या GPU की आपूर्ति करेंगी। ये GPU चिप्स मशीन लर्निंग टूल विकसित करने के लिए आवश्यक उच्च अंत चिप्स है, जो एक फाउंडेशनल मॉडल विकसित करने में उपयोग किये जा सकते हैं।
- भारत सरकार अगले कुछ दिनों में एक कॉमन कंप्यूटिंग सुविधा शुरू करेगी, जहाँ से स्टार्टअप और शोधकर्ता कंप्यूटिंग पावर का उपयोग कर सकेंगे। उच्च स्तरीय GPU तक पहुँचने की लागत 150 रुपये प्रति घंटा होगी, और निम्न स्तरीय GPU का उपयोग करने पर 115.85 रुपये प्रति घंटा खर्च आएगा। इन सेवाओं तक पहुँच को और आसान बनाने के लिए, सरकार अंतिम उपयोगकर्ताओं को कुल कीमत पर 40 प्रतिशत सब्सिडी देगी।
बड़े भाषा मॉडल (LLM) क्या होते हैं?
- बड़े भाषा मॉडल (LLM) बड़ी मात्रा में पाठ सामग्री को संसाधित करने के लिए गहन लर्निंग तकनीकों का उपयोग करते हैं। वे बड़ी मात्रा में पाठ सामग्री को संसाधित करके, संरचना और अर्थ को समझकर और उससे सीखकर काम करते हैं।
- LLM को शब्दों के बीच अर्थ और संबंधों की पहचान करने के लिए ‘प्रशिक्षित’ किया जाता है।
- उल्लेखनीय है कि किसी LLM मॉडल को जितनी अधिक मात्रा में प्रशिक्षण पाठ सामग्री डेटा उपलब्ध कराया जाता है, वह पाठ सामग्री को समझने और तैयार करने में उतना ही अधिक कुशल हो जाता है। प्रशिक्षण डेटा में बड़ी मात्रा में टेक्स्ट डेटा होता है, जिसका उपयोग LLM मॉडल नेचुरल भाषा को समझने और उत्पन्न करने के लिए करते हैं।
डीपसीक क्या है?
- डीपसीक हांग्जो में स्थित एक चीनी एआई कंपनी है। सीमित संसाधनों के इष्टतम उपयोग के कारण, डीपसीक को अमेरिकी एआई पावरहाउस ओपनएआई के खिलाफ खड़ा किया गया है।
- इसके एक डीपसीक-वी3, ने इस महीने की शुरुआत में कई बेंचमार्क में जीपीटी-4o और क्लाउड 3.5 सॉनेट को पीछे छोड़ दिया।
- उल्लेखनीय है कि डीपसीक मॉडल को जो चीज अलग बनाती है, वह है उनका प्रदर्शन और ओपन-सोर्स प्रकृति जिसमें ओपन वेट हैं, जो अनिवार्य रूप से किसी को भी उनके ऊपर निर्माण करने की अनुमति देता है।
- डीपसीक-वी3 को मात्र 5 मिलियन डॉलर में प्रशिक्षित किया गया है, जो ओपनएआई, मेटा, गूगल आदि द्वारा अपने फ्रंटियर मॉडल में लगाए गए सैकड़ों मिलियन डॉलर का एक अंश है।
- यह सर्वविदित है कि AI मॉडल को प्रशिक्षित करने के लिए भारी निवेश की आवश्यकता होती है। लेकिन डीपसीक ने भारी बुनियादी ढांचे और हार्डवेयर लागत को कम करने का एक तरीका खोज लिया है। डीपसीक NVIDIA H800 का उपयोग करके अपने AI मॉडल बनाने की लागत को नाटकीय रूप से कम करने में सक्षम था, जिसे अमेरिका में GPU की पुरानी पीढ़ी माना जाता है।
नोट : आप खुद को नवीनतम UPSC Current Affairs in Hindi से अपडेट रखने के लिए Vajirao & Reddy Institute के साथ जुडें.
नोट : हम रविवार को छोड़कर दैनिक आधार पर करेंट अफेयर्स अपलोड करते हैं
Read Current Affairs in English ⇒