Register For UPSC IAS New Batch

AI चैटबॉट ‘ग्रोक’ द्वारा एडोल्फ हिटलर की प्रशंसा करने से एक गहरी AI समस्या का पता चलता है?

For Latest Updates, Current Affairs & Knowledgeable Content.

AI चैटबॉट ‘ग्रोक’ द्वारा एडोल्फ हिटलर की प्रशंसा करने से एक गहरी AI समस्या का पता चलता है?

चर्चा में क्यों है?

  • एलन मस्क की एआई कंपनी xAI ने अपने चैटबॉट ग्रोक, जो प्लेटफ़ॉर्म X के साथ एकीकृत है, द्वारा यहूदी विरोधी और अपमानजनक सामग्री पोस्ट करने के बाद माफ़ी मांगी है, जिसमें एडॉल्फ हिटलर की प्रशंसा भी शामिल है। ग्रोक के जवाबों, जिनमें यहूदी लोगों पर “श्वेत-विरोधी सक्रियता” का आरोप लगाया गया था, की कड़ी आलोचना हुई और इसे मस्क के “जागृति-विरोधी” AI के प्रयासों से जोड़ा गया।
  • xAI ने इस समस्या के लिए एक त्रुटिपूर्ण कोड अपडेट को ज़िम्मेदार ठहराया और दावा किया कि उसने इसे हल कर लिया है, इस बात पर ज़ोर देते हुए कि ग्रोक का मुख्य भाषा मॉडल अप्रभावित रहा।
  • इसके व्यवहार ने पहले भी भारत में अपशब्दों, हिंदी की कठबोली और महिला विरोधी गालियों से युक्त प्रतिक्रियाओं को लेकर विवाद खड़ा कर दिया था, जिसने अंततः इस वर्ष मार्च में आईटी मंत्रालय का ध्यान आकर्षित किया। यह प्रकरण सुरक्षित और पूर्वानुमानित AI व्यवहार सुनिश्चित करने में चल रही तकनीकी कठिनाइयों को उजागर करता है।

एआई व्यवहार की गारंटी देना क्यों मुश्किल है?

  • ग्रोक से जुड़ा हालिया विवाद बड़े भाषा मॉडल (LLM) से जुड़ी एक व्यापक समस्या का हिस्सा है, क्योंकि गूगल के जेमिनी और मेटा के एआई जैसे प्लेटफॉर्म को भी पक्षपाती या आपत्तिजनक आउटपुट के कारण आलोचनाओं का सामना करना पड़ा है।
  • बुद्धिमान दिखने के बावजूद, ग्रोक जैसे LLM अनिवार्य रूप से संभाव्य “सिंथेटिक टेक्स्ट मशीन” हैं, जो वास्तविक समझ के माध्यम से नहीं, बल्कि अपने विशाल प्रशिक्षण डेटा से शब्द पैटर्न की नकल करके भाषा उत्पन्न करते हैं।
  • जैसा कि भाषाविद् एमिली एम. बेंडर बताती हैं, उनकी अप्रत्याशितता दो मुख्य कारकों से उत्पन्न होती है: त्रुटिपूर्ण प्रशिक्षण डेटा और उपयोगकर्ता द्वारा प्रदान किए गए संदर्भ का प्रभाव।
  • यदि प्रशिक्षण डेटा में अनियंत्रित कट्टरता शामिल है या यदि मॉडल पक्षपाती वास्तविक समय स्रोतों से जानकारी लेता है – जैसा कि ग्रोक एलोन मस्क के एक्स से करता है – तो यह समस्याग्रस्त सामग्री उत्पन्न कर सकता है।
  • इसके अतिरिक्त, उपयोगकर्ता ऐसे संकेत तैयार कर सकते हैं जो आउटपुट में हेरफेर करते हैं, जिससे पता चलता है कि LLM तथ्यात्मक जानकारी पुनर्प्राप्ति के लिए अविश्वसनीय क्यों हैं।
  • ऐसे में प्रशिक्षण डेटासेट में पारदर्शिता और सख्त सुरक्षा उपायों के बिना, एआई प्रणालियों में हानिकारक आउटपुट का जोखिम बना रहता है।

एक बार मॉडल तैनात हो जाने पर एआई आउटपुट को कैसे नियंत्रित किया जा सकता है?

  • AI डेवलपर बड़े भाषा मॉडल (LLM) के व्यवहार को नियंत्रित करने के लिए कई तरीके अपनाते हैं, लेकिन हर एक की अपनी सीमाएँ होती हैं।
  • हार्डकोडेड वार्तालाप: एक तकनीक हार्डकोडेड वार्तालाप है, जहाँ डेवलपर सामान्य प्रश्नों के विशिष्ट उत्तर प्रोग्राम करते हैं, लेकिन इन्हें जेलब्रेकिंग के माध्यम से दरकिनार किया जा सकता है—सावधानीपूर्वक तैयार किए गए संकेत जो प्रतिबंधों से बचते हैं।
  • ब्रूट-फोर्स ब्लॉकिंग: ब्रूट-फोर्स ब्लॉकिंग, जैसे कि Google का 2015 में अपने फ़ोटो ऐप में गोरिल्ला पहचान को ब्लॉक करने का निर्णय, आपत्तिजनक आउटपुट को रोक सकता है लेकिन AI की क्षमताओं को भी सीमित कर सकता है।
  • सिस्टम संकेत मॉडल: सिस्टम संकेत मॉडल के व्यवहार और व्यक्तित्व को आकार देने में मदद करते हैं, फिर भी उन्हें ओवरराइड किया जा सकता है।
  • सुदृढीकरण अधिगम (RL): सुदृढीकरण अधिगम (RL), विशेष रूप से मानव प्रतिक्रिया से RL (RLHF), का उपयोग मॉडल के व्यवहार को ठीक करने के लिए किया जाता है, लेकिन मॉडल कभी-कभी पुरस्कार प्रणाली की खामियों का फायदा उठाते हैं।
  • रेड-टीमिंग: रेड-टीमिंग, जिसमें मॉडलों की कमज़ोरियों को उजागर करने के लिए प्रतिकूल संकेतों के साथ उनका तनाव-परीक्षण किया जाता है, एआई सुरक्षा को बढ़ाने की एक उभरती हुई रणनीति है।
  • निश्चित रूप से, इनमें से कोई भी दृष्टिकोण यह गारंटी नहीं दे सकता कि एक एआई मॉडल पूरी तरह से व्यवहार करेगा। एआई व्यवहार को मानवीय मूल्यों के साथ नियंत्रित और संरेखित करने की चुनौती ने इस वर्ष शोधकर्ताओं और स्टार्टअप्स दोनों का ध्यान फिर से आकर्षित किया है।
  • नए शोध ने यह भी दिखाया है कि एआई मॉडल को सीमित रूप से परिष्कृत करने से गलत व्यवहार हो सकता है। इससे यह समझने में मदद मिल सकती है कि ग्रोक, विशेष रूप से, इन विफलताओं के लिए प्रवण क्यों है क्योंकि इसे “अधिकतम सत्य-खोज” एआई के रूप में डिजाइन किया गया है।

नोट : आप खुद को नवीनतम UPSC Current Affairs in Hindi से अपडेट रखने के लिए Vajirao & Reddy Institute के साथ जुडें.

नोट : हम रविवार को छोड़कर दैनिक आधार पर करेंट अफेयर्स अपलोड करते हैं

Read Current Affairs in English

Call Now Button