B.F. Skinner's Operant Conditioning
पृष्ठभूमि और नींव(Background and Foundation)
बुरहस फ्रेडरिक स्किनर (1904-1990) व्यवहारवाद के क्षेत्र में एक प्रमुख व्यक्ति थे, स्किनर ने इवान पावलोव (क्लासिकल कंडीशनिंग classical conditioning) और जॉन बी. वॉटसन जैसे मनोवैज्ञानिकों के पहले के काम का विस्तार किया। स्किनर यह मानते है कि सभी व्यवहार, पर्यावरण के साथ अंतःक्रिया (Interaction) का परिणाम है।जबकि पावलोव(Pavlov) की (classical
conditioning)क्लासिकल कंडीशनिंग ने उत्तेजनाओं(stimuli) और प्रतिक्रियाओं(responses) के बीच संबंध को बताया, स्किनर की (Operant
conditioning)ऑपरेंट कंडीशनिंग ने स्वैच्छिक व्यवहार को आकार देने में परिणामों की भूमिका पर जोर दिया।
(Operant conditioning)ऑपरेंट कंडीशनिंग की मूल अवधारणाएँ :
1. प्रबलन (Reinforcement):
(Operant conditioning) क्रिया प्रसूत अनुकूलन सिद्धांत में प्रबलन एक केंद्रीय अवधारणा है। यह किसी व्यक्ति अथवा जानवर के व्यवहार में होने वाले परिवर्तन की संभावना को प्रभावित है।
a.सकारात्मक प्रबलन (Positive
Reinforcement):
यह तब होता है जब एक व्यवहार के बाद एक सुखद उत्तेजना(stimuli) की प्रस्तुति होती है, जिससे व्यवहार की आवृत्ति बढ़ जाती है। उदाहरण के लिए, एक शिक्षक अपना गृहकार्य पूरा करने के लिए छात्र की प्रशंसा (सकारात्मक प्रोत्साहन) करता है, जो छात्र को अपना गृहकार्य जारी रखने के लिए प्रोत्साहित करता है।यहाँ पर अध्यापक द्वारा की गयी प्रशंसा positive reinforcement है।
b.नकारात्मक सुदृढीकरण(Negative Reinforcement):
यह तब होता है जब एक व्यवहार(behavior) के बाद एक अप्रिय उत्तेजना(stimuli) को हटा दिया जाता है या टाल दिया जाता है, जिससे व्यवहार की आवृत्ति भी बढ़ जाती है। यह एक मनोवैज्ञानिक अवधारणा है जिसमें किसी प्रतिकूल उत्तेजना (unpleasant stimulus) को हटाकर एक वांछनीय व्यवहार (desired behavior) को बढ़ावा दिया जाता है। इसे दंड से भिन्न माना जाता है। एक उदाहरण यह है कि जब यदि शिक्षक अतिरिक्त होमवर्क देना बंद कर देते हैं जब छात्र समय पर अपने असाइनमेंट्स (assignments) जमा करते हैं, तो अतिरिक्त होमवर्क (प्रतिकूल उत्तेजना) की हटाने से छात्र समय पर असाइनमेंट्स(assignments) जमा करने के लिए प्रेरित होते हैं।
2. सजा(Punishment):
सजा, प्रबलन के विपरीत है। इसका उद्देश्य किसी व्यक्ति के बुरे व्यवहार को कम करने के लिए किया जाता है ।
सकारात्मक दंड(Positive Punishment): एक व्यवहार के बाद एक अप्रिय उत्तेजना प्रस्तुत करना, उस व्यवहार की संभावना को कम करना शामिल है। उदाहरण के लिए, एक बच्चा गर्म चूल्हे (व्यवहार) को छूता है और दर्द (सकारात्मक सजा) महसूस करता है जो बच्चे को फिर से चूल्हे को छूने से हतोत्साहित करता है ।
नकारात्मक दंड(Negative Punishment): एक व्यवहार के बाद एक वांछनीय उत्तेजना को हटाना, उस व्यवहार की संभावना को कम करना शामिल है। उदाहरण के लिए,यदि कोई बच्चा खेल के दौरान अनुचित व्यवहार करता है, तो उसे खेल या मजेदार गतिविधियों से दूर करके टाइम-आउट में भेज दिया जाता है, ताकि वह उस व्यवहार को दोबारा न करे। और किसी कार्यस्थल पर, किसी कर्मचारी के बार-बार लेट होने पर उसके बोनस को काटा जा सकता है या उसका वेतन कम किया जा सकता है।
3. प्रबलन के प्रकार(Types of Reinforcers):
प्राथमिक प्रबलक(Primary Reinforcers): ये स्वाभाविक रूप से प्रबलित करने वाले उत्तेजक हैं जो भोजन, पानी और आश्रय जैसी बुनियादी जैविक जरूरतों को पूरा करते हैं। उदाहरण के लिए, भोजन एक प्राथमिक प्रबलन है क्योंकि यह भूख को संतुष्ट करता है।
द्वितीयक प्रबलन(Secondary Reinforcers): ये ऐसे उत्तेजक हैं जो प्राथमिक प्रबलन के साथ जुड़कर प्रबलन गुण प्राप्त करते हैं। पैसा एक सामान्य द्वितीयक प्रबलन है; इसका कोई अंतर्निहित मूल्य नहीं है, लेकिन भोजन जैसे प्राथमिक प्रबलन के लिए इसका आदान-प्रदान किया जा सकता है।
4. प्रबलन की सूची(Schedules of Reinforcement):
प्रबलन(reinforcement) की प्रभावशीलता(effectiveness) लागू किए गए प्रबलन की सूची(schedule) या पैटर्न के आधार पर भिन्न हो सकती है। स्किनर ने कई प्रकारों की पहचान कीः
निरंतर प्रबलन(Continuous Reinforcement) : इसमें हर बार जब एक इच्छित व्यवहार(desired behavior) प्रदर्शित किया जाता है, तो उसे तुरंत प्रोत्साहन या इनाम(reward) दिया जाता है। यह सूची(schedule) नए व्यवहारों को स्थापित करने के लिए प्रभावी है लेकिन प्रबलन बंद होने के बाद तेजी से विलुप्त होने की संभावना है। पालतू जानवरों को ट्रिक करने पर हर बार इनाम देना सतत प्रोत्साहन का उदाहरण है।
आंशिक प्रबलन(Partial Reinforcement) : यहाँ प्रत्येक बार इच्छित व्यवहार को प्रोत्साहन नहीं मिलता, बल्कि इसे समय-समय पर प्रदान किया जाता है। व्यवहार को आंशिक प्रोत्साहन पर बनाए रखना दीर्घकालिक में अधिक स्थिर होता है क्योंकि व्यवहार की निरंतरता की उम्मीद बनी रहती है। एक चाय की दुकान में, हर 10वीं चाय पर मुफ्त चाय का इनाम मिलना इसका एक उदहारण हैं ।
- फिक्स्ड रेशियो (Fixed Ratio) सिड्यूल: इस योजना में, प्रोत्साहन हर बार एक निश्चित संख्या में व्यवहार पूरा करने पर दिया जाता है। उदाहरण के लिए, एक पेड़ के प्रति 10वीं फसल के लिए इनाम मिलना।
- वेरिएबल रेशियो (Variable Ratio) सिड्यूल: यहाँ प्रोत्साहन एक निश्चित औसत पर आधारित होता है, लेकिन सटीक संख्या में भिन्नता होती है। उदाहरण के लिए, लॉटरी टिकट्स में जीतने की संभावना। कभी आपको पहले टिकट पर इनाम मिल सकता है, कभी बाद में।
- फिक्स्ड इंटरवल (Fixed Interval) सिड्यूल: इस योजना में प्रोत्साहन एक निश्चित समय अंतराल के बाद दिया जाता है, जैसे कि हर घंटे या हर दिन। उदाहरण के लिए, एक सप्ताह में एक बार वेतन का भुगतान।
- वेरिएबल इंटरवल (Variable Interval) सिड्यूल: यहाँ प्रोत्साहन समय के एक औसत अंतराल पर प्रदान किया जाता है, लेकिन सटीक समय भिन्न हो सकता है। उदाहरण के लिए, ईमेल के आ जाने पर, कभी भी नया मेल आ सकता है, लेकिन औसतन समय अंतराल पर।
5. आकार देना और अनुक्रमिक अनुमान (Shaping and Successive Approximations):
Shaping and Successive Approximations एक ऐसी तकनीक है जिसका उपयोग वांछित(Desired) व्यवहार(Behavior) के अनुक्रमिक अनुमानों को मजबूत करके नए व्यवहारों को सिखाने के लिए किया जाता है। इसमें व्यवहार को छोटे-छोटे चरणों(steps) में तोड़कर desired behavior को प्राप्त किया जाता हैं ।इसमें शुरुआती चरणों में व्यवहार के सरल steps को सिखाया जाता है, और फिर धीरे-धीरे अधिक जटिल steps को सिखाते है और अंत में पूर्ण रूप को सिखाया जाता है ।
उदाहरण के लिए, यदि एक शिक्षक छात्रों को एक जटिल गणितीय प्रक्रिया सिखा रहा है, तो वे पहले बुनियादी कौशल सिखाएंगे, फिर एक-एक करके अधिक जटिल चरण जोड़ेंगे । और यदि आप अपने कुत्ते को एक जटिल ट्रिक सिखाना चाहते हैं, जैसे कि "रिंग के अन्दर से कूदना," तो आप पहले उसे केवल रिंग के पास जाकर ले जाये, फिर रिंग को छूने और उसके साथ खेलना सिखाये, और अंत में उसे रिंग के अंदर से कूदने के लिए प्रशिक्षित करेंगे।
6. विलुप्त होना(Extinction):
Extinction एक व्यवहारिक प्रक्रिया है जो ऑपेरेंट कंडीशनिंग में उपयोग की जाती है जब पहले प्रबलित व्यवहार के बाद प्रबलित परिणाम नहीं होता है,तो व्यवहार की आवृत्ति में धीरे-धीरे कमी आती है। यदि एक व्यवहार जिसे पहले प्रबलित किया गया था अब प्रबलित नहीं किया जाता है, तो यह अंततः बंद हो जाएगा। उदाहरण के लिए, यदि आप अपने कुत्ते को चाय के कप में मुह डालने की आदत को छुड़ाना चाहते हैं, तो आप कुत्ते को कप में मुह डालने पर कोई भी प्रतिक्रिया (प्रोत्साहन) नहीं देंगे। धीरे-धीरे, कुत्ता कप में मुह डालने की आदत छोड़ देगा क्योंकि उसे कोई प्रतिक्रिया (प्रोत्साहन) नहीं मिल रहा है । अंन्य उदहारण के लिए एक शिक्षक ने देखा कि एक छात्र कक्षा के दौरान बार-बार ध्यान आकर्षित करने के लिए बुरा व्यवहार कर रहा है। शिक्षक उस व्यवहार पर ध्यान देना और उस पर प्रतिक्रिया देना बंद कर देता है। जैसे-जैसे छात्र को कोई ध्यान नहीं मिलता, वह बुरा व्यवहार धीरे-धीरे बंद कर देता है।
स्किनर बॉक्स प्रयोग (Skinner Box Experiment):
स्किनर के सबसे प्रसिद्ध प्रयोगात्मक उपकरणों में से एक "स्किनर बॉक्स" था, जो जानवरों के व्यवहार का अध्ययन करने के लिए उपयोग किया जाने वाला एक नियंत्रित वातावरण था। डिब्बे में आम तौर पर एक लीवर या बटन होता था जिसे एक जानवर (अक्सर एक चूहा या कबूतर) इनाम (जैसे भोजन) प्राप्त करने या सजा से बचने के लिए दबा सकता था। (like a mild electric shock).
स्किनर ने बॉक्स का उपयोग यह प्रदर्शित करने के लिए किया कि कैसे जानवर प्रबलन के माध्यम से विशिष्ट व्यवहार करना सीख सकते हैं। उदाहरण के लिए, एक स्किनर बॉक्स में एक चूहा एक खाद्य गोली प्राप्त करने के लिए एक लीवर को दबाना सीख सकता है। प्रबलन के कार्यक्रम को बदलकर, स्किनर जानवर के व्यवहार पर प्रभावों का निरीक्षण और दस्तावेजीकरण करने में सक्षम था।
ऑपरेंट कंडीशनिंग के स्किनर के सिद्धांत के विभिन्न क्षेत्रों में व्यापक अनुप्रयोग हुए हैंः
1. शिक्षा(Education):
कक्षा प्रबंधन(Classroom Management):शिक्षक वांछनीय व्यवहारों को प्रोत्साहित करने के लिए प्रबलन रणनीतियों का उपयोग करते हैं, जैसे कि भागीदारी, समय की पाबंदी और गृहकार्य पूरा करना। उदाहरण के लिए, एक छात्र को अच्छे व्यवहार के लिए एक स्टीकर या अतिरिक्त अवकाश समय मिल सकता है।
निर्देशात्मक डिजाइन(Instructional Design): कंप्यूटर-सहायता प्राप्त शिक्षण जैसे कार्यक्रम अक्सर तत्काल प्रतिक्रिया और प्रबलन प्रदान करने के लिए ऑपरेंट कंडीशनिंग के सिद्धांतों का उपयोग करते हैं, जिससे छात्रों को अधिक प्रभावी ढंग से सीखने में मदद मिलती है।
2. व्यवहार संबंधी चिकित्सा(Behavioral Therapy):
व्यवहार संशोधनः चिकित्सक फोबिया, लत या बाध्यकारी व्यवहार जैसे दुर्भावनापूर्ण व्यवहारों को बदलने के लिए ऑपरेंट कंडीशनिंग तकनीकों का उपयोग करते हैं। उदाहरण के लिए, एक चिकित्सक एक ग्राहक को स्वस्थ व्यवहार में संलग्न होने के लिए प्रोत्साहित करने के लिए सकारात्मक प्रबलन का उपयोग कर सकता है।
टोकन अर्थव्यवस्थाएँः मनोरोग अस्पतालों या स्कूलों जैसी व्यवस्थाओं में, टोकन अर्थव्यवस्थाओं का उपयोग किया जाता है जहाँ व्यक्ति विशिष्ट व्यवहारों के लिए टोकन अर्जित करते हैं, जिन्हें पुरस्कार के लिए बदला जा सकता है। यह प्रणाली सकारात्मक व्यवहार को मजबूत करती है और व्यवहार प्रबंधन में मदद करती है।
3. पेरेंटिंग(Parenting):
व्यवहार प्रबंधनः माता-पिता अक्सर अपने बच्चों के व्यवहार को आकार देने के लिए प्रबलन और सजा का उपयोग करते हैं। सकारात्मक प्रबलन में अच्छे व्यवहार के लिए प्रशंसा या पुरस्कार शामिल हो सकते हैं, जबकि नकारात्मक सजा में समय-समाप्ति या अवांछनीय व्यवहार के लिए विशेषाधिकारों को हटाना शामिल हो सकता है।
4. कार्यस्थल(Workplace):
कर्मचारी प्रेरणाः नियोक्ता प्रोत्साहन कार्यक्रमों में संचालन अनुकूलन सिद्धांतों का उपयोग करते हैं, जहां कर्मचारियों को प्रदर्शन लक्ष्यों को पूरा करने के लिए बोनस, पदोन्नति या अन्य पुरस्कार प्राप्त होते हैं।
प्रदर्शन प्रतिक्रियाः नियमित प्रतिक्रिया और प्रबलन कर्मचारी के प्रदर्शन और नौकरी की संतुष्टि में सुधार करने में मदद कर सकते हैं।
Conclusion
B.F. Skinner के काम का मनोविज्ञान, शिक्षा, चिकित्सा और उससे आगे पर गहरा प्रभाव पड़ा है। उनके विचार व्यवहार संशोधन, निर्देशात्मक डिजाइन और यहां तक कि कृत्रिम बुद्धिमत्ता में प्रथाओं को सूचित करना जारी रखते हैं, जहां प्रबलन सीखने के एल्गोरिदम का उपयोग मशीनों को प्रशिक्षित करने के लिए उसी तरह किया जाता है जैसे स्किनर ने जानवरों को प्रशिक्षित किया था।
स्किनर की ऑपरेंट कंडीशनिंग व्यवहार मनोविज्ञान की आधारशिला बनी हुई है, जो प्रबलन और सजा के व्यवस्थित अनुप्रयोग के माध्यम से व्यवहार को कैसे आकार दिया जा सकता है, संशोधित किया जा सकता है और नियंत्रित किया जा सकता है, इस बारे में मूल्यवान अंतर्दृष्टि प्रदान करती है।





0 टिप्पणियाँ