The Lallantop
लल्लनटॉप का चैनलJOINकरें

मुट्ठीभर लोगों से शहर का हाल बता देने वाला इंडियन साइंटिस्ट

प्रशान्त चन्द्र महालनोबिस को भारत में सांख्यिकी का जनक माना जाता है. भारत में सर्वेक्षण के लिए सैम्पल सर्वे विधि की शुरुआत करने वाले महालनोबिस के जन्म दिन 29 जून को राष्ट्रीय सांख्यिकी दिवस के रूप में मनाया जाता है.

post-main-image
अनेक राष्ट्रीय एवं अंतरराष्ट्रीय पुरस्कारों से सम्मानित महालनोबिस वर्ष 1945 में रॉयल सोसाइटी, लंदन के ‘फेलो’ चुने गए (तस्वीर: ISI कोलकाता)
चीन के प्रधानमंत्री टेबल पर जम गए 

दिसंबर 1956 की बात है. ये हिंदी-चीनी भाई भाई का दौर था और चीन के प्रीमियर जोह इनलाई भारत के दौरे पर थे. यहां उनके कार्यक्रम में इंडियन स्टैटिस्टिकल इंस्टीट्यूट, कलकत्ता (ISI) की विजिट भी शामिल थी. आधे घंटे का कार्यक्रम ऐसा खिंचा कि इनलाई के और बहुत से अप्वॉइंटमेंट धरे के धरे रह गए थे.

हुआ यूं कि ISI में इनलाई को एक प्रेसेंटेशन दिखाई गई. जिसमें डाटा को इकट्ठा करने और उसके एनालिसिस का तरीक़ा बताया गया था. इस प्रेज़ेंटेशन से इनलाई का दिमाग़ ऐसा घूमा कि वहीं टेबल पर जम गए और बोले, जब तक मेरे सारे सवालों का जवाब नहीं मिल जाएगा, यहां से हिलूंगा नहीं. ऐसा क्यों कह रहे थे इनलाई?

दरअसल चीन में हालात अच्छे नहीं थे. चीन कम्यूनिस्ट क्रांति की शुरुआत हो चुकी थी, लेकिन हर चीज केंद्र से तय हो रही थी, मसलन कितना उत्पादन होगा, कहां कौन सी इंडस्ट्री लगेगी आदि. लेकिन ये सब तय करने के लिए जरुरत थी डेटा की. कहां कितनी मांग, कितना आउटपुट, आदि. लोगों की कमी नहीं थी, सो घर-घर से डेटा लिया गया. लेकिन फिर एक और दिक्कत खड़ी हो गई. इतने डेटा का विश्लेषण कैसे किया जाए. ये भूसे में सुई खोजने के समान था.

चाउ-एन-लाई, चीन के प्रधान मंत्री, प्रशांत चंद्र महालनोबिस के साथ आईएसआई में मशीन टेबुलेशन यूनिट (एनएसएस) का दौरा करते हुए, 9 दिसंबर, 1956 (तस्वीर: ISI Kolkata)

चीन के स्टैटिशियन इसी सवाल को लेकर परेशान थे. इनलाई का ISI का दौरा भी इसी के मद्देनजर था. यहां 1940 के दौर में ही कृषि उत्पादन से लेकर चाय पीने की आदतों को लेकर डेटा इकठ्ठा किया जा रहा था. और इस बेहतरी से किया जा रहा था कि हेरोल्ड होटलिंग नाम के माने हुए स्टैटिशियन ने तब कहा था,

“सैम्पलिंग की तकनीक जो भारत में विकसित हुई है, अमेरिका या और कोई भी देश उसकी सटीकता की बराबरी नहीं कर सकता”

भारत में सांख्यिकी के इस मॉडल की शुरुआत करने वाले थे, प्रशांत चंद्र महालनोबिस. कौन थे ये? कैसे हुई सैम्पल सर्वे की शुरुआत, जिसकी मदद से आज 21 वीं सदी में भी इलेक्शन के रिजल्ट्स से जीडीपी की गणना की जाती है? जानेंगे आगे.

प्रशांत चंद्र महालनोबिस 

पहले जानते हैं उस व्यक्ति के बारे में जिसे भारत में सांख्यिकी का पितामह माना जाता है. नाम है प्रशांत चंद्र महालनोबिस या PCM, जो नाम उन्हें उनके कलीग्स ने दिया था. 29 जून 1893 को महालनोबिस की पैदाइश हुई, आज के हिसाब से बांग्लादेश के बिक्रमपुर में. कलकत्ता में शुरुआती पढ़ाई के बाद प्रेसिडेंसी कॉलेज से ग्रेजुएशन किया. दिग्गजों की छाया में पढ़ाई की. जगदीश चंद्र बासु और प्रफुल्ल चंद्र रे जैसे लोग महालनोबिस के शिक्षक हुआ करते थे. इसके अलावा कॉलेज में जूनियर थे, मेघनाद साहा और नेताजी सुभाष चंद्र बोस. 1912 में फिजिक्स से बैचलर की डिग्री ली और आगे पढ़ाई के लिए लन्दन चले गए.

आजादी के बाद भारत में राष्ट्रीय आय का अनुमान लगाने के उद्देश्य के लिए वर्ष 1949 में महालनोबिस की अध्यक्षता में ही एक ‘राष्ट्रीय आय समिति’ का गठन किया गया था (तस्वीर: Wikimedia Commons )

इत्तेफाक ऐसा बना कि लन्दन में एक ट्रेन छूट गई और किंग्स कॉलेज कैंब्रिज में एक दोस्त के साथ रहने लगे. यहां उन्हें कौन मिला, गैस करिए- श्रीनिवास रामानुजन. यहां रहते हुए ऑक्सफ़ोर्ड की एक पत्रिका, बिओमेट्रिका से राब्ता हुआ. पत्रिका सांख्यिकी पर लेख छापती थी. इसमें रूचि जाएगी तो PCM को अहसास हुआ कि वेदर फोरकास्टिंग से लेकर एंथ्रोपोलॉजी के क्षेत्र में सांख्यिकी का इस्तेमाल हो सकता है.

बस फिर क्या था. वापस भारत लौटे हुए जहाज में बैठे महालनोबिस के हाथ में कॉपी लिए सांख्यिकी की प्रॉब्लम सॉल्व कर रहे थे. कलकत्ता में प्रेसीडेंसी कॉलेज में काम करते हुए महालनोबिस को ऐसे लोगों का साथ मिला जो सांख्यिकी के क्षेत्र में इंटरेस्टेड थे. 17 दिसम्बर 1931 को महानोलोबिस ने प्रमथा नाथ बनर्जी, निखिल रंजन सेन और RN मुखर्जी के साथ मिलकर इंडियन स्टैटिस्टिकल इंस्टीट्यूट की शुरुआत की. साल 1933 में ISI का पंजीकरण हुआ और संस्था ने सांख्य नाम की एक पत्रिका की शुरुआत की. साथ ही लोगों को सांख्यिकी में ट्रेनिंग देना शुरू किया.

धीरे-धीरे ISI भारत में डेटा इकठ्ठा करने और उसका विशेलषण करने का प्रीमियर इंस्टिट्यूट बन गया. सांख्यिकी के क्षेत्र में दो महत्वपूर्ण खोजों का श्रेय महालनोबिस को जाता है. इनमें से एक है महालनोबिस डिस्टेंस और दूसरा, सैम्पल सर्वे की शुरुआत.

क्या है महालनोबिस डिस्टेंस 

स्क्रीन पर एक ग्राफ देखिए. (ग्राफ 1). मान लीजिए x एक्सिस पर हाइट है और वाई एक्सिस पर वजन. तो आपने कई सारे लोगों का डेटा लिया और इस ग्राफ पर प्लाट किया. अब डेटा जो इकठ्ठा होगा वो कुछ अंडाकार सा शेप लेगा. यानी 5 फुट के व्यक्ति का वजन 50 किलो से लेकर 7 फुट के व्यक्ति का वजन 120 किलो, ये सभी डेटा यहां मौजूद होगा. ज़रूरी नहीं कि एक हाइट से सब लोगों का वजन एक सा हो, लेकिन ये दोनों वेरिएबल एकदूसरे पर कुछ हद तक निर्भर करते हैं. यानी लोगों का वजन क्या होगा, ये कुछ हद तक उनकी हाइट पर निर्भर करता है. ऐसे डेटा को कोरिलेटेड डेटा कहा जाता है. 

महालनोबिस डिस्टेंस ग्राफ १

अब सवाल ये कि आप कोई भी डेटा क्यों इक्कट्ठा करते हैं. इसलिए कि मॉडल बनाकर आगे प्रिडिक्शन कर सकें. यानी इस डेटा की मदद से हम किसी निश्चित हाइट के व्यक्ति के निश्चित वजन की गणना कर सकते हैं. ये 100% सही नहीं होगा लेकिन यही डेटा एनालिसिस का उद्देश्य है कि इस गणना को हम कितना सटीक कर पाएं. जितना बेहतर मॉडल उतनी बेहतर प्रिडिक्शन. आज यानी 21 वीं सदी में गूगल आदि इसी तकनीक से बिग डेटा का इस्तेमाल उपभोक्ता के व्यवहार को प्रिडिक्ट करने के लिए करते हैं.

अब स्क्रीन पर देखिए. आपको दो बिंदु दिखेंगे (ग्राफ 2). एक लाल और एक पीला. साधारण तौर पर देखा जाए तो इनमें से जो बिंदु सेंटर से जितना नजदीक हो, सटीक होने की उसकी प्रोबेबिलिटी उतनी अधिक होगी. स्कीन पर दिए ग्राफ में लाल बिंदु केंद्र के ज्यादा नजदीक है. यानी इस बिंदु पर जितनी हाइट है, उतना ही वेट होने की सम्भावना ज्यादा होनी चाहिए.

महालनोबिस डिस्टेंस ग्राफ 2 

लेकिन कोरिलेटेड डेटा में ऐसा होता नहीं है. अब पीला बिंदु देखिए. ये केंद्र से ज्यादा दूर है, लेकिन इस बिंदु पर जो हाइट है, उतना वेट होने की प्रोबेबिलिटी ज्यादा है. यानी ये ज्यादा सटीक भविष्यवाणी करता है. यही है महालनोबिस डिस्टेंस. जो कोरिलेटेड डेटा में गणना की सुविधा प्रदान करता है, खासकर तब जब वेरिएबल्स का माप अलग अलग हो. जैसे हमारे उदाहरण में वजन का माप किलो है और लम्बाई का माप, मीटर. सरल भाषा में समझने ने लिए हमने बहुत सारी चीजों को इग्नोर किया है, इसलिए गणित के ज्ञानी, किसी भूल चूक के लिए क्षमा करें.

महालनोबिस और नस्लभेद का विज्ञान

अब एक और दिलचस्प बात सुनिए. महालनोबिस डिस्टेंस खोज तब हुई थी जब महालनोबिस यूजनिक्स पर शोध कर रहे थे. नस्लभेद से प्रेरित विज्ञान, जिसमें नस्ल के आधार पर लोगों की स्टडी की जाती है. महालनोबिस तब कलकत्ता के एंग्लो-इंडियंस पर शोध कर रहे थे, ये देखने के लिए कि उनकी खोपड़ी का औसत आकार बंगाल के हिन्दुओं से कितना अलग या सामान है.

पी सी महलानोबिस और नील्स बोर 16 जनवरी, 1960 को आईएसआई में बातचीत के दौरान (तस्वीर: ISI कोलकाता  )

इस शोध के स्पांसर ये स्थापित करने की कोशिश कर रहे थे कि कलकत्ता के एंग्लो-इंडियन लोग बंगाल की उच्च जातियों के यूरोपियन लोगों से शादी करने का परिणाम थे. यानी इन लोगों का रिश्ता ऊंची जातियों से था. इस शोध के दौरान दो डेटा सेट्स को कम्पेयर करने के दौरान ही महालनोबिस ने, ‘महालनोबिस डिस्टेंस’ की खोज की थी. यूजनिक्स का जंक विज्ञान साबित हो चूका है, लेकिन ‘महालनोबिस डिस्टेंस’ का इस्तेमाल मौसम की भविष्यवाणी से लेकर मशीन लर्निंग और बिग डाटा के विश्लेषण में किया जाता है.

जिस दूसरी चीज़ की शुरुआत का श्रेय महालनोबिस को जाता है, वो है सैम्पल सर्वे की शुरुआत. सैम्पल सर्वे यानी एक बड़ी जनसंख्या में से कुछ लोगों को सैम्पल के रूप में स्टडी करना और उससे पूरी जनसंख्या के बारे में अनुमान निकालना. इलेक्शन से लेकर तमाम जगह आपने सैम्पल सर्वे का इस्तेमाल देखा होगा. अब सवाल ये कि सैम्पल सर्वे की शुरुआत में ऐसा क्रांतिकारी क्या था?

सैम्पल सर्वे क्यों था क्रांतिकारी तरीका?

उदाहरण से समझते हैं. मान लीजिए आप डॉनल्ड ट्रम्प हैं. इलेक्शन में खड़े होने वाले हैं. अब आप जीतेंगे कैसे? इसके लिए आपको जनता का मत समझना होगा. अब आप ये कैसे जानेंगे? पूरे अमेरिका की जनता से जाकर पूछ तो सकते नहीं कि वो किस मुद्दे पर वोट देने वाले हैं. इसके लिए आपको एक सैम्पल लेना होगा. अब कितना सैम्पल हो? इतना कम भी नहीं होना चाहिए कि डाटा गलत आए, ना ही इतना ज्यादा कि सर्वे कराने में ही सारा वक्त और पैसा लग जाए. इसलिए सांख्यिकी के नियमों के तहत सैम्पल साइज़ निकाला जाता है. जिसके लिए बाकायदा एक गणितीय फॉर्मूले का उपयोग होता है, और इस फॉर्मूले में जनसंख्या साइज़ से लेकर मार्जिन ऑफ एरर, और आपको सर्वे के उत्तर पर भरोसा कितना है, इसका भी ख्याल भी रखा जाता है. स्क्रीन पर छपे ग्राफ (ग्राफ 3) में आप अलग-अलग सिचुएशन में सैम्पल साइज़ क्या होगा, देख सकते हैं.

सैम्पल साइज़ की गणना (तस्वीर: checkmarket.com)

अब एक महत्वपूर्ण चीज. आप पूछ सकते हैं कि इसमें ख़ास क्या है. 100 लोगों से जाकर बात करो और पता लगा लो. बस यहीं सारा खेल है. अगर आप यूं ही जाकर 100 लोगों से पूछ लोगे तो ये तरीका वैज्ञानिक नहीं होगा. क्योंकि इस दौरान आप सैम्पल में विविधता का ध्यान नहीं रख पाओगे.

इसके लिए आपको प्रत्येक आय ग्रुप, लिंग, जाति (अगर भारत में हो तो) धर्म के सैम्पल का ध्यान रखना होगा. ताकि पूरी जनसंख्या का रिप्रेजेंटेशन हो सके. वरना आप मैखाने के पास जाकर सैम्पल सर्वे करो तो लगेगा कि पूरी दुनिया ही शराब पीती है. इसलिए सैम्पल सर्वे का बड़ा महत्त्व है. हर साल बजट से पहले पूरे देश का आर्थिक सर्वे कराती है. अब हर घर जाकर, हर आदमी से तो पूछा नहीं का सकता, इसलिए सांख्यिकी के नियमों के अनुसार एक सैम्पल का चुनाव कर ये काम किया जाता है. 

 इसके लिए भारत में NSSO, यानी नॅशनल सैम्पल सर्वे नाम की संस्था है. चूंकि एक सर्वे में मार्जिन ऑफ एरर की संभावना रहती है, इसलिए सरकार अलग-अलग संस्थाओं के माध्यम से सैम्पल सर्वे कराती है. लेकिन सबके लिए आधार सांख्यिकी के नियम ही होते हैं. जिनसे सरकार अलग-अलग योजनाओं पर किए जाने वाले खर्च का निर्धारण करती है, ये कैलकुलेट करती है कि किस मद में जरुरत कितनी है. चूंकि संसाधन सीमित है. इसलिए बिना सर्वे के ये काम हो नहीं सकता.

दूसरी पंचवर्षीय योजना में महालनोबिस मॉडल 

अब वापस महालनोबिस की कहानी पर चलते हैं. आजादी के बाद प्रधानमंत्री नेहरू ने महालनोबिस को योजना आयोग से जोड़ा. कुछ समय बाद महालनोबिस योजना आयोग के सदस्य के साथ-साथ पचास के दशक में हिंदुस्तान के सबसे अहम व्यक्तियों में से एक बन गए.

1945 में आम्रपाली में एक चर्चा  के दौरान जवाहरलाल नेहरू और पी सी महालनोबिस (तस्वीर: ISI कोलकाता)

साल 1949 में महालनोबिस ने नेशनल सैंपल सर्वे ऑफिस (NSSO) और केन्द्रीय सांख्यिकी संगठन (CSO) की स्थापना करने में सरकार की मदद की. NSSO ने साल 1949 में अपना पहला सर्वे किया. जो तब दुनिया में अपनी तरह का सबसे बड़ा सर्वे था. इसके लिए 1800 गांवों के 1 लाख परिवारों का सर्वे किया गया. जिसके बाद परिवार आधारित सर्वे का NSSO का तरीका पूरी दुनिया में एक स्टैण्डर्ड बन गया.

प्रधानमंत्री नेहरू ने उन्हें दूसरी पंचवर्षीय योजना की कमान भी सौंपी.1954 में महालनोबिस ने दूसरी पंचवर्षीय योजना का ड्राफ्ट योजना आयोग को दिया. जिसके बाद दूसरी पंचवर्षीय योजना के दौरान महालनोबिस मॉडल को अपनाया गया. इसके तहत भिलाई और दुर्गापुर स्टील प्लांट की शुरुआत हुई. साथ ही एटॉमिक एनर्जी कमीशन और टाटा इंस्टीट्यूट ऑफ फंडामेंटल रिसर्च जैसे संस्थानों की शुरुआत हुई. दूसरे प्लानिंग कमीशन का पूरा जोर औद्योगिकीकरण पर था.

इस मॉडल में लेकिन कई खामियां भी थीं. मसलन अत्यधिक आयात के चलते चालू वित्तीय घाटा बढ़ा और मुद्रास्फीति में भी बढ़ोतरी हुई, यानी महंगाई में इजाफा हुआ. 
महालनोबिस जीवन पर्यन्त ISI के डायरेक्टर बने रहे. दुनिया भर में उन्हें पुरस्कारों से नवाजा गया. मसलन 1945 में लंदन की रॉयल सोसायटी ने उन्हें अपना फेलो नियुक्त किया. 1952 में पाकिस्तान सांख्यिकी संस्थान ने फेलोशिप प्रदान की.1957 में ही उन्हें अंतरराष्ट्रीय सांख्यिकी संस्थान का मानद अध्यक्ष बनाया गया. और साल 1968 में भारत सरकार ने उन्हें पद्म विभूषण से सम्मानित किया. आज ही दिन यानी साल 28 जून, 1972 को उनका निधन हो गया था. साल 2006 के बाद के बाद उनके जन्मदिन को राष्ट्रीय सांख्यिकी दिवस के रूप में मनाया जाता है. आज के लिए…