कैसे वैरिएन्स की गणना करें

आर्टिकल डाउनलोड करेंआर्टिकल डाउनलोड करें

वैरिएन्स (Variance), डेटा-सेट के विस्तार (spread) को मापने का एक तरीका है। सांख्यिकीय मॉडल बनाते समय यह उपयोगी होता है क्योंकि, लो (low) वैरिएन्स इस बात का सूचक होता है कि, आप अपने डेटा को ओवर-फिट (over-fit) कर रहे हैं। वैरिएन्स की गणना करना ट्रिकी (tricky) हो सकता है, लेकिन एक बार जब आप सूत्र को समझ लेते हैं, तो आपको अपना उत्तर खोजने के लिए केवल सही संख्या भरना होगा।

विधि 1
विधि 1 का 2:

एक नमूने के वैरिएन्स की गणना करना

आर्टिकल डाउनलोड करें
  1. How.com.vn हिन्द: Step 1 अपना नमूना डेटा-सेट लिखें:
    ज्यादातर मामलों में, सांख्यिकीविदों के पास केवल नमूना, या वे जिस आबादी का अध्ययन कर रहे हैं, उसका एक सबसेट (subset), ही होता है। उदाहरण के लिए, "जर्मनी में हर कार की लागत" जानने के लिए सम्पूर्ण डेटा का विश्लेषण करने के बजाय, एक सांख्यिकीविद को कुछ हज़ार कारों के ही रैंडम (random) नमूने की लागत मिल सकती है। इस नमूने का उपयोग करके वह जर्मन कारों की लागत का एक अच्छा अनुमान प्राप्त सकता है, परंतु यह वास्तविक संख्याओं से संभवतया पूर्णतया मेल नहीं खाएगा।
    • उदाहरण: एक कैफेटेरिया में हर दिन बेचे जाने वाले मफिन्स की संख्या का विश्लेषण करने के लिए, आप छह दिनों की बिक्री का नमूना रैंडम तरीके से लेते हैं और उत्तर पाते हैं: 38, 37, 36, 28, 18, 14, 12, 11, 10.7, 9.9। यह एक नमूना है, सम्पूर्ण डेटा नहीं, क्योंकि आपके पास, कैफेटेरिया खुले होने की स्थिति में, हर दिन का डेटा नहीं है।
    • यदि आपके पास जनसंख्या में प्रत्येक डेटा-प्वाइंट उपलब्ध हो तो उपरोक्त के बजाय नीचे दी गई विधि का प्रयोग करें
  2. How.com.vn हिन्द: Step 2 नमूना-वैरिएन्स सूत्र को लिखें:
    डेटा-सेट का वैरिएन्स आपको बताता है कि डेटा-प्वाइंट कितने विस्तारित (spread out) हैं। वैरिएन्स, शून्य के जितने करीब होता है, डेटा-प्वाइंट्स, उतने ही नज़दीकी रूप से, आपस में समूहीकृत (clustered) हो जाते है। नमूना-डेटा-सेट के साथ काम करते समय, वैरिएन्स की गणना करने के लिए, निम्नलिखित सूत्र का उपयोग करें:[१]
    • = ∑[( - x̅)]/(n - 1)
    • वैरिएन्स है। वैरिएन्स हमेशा वर्गीकृत (squared) इकाइयों में मापा जाता है।
    • आपके डेटा-सेट में एक टर्म का प्रतिनिधित्व करता है।
    • ∑, जिसका अर्थ "योग" होता है वह, के प्रत्येक मान के लिए, आपको निम्नलिखित टर्म्स की गणना करने और फिर उन्हें एक साथ जोड़ने के लिए कहता है।
    • x̅, नमूना का माध्य (mean) है।
    • n, डेटा-प्वाइंट्स की संख्या है।
  3. How.com.vn हिन्द: Step 3 नमूना का माध्य...
    नमूना का माध्य कैलकुलेट करें: सिंबल x̅ या "x-बार" नमूना के माध्य को संदर्भित करता है। [२] इसकी गणना वैसे ही करें जैसा कि आप किसी माध्य की करेंगे। सभी डेटा-प्वाइंट्स को एक साथ जोड़ें, फिर डेटा-प्वाइंट्स की संख्या से विभाजित करें।
    • उदाहरण: पहले, अपने डेटा-प्वाइंट्स को एक साथ जोड़ें: 17 + 15 + 23 + 7 + 9 + 13 = 84
      फिर, अपने उत्तर को डेटा-प्वाइंट्स की संख्या से विभाजित करें, इस मामले में छ: 84 ÷ 6 = 14।
      नमूना माध्य = x̅ = 14
    • आप माध्य को डेटा के "केंद्र-बिंदु" के रूप में सोच सकते हैं। यदि डेटा, माध्य के इर्द-गिर्द समूहीकृत हो, तो वैरिएन्स लो होता है। यदि यह माध्य से दूर तक फैला है, तो वैरिएन्स अधिक होता है।
  4. How.com.vn हिन्द: Step 4 प्रत्येक डेटा-प्वाइंट से माध्य को घटाएं:
    अब यह समय है - x̅ की गणना करने का जहां, आपके डेटा सेट का प्रत्येक नंबर है। प्रत्येक उत्तर, उस नंबर का माध्य से कितना विचलन (deviation) है या, सरल भाषा में, वह माध्य से कितना दूर है। [३]
    • उदाहरण:
      - x̅ = 17 - 14 = 3
      - x̅ = 15 - 14 = 1
      - x̅ = 23 - 14 = 9
      - x̅ = 7 - 14 = -7
      - x̅ = 9 - 14 = -5
      - x̅ = 13 - 14 = -1
    • अपने काम की जांच करना आसान है, क्योंकि आपके उत्तरों का योग शून्य होना चाहिए। यह माध्य की परिभाषा के कारण है, क्योंकि ऋणात्मक उत्तर (माध्य से छोटी संख्या तक की दूरी) उसी मात्रा में सकारात्मक उत्तरों (माध्य से बड़ी संख्या तक दूरी) को रद्द कर देते हैं।
  5. How.com.vn हिन्द: Step 5 प्रत्येक परिणाम वर्गीकृत करें:
    जैसा कि ऊपर बताया गया है, विचलनों की आपकी वर्तमान सूची ( - x̅) का योग शून्य होता है। इसका मतलब है कि "औसत विचलन" भी हमेशा शून्य ही रहेगा जिससे, डेटा का विस्तार कितना है, इस बारे में यह कुछ भी नहीं बताता है। इस समस्या को हल करने के लिए, प्रत्येक विचलन का वर्ग ज्ञात करें । यह उन सभी को धनात्मक संख्या बना देगा, जिसके कारण ऋणात्मक और धनात्मक मान एक दूसरे को काट कर शून्य नहीं होंगे।[४]
    • उदाहरण:
      ( - x̅)
      - x̅)
      92 = 81
      (-7)2 = 49
      (-5)2 = 25
      (-1)2 = 1
    • अब आपके पास नमूना के प्रत्येक डेटा-प्वाइंट के लिए वैल्यू ( - x̅) है।
  6. How.com.vn हिन्द: Step 6 वर्गीकृत मानों का योग ज्ञात करें:
    अब सूत्र के सम्पूर्ण हर (entire numerator) की गणना करने का समय है: ∑[( - x̅)]। बड़ा सिग्मा ∑, के प्रत्येक मान के लिए, आपको निम्नलिखित टर्म के मानों का योग करने के लिए कहता है। आपने अपने नमूने में के प्रत्येक मान के लिए पहले से ही ( -x̅) सूत्र से गणना की है , इसलिए आपको बस परिणामों का योग करना है।
    • उदाहरण: 9 + 1 + 81 + 49 + 25 + 1 = 166
  7. How.com.vn हिन्द: Step 7 n - 1...
    n - 1 से विभाजित करें, जहां n, डेटा-प्वाइंट्स की संख्या है: बहुत समय पहले, नमूने के वैरिएन्स की गणना करते समय, सांख्यिकीविद, सिर्फ n से विभाजित करते थे। यह आपको वर्गीकृत विचलन का औसत मान देता है, जो उस नमूने के वेरियन्स के लिए एक आदर्श मैच होता है। लेकिन याद रखें कि, एक नमूना सिर्फ एक बड़े डेटा-सेट का अनुमानित अंश होता है। यदि आपने एक और रैंडम नमूना लिया होता और वैसी ही गणना की होती, तो आपको अलग ही परिणाम मिलता। विदित हो कि n के बजाय n -1 से विभाजित करने से आपको सम्पूर्ण डेटा-सेट के वैरिएन्स का बेहतर अनुमान मिलता है, जिसमें आप वास्तव में रुचि रखते हैं। यह सुधार इतना आम है कि अब यह नमूना के वैरिएन्स की स्वीकार्य परिभाषा बन चुकी है।[५]
    • उदाहरण: इस नमूने में छह डेटा-प्वाइंट्स हैं, इसलिए n = 6।
      नमूना का वैरिएन्स = 33.2
  8. How.com.vn हिन्द: Step 8 वैरिएन्स और मानक विचलन को समझे:
    चूंकि सूत्र में एक एक्सपोनेंट (exponent) था इसलिए, ध्यान दें कि ओरिजिनल डेटा के वर्गीकृत इकाई में ही वैरिएन्स मापा जाता है। यह, सहजता से समझना, मुश्किल कर सकता है। इसके बजाए, मानक विचलन का उपयोग करना अक्सर उपयोगी होता है। आपने अपना प्रयास बर्बाद नहीं किया है क्योंकि, मानक विचलन को वैरिएन्स के वर्गमूल (square root) के रूप में परिभाषित किया गया है। इसी कारण से नमूना का वैरिएन्स लिखा जाता है, और नमूना का मानक विचलन होता है।
    • उदाहरण के लिए, उपरोक्त नमूने का मानक विचलन = s = √33.2 = 5.76।
विधि 2
विधि 2 का 2:

पॉपूलेशन के वैरिएन्स की गणना करना

आर्टिकल डाउनलोड करें
  1. How.com.vn हिन्द: Step 1 पॉपूलेशन डेटा-सेट के साथ शुरू करें:
    "पॉपूलेशन" शब्द, प्रासंगिक अवलोकनों के कुल सेट को संदर्भित करता है। उदाहरण के लिए, यदि आप टेक्सास के निवासियों की उम्र का अध्ययन कर रहे हैं, तो आपके पॉपूलेशन में प्रत्येक टेक्सास निवासी की उम्र शामिल होगी। आप आमतौर पर इस तरह के एक बड़े डेटा-सेट के लिए एक स्प्रेडशीट बनाते हैं, परंतु यहां पर एक छोटे डेटा-सेट का उदाहरण दिया गया है:
    • उदाहरण: एक एक्वैरियम के कमरे में कुल छह मछली-टैंक हैं। छः टैंकों में मछलियों की संख्या निम्नलिखित है:





  2. How.com.vn हिन्द: Step 2 पौपुलेशन वैरिएन्स फॉर्मूला लिखें:
    चूंकि पौपुलेशन में आपके द्वारा वांछित सभी डेटा शामिल होते हैं इसलिए, यह सूत्र आपको पौपुलेशन का सटीक वैरिएन्स देता है। इसे नमूना वैरिएन्स से फर्क करने के लिए (जो केवल एक अनुमान है) सांख्यिकीविद, विभिन्न वैरिएबुल्स का उपयोग करते हैं:[६]
    • σ = (∑( - μ))/n
    • σ = पौपुलेशन वैरिएन्स। यह एक वर्गीकृत लोअर-केस सिग्मा है। वैरिएन्स को वर्गीकृत इकाइयों में मापा जाता है।
    • आपके डेटा सेट में एक टर्म को दिखाता है।
    • ∑ के अंदर के टर्म्स की गणना के प्रत्येक मान के लिए की जाएगी, फिर जोड़ी जाएगी।
    • μ का मतलब पौपुलेशन माध्य है
    • n, पौपुलेशन में डेटा प्वाइंट्स की संख्या है
  3. How.com.vn हिन्द: Step 3 पौपुलेशन का माध्य पता करें:
    पौपुलेशन का विश्लेषण करते समय, प्रतीक μ ("म्यू") अंकगणितीय माध्य (arithmetic mean) को दर्शाता है। माध्य प्राप्त करने के लिए, सभी डेटा प्वाइंट्स को एक साथ जोड़ें, फिर डेटा प्वाइंट्स की संख्या से विभाजित करें।
    • आप माध्य को "औसत" के रूप में सोच सकते हैं, लेकिन सावधान रहें क्योंकि, गणित में इस शब्द की कई परिभाषाएं हैं।
    • उदाहरण: माध्य = μ = = 10.5
  4. How.com.vn हिन्द: Step 4 प्रत्येक डेटा प्वाइंट से माध्य घटाएं:
    माध्य के निकट के डेटा प्वाइंट्स का अंतर शून्य के करीब आएगा। प्रत्येक डेटा प्वाइंट के लिए घटाने की प्रक्रिया दोहराएं, जिससे आप समझ जाएँगे कि डेटा कैसे विस्तारित (spread out) है।
    • उदाहरण:
      - μ = 5 - 10.5 = -5.5
      - μ = 5 - 10.5 = -5.5
      - μ = 8 - 10.5 = -2.5
      - μ = 12 - 10.5 = 1.5
      - μ = 15 - 10.5 = 4.5
      - μ = 18 - 10.5 = 7.5
  5. How.com.vn हिन्द: Step 5 प्रत्येक उत्तर को वर्गीकृत करें:
    इस समय, अंतिम चरण से प्राप्त आपकी कुछ संख्याएं ऋणात्मक और कुछ धनात्मक होंगी। यदि आप अपने डेटा को किसी संख्या रेखा (number line) पर चित्रित करते हैं, तो ये दो श्रेणियां माध्य के बाईं ओर दाईं ओर की संख्याएं को दर्शाती हैं। यह वैरिएन्स की गणना के लिए अच्छा नहीं है, क्योंकि ये दो समूह एक-दूसरे को रद्द कर देंगे। प्रत्येक संख्या को स्क्वायर करें ताकि सभी संख्याएं धनात्मक हो जाएँ।
    • उदाहरण:
      ( -μ) i के प्रत्येक मान 1 से 6 तक के लिए:
      (-5.5) = 30.25
      (-5.5) = 30.25
      (-2.5) = 6.25
      (1.5) = 2.25
      (4.5) = 20.25
      (7.5) = 56.25
  6. How.com.vn हिन्द: Step 6 अपने परिणामों का माध्य निकालें:
    अब आपके पास प्रत्येक डेटा प्वाइंट के लिए एक वैल्यू है, जो माध्य से संबंधित (अप्रत्यक्ष रूप से) उस डेटा प्वाइंट की कितनी दूरी है, यह दर्शाती है। इन वैल्यूज़ का माध्य निकालने के लिए सभी को एक साथ जोड़कर, फिर वैल्यूज़ की संख्या से विभाजित करें।
    • उदाहरण:
      पौपुलेशन वैरिएन्स = 24.25
  7. How.com.vn हिन्द: Step 7 फॉर्मूला से इसके मेल को देखें:
    यदि इस विधि की शुरुआत में ही आप निश्चिंत नहीं हैं कि यह सूत्र से कैसे मेल खाता है, तो पूरी समस्या को विस्तार से (longhand) लिखने का प्रयास करें:
    • माध्य से प्राप्त अंतर को वर्गीकृत करने के बाद, आपके पास ये वैल्यू होगी ( - μ), ( - μ), और इसी तरह और भी आगे ( - μ) तक, जहां सेट का अंतिम डेटा प्वाइंट है।
    • इन वैल्यूज़ का माध्य प्राप्त करने के लिए, आप उन्हें जोड़ते हैं और n से विभाजित करते हैं:(( - μ) + ( - μ) + ... + ( - μ) ) / n
    • सिग्मा नोटेशन में न्यूमरेटर को फिर से लिखने के बाद, आपके पास (∑( - μ))/n, होता है, जो वैरिएन्स का सूत्र है।

सलाह

  • चूंकि वैरिएन्स की व्याख्या करना मुश्किल है, इसलिए आमतौर पर इस वैल्यू की गणना, मानक विचलन (standard deviation) की गणना के लिए प्रारंभिक बिंदु के रूप में की जाती है:
  • नमूनों का विश्लेषण करते समय डिनोमिनेटर में "n" के बजाय "n-1" का उपयोग करने की इस तकनीक को बेसेल का संशोधन (Bessel’s correction) कहते हैं। नमूना, सम्पूर्ण पौपुलेशन का मात्र एक अनुमान होता है, और नमूना का माध्य, उस अनुमान में फिट बैठने के लिए पूर्वाग्रहित (biased) होता है। यह संशोधन, इस पूर्वाग्रह को हटा देता है।[७] यह इस तथ्य से संबंधित है कि, एक बार जब आप n -1 डेटा प्वाइंट्स को सूचीबद्ध कर लेते हैं, तो अंतिम nवां बिंदु पहले से ही सीमित हो जाता है, क्योंकि केवल कुछ निश्चित वैल्यूज़ ही, वैरिएन्स सूत्र में उपयोग किए गए, नमूना माध्य (x̅) तक पहुंचेंगे।[८]

विकीहाउ के बारे में

How.com.vn हिन्द: Mario Banuelos, PhD
सहयोगी लेखक द्वारा:
असिस्टेंट प्रोफेसर ऑफ़ मैथमेटिक्स
यह आर्टिकल लिखा गया सहयोगी लेखक द्वारा Mario Banuelos, PhD. मारियो बनुएलोस कैलिफ़ोर्निया स्टेट यूनिवर्सिटी, फ्रेस्नो में मैथमेटिक्स के असिस्टेंट प्रोफेसर हैं | आठ सालों के टीचिंग एक्सपीरियंस के साथ ही मारियो मैथमेटिकल बायोलॉजी, ऑप्टिमाइजेशन, जीनोम एवोल्यूशन के स्टैटिस्टिकल मॉडल्स और डाटा साइंस में भी विशेषज्ञ हैं | मारियो ने कैलिफ़ोर्निया स्टेट यूनिवर्सिटी, फ्रेस्नो से मैथमेटिक्स में BA की डिग्री हासिल की है और कैलिफ़ोर्निया यूनिवर्सिटी, मर्सड से एप्लाइड मैथमेटिक्स में Ph.डी की है | मारियो हाई स्कूल और कॉलेज लेवल पर, दोनों में ही पढ़ाते हैं | यह आर्टिकल २,२९० बार देखा गया है।
श्रेणियाँ: शिक्षा और संचार
सभी लेखकों को यह पृष्ठ बनाने के लिए धन्यवाद दें जो २,२९० बार पढ़ा गया है।

यह लेख ने कैसे आपकी मदद की?