सहसंबंध विश्लेषण का तरीका: एक उदाहरण। सहसंबंध विश्लेषण है ...
वैज्ञानिक अनुसंधान में,उत्पादक और कारक चर के बीच एक लिंक खोजने की आवश्यकता (संस्कृति की उपज और वर्षा की मात्रा, लिंग और उम्र, पल्स दर और शरीर के तापमान आदि द्वारा समरूप समूहों में एक व्यक्ति की ऊंचाई और वजन)।
दूसरा संकेत है जो उनके साथ जुड़े लोगों के परिवर्तन में योगदान देता है (पहला)।
सहसंबंध विश्लेषण की अवधारणा
इस शब्द की कई परिभाषाएं हैं। पूर्वगामी से आगे बढ़ते हुए, यह कहा जा सकता है कि सहसंबंध विश्लेषण एक विधि है जो दो या दो से अधिक चर के सांख्यिकीय महत्व के बारे में एक परिकल्पना का परीक्षण करने के लिए प्रयोग किया जाता है, यदि शोधकर्ता उन्हें माप सकता है, लेकिन उन्हें नहीं बदल सकता है।
की अन्य परिभाषाएं हैंअवधारणाओं। सहसंबंध विश्लेषण सांख्यिकीय डेटा को संसाधित करने का एक तरीका है, जिसमें चर के बीच सहसंबंध गुणांक का अध्ययन करने में शामिल है। यह सहसंबंध गुणांक की तुलना एक जोड़ी या विशेषताओं के जोड़े के सेट के बीच उनके बीच सांख्यिकीय संबंध स्थापित करने के लिए करता है। सहसंबंध विश्लेषण एक सख्त कार्यात्मक चरित्र की वैकल्पिक उपस्थिति के साथ यादृच्छिक चर के बीच सांख्यिकीय निर्भरता का अध्ययन करने का एक तरीका है, जिसमें एक यादृच्छिक चर की गतिशीलता दूसरे की गणितीय अपेक्षा की गतिशीलता की ओर ले जाती है।
सहसंबंध की झूठीता की अवधारणा
एक सहसंबंध विश्लेषण आयोजित करते समय,ध्यान रखें कि यह विशेषताओं के किसी भी सेट के संबंध में किया जा सकता है, जो अक्सर एक-दूसरे के संबंध में बेतुका होता है। कभी-कभी उनके पास एक दूसरे के साथ कोई कारण नहीं है।
इस मामले में, वे झूठी सहसंबंध की बात करते हैं।
सहसंबंध विश्लेषण की समस्याएं
उपर्युक्त परिभाषाओं के आधार पर, आप कर सकते हैंवर्णित विधि के निम्नलिखित कार्यों को तैयार करने के लिए: किसी अन्य के माध्यम से अज्ञात चर के बारे में जानकारी प्राप्त करने के लिए; अध्ययन किए जा रहे चर के बीच संबंधों की मजबूती का निर्धारण करें।
सहसंबंध विश्लेषण में अध्ययन की जा रही सुविधाओं के बीच संबंध निर्धारित करना शामिल है, और इसलिए सहसंबंध विश्लेषण के कार्यों को निम्नलिखित के साथ पूरक किया जा सकता है:
- परिणाम पर सबसे बड़ा प्रभाव वाले कारकों की पहचान;
- लिंक के पहले अस्पष्ट कारणों की पहचान;
- अपने पैरामीट्रिक विश्लेषण के साथ एक सहसंबंध मॉडल का निर्माण;
- संचार मानकों और उनके अंतराल अनुमान के महत्व का अध्ययन।
सहसंबंध विश्लेषण और प्रतिगमन के बीच सहसंबंध
उपयोग की शर्तें
प्रभावी कारक एक पर निर्भर करते हैंकई कारक सहसंबंध विश्लेषण की विधि का उपयोग तब किया जा सकता है जब उत्पादक और कारक संकेतकों (कारकों) की परिमाण के बारे में बड़ी संख्या में अवलोकन हो, जबकि अध्ययन किए गए कारक मात्रात्मक और विशिष्ट स्रोतों में प्रतिबिंबित होना चाहिए। पहला सामान्य कानून द्वारा निर्धारित किया जा सकता है - इस मामले में पियरसन सहसंबंध गुणांक सहसंबंध विश्लेषण का परिणाम हैं, या यदि संकेत इस कानून का पालन नहीं करते हैं, तो स्पीरमैन रैंक सहसंबंध गुणांक का उपयोग किया जाता है।
सहसंबंध विश्लेषण कारकों के चयन के लिए नियम
इस विधि को लागू करते समय, यह आवश्यक हैकारक है कि प्रदर्शन संकेतक को प्रभावित निर्धारित करने के लिए। वे तथ्य यह है कि संकेतक के बीच अनौपचारिक सम्बन्ध पेश करना होगा को ध्यान में रखते चुने गए हैं। एक बहु कारक सहसंबंध मॉडल के मामले में उन जिसके परिणामस्वरूप सूचक पर एक महत्वपूर्ण प्रभाव पड़ता है, अन्योन्याश्रित संबंध को मॉडल में एक से अधिक 0.85 की एक सहसंबंध गुणांक के साथ रखा कारकों के रूप में अच्छी तरह से पसंद किया जाता शामिल नहीं है उन जिसमें प्रभावी पैरामीटर के साथ संचार गैर सीधे है के रूप में चयनित या प्रकृति में कार्यात्मक।
प्रदर्शन परिणाम
सहसंबंध विश्लेषण के परिणाम पाठ और ग्राफिक रूपों में प्रस्तुत किए जा सकते हैं। पहले मामले में, उन्हें एक सहसंबंध गुणांक के रूप में दर्शाया जाता है, दूसरे में - स्कैटर आरेख के रूप में।
यदि बिंदु के पैरामीटर के बीच कोई सहसंबंध नहीं हैआरेख पर अराजकता से स्थित हैं, संचार की औसत डिग्री को ऑर्डरिंग की एक बड़ी डिग्री द्वारा विशेषता है और मध्यस्थ से चिह्नित अंकों की कम या कम समानता की विशेषता है। एक मजबूत लिंक एक सीधी रेखा में जाता है, और आर = 1 के लिए एक बिंदु चार्ट एक भी रेखा है। उलटा सहसंबंध ऊपरी बाएं से निचले दाएं तक की दिशा की दिशा से अलग है, निचले बाएं से ऊपरी दाएं कोने तक सीधी रेखा।
स्कैटर (स्कैटरिंग) आरेख का त्रि-आयामी प्रतिनिधित्व
स्कैटर आरेख के पारंपरिक 2 डी प्रतिनिधित्व के अलावा, सहसंबंध विश्लेषण के आलेखीय प्रतिनिधित्व का एक 3 डी मैपिंग वर्तमान में उपयोग किया जाता है।
स्कैटरिंग आरेख का एक मैट्रिक्स भी प्रयोग किया जाता है,जो सभी युग्मित ग्राफ को मैट्रिक्स प्रारूप में एक आकृति में प्रदर्शित करता है। एन चर के लिए, मैट्रिक्स में एन पंक्तियां और एन कॉलम होते हैं। आई-वें पंक्ति और जे-वें कॉलम के चौराहे पर स्थित चित्र XJ के साथ तुलना में चर Xi का एक ग्राफ है। इस प्रकार, प्रत्येक पंक्ति और स्तंभ एक आयाम है, एक एकल कक्ष दो आयामों का एक स्कैटर आरेख प्रदर्शित करता है।
संचार की मजबूती का अनुमान
सहसंबंध संबंध की मजबूती से निर्धारित किया जाता हैसहसंबंध गुणांक (आर): मजबूत - आर = ± 0.7 1 ± करने के लिए, औसत - आर = ± 0.3 0.699 ± करने के लिए, कमजोर - आर = 0 ± करने के लिए 0.299। यह वर्गीकरण सख्त नहीं है। आंकड़ा थोड़ा अलग योजना दिखाता है।
सहसंबंध विश्लेषण की विधि के आवेदन का एक उदाहरण
ब्रिटेन में, एक उत्सुक अध्ययन शुरू किया गया था। यह फेफड़ों के कैंसर से धूम्रपान के संबंध में समर्पित है, और सहसंबंध विश्लेषण द्वारा किया गया था। यह अवलोकन नीचे प्रस्तुत किया गया है।
व्यावसायिक समूह | धूम्रपान | मृत्यु दर |
किसान, फॉरेस्टर और मछुआरे | 77 | 84 |
खनिक और खदान मजदूर | 137 | 116 |
गैस, कोक और रसायनों के निर्माता | 117 | 123 |
कांच और चीनी मिट्टी के निर्माता | 94 | 128 |
भट्टियों, फोर्ज, कास्टिंग और रोलिंग मिलों के श्रमिक | 116 | 155 |
इलेक्ट्रिकल इंजीनियरिंग और इलेक्ट्रॉनिक्स के श्रमिक | 102 | 101 |
इंजीनियरिंग और संबंधित व्यवसाय | 111 | 118 |
लकड़ी का उत्पादन | 93 | 113 |
चमड़े के सामान | 88 | 104 |
कपड़ा श्रमिक | 102 | 88 |
काम के कपड़े के निर्माता | 91 | 104 |
भोजन, पेय और तंबाकू श्रमिक | 104 | 129 |
कागज और मुद्रण के निर्माता | 107 | 86 |
अन्य उत्पादों के निर्माता | 112 | 96 |
बिल्डरों | 113 | 144 |
कलाकार और सजावटी | 110 | 139 |
स्थिर इंजन, क्रेन, आदि के ड्राइवर्स | 125 | 113 |
श्रमिकों को कहीं और शामिल नहीं किया गया | 133 | 146 |
परिवहन और संचार श्रमिक | 115 | 128 |
वेयरहाउस श्रमिक, दुकानदार, पैकर और मशीन भरने के श्रमिक | 105 | 115 |
कार्यालय कार्यकर्ता | 87 | 79 |
विक्रेताओं | 91 | 85 |
खेल और मनोरंजन सेवा के कर्मचारी | 100 | 120 |
प्रशासक और प्रबंधकों | 76 | 60 |
पेशेवर, तकनीशियन और कलाकार | 66 | 51 |
हम सहसंबंध विश्लेषण शुरू करते हैं। समाधान ग्राफिकल विधि के साथ स्पष्टता के लिए शुरू करना बेहतर है, जिसके लिए हम एक स्कैटर आरेख (फैल) बनाते हैं।
यह एक सीधा कनेक्शन दिखाता है। हालांकि, केवल ग्राफिक विधि के आधार पर, एक स्पष्ट निष्कर्ष निकालना मुश्किल है। इसलिए, हम सहसंबंध विश्लेषण करना जारी रखते हैं। सहसंबंध गुणांक की गणना करने का एक उदाहरण नीचे प्रस्तुत किया गया है।
सॉफ्टवेयर का उपयोग (उदाहरण के लिए, एमएसएक्सेल में वर्णित किया जा जाएगा बाद में) एक सहसंबंध गुणांक, 0.716 की है जो है, जो अध्ययन किया मानकों के बीच एक मजबूत बंधन का मतलब निर्धारण करते हैं। इसी तालिका के प्राप्त मूल्यों के संख्यात्मक मान्यता को परिभाषित करें, तो हम मान के दो जोड़े से 25 घटाना है, जिससे 23 प्राप्त की जरूरत है और तालिका में इस पंक्ति महत्वपूर्ण आर पी = 0,01 खोजने के लिए (के रूप में इस चिकित्सा डेटा और अधिक कठोर उपयोग किया जाता है निर्भरता, अन्य मामलों में यह पर्याप्त पी = 0,05) है, जो सहसंबंध विश्लेषण के लिए 0.51 है। उदाहरण दिखा दिया है कि लंबे समय तक गणना की आर आर महत्वपूर्ण सहसंबंध गुणांक का मान सांख्यिकीय रूप से महत्वपूर्ण माना जाता है।
एक सहसंबंध विश्लेषण आयोजित करने में सॉफ्टवेयर का उपयोग
सांख्यिकीय डेटा प्रोसेसिंग का वर्णित प्रकारविशेष रूप से, एमएस एक्सेल, सॉफ़्टवेयर का उपयोग करके कार्यान्वित किया जा सकता है। एक्सेल में सहसंबंध विश्लेषण में फ़ंक्शंस का उपयोग करके निम्नलिखित पैरामीटर की गणना शामिल है:
1. सहसंबंध गुणांक को कोरल फ़ंक्शन (array1, array2) का उपयोग करके निर्धारित किया जाता है। Array1,2 उत्पादक और कारक चर के मूल्यों की एक श्रृंखला का एक सेल है।
रैखिक सहसंबंध गुणांक भी पियर्सन की सहसंबंध गुणांक कहा जाता है, और इसलिए, के बाद से Excel 2007 में एक ही सरणी के साथ PEARSON समारोह (PEARSON) का उपयोग कर सकते हैं।
Excel में सहसंबंध विश्लेषण का आलेखीय प्रतिनिधित्व "स्पॉट चार्ट" चयन के साथ "आरेख" पैनल का उपयोग करके किया जाता है।
प्रारंभिक डेटा इंगित करने के बाद, हम एक ग्राफ प्राप्त करते हैं।
2. छात्र के टी-टेस्ट का उपयोग कर जोड़ी सहसंबंध गुणांक के महत्व का मूल्यांकन। टी-टेस्ट का गणना मूल्य टैब्यूलर (महत्वपूर्ण) मान के साथ तुलना की जाती हैइस संकेतक के मानदंड पैरामीटर के मूल्यों की इसी तालिका से महत्व के एक स्तर को ध्यान में रखते हुए और आजादी की डिग्री की संख्या को ध्यान में रखते हुए। यह मूल्यांकन कार्य टायर (संभावना, डिग्री_फ्रीडम) का उपयोग करके किया जाता है।
3. जोड़ी सहसंबंध के गुणांक के मैट्रिक्स। विश्लेषण "डेटा विश्लेषण" का अर्थ है, जिसमें चयनित का उपयोग किया जाता है "सहसंबंध।" सहसंबंध गुणांक की जोड़ी के सांख्यिकीय मूल्यांकन एक मेज (महत्वपूर्ण) मूल्य के साथ अपने निरपेक्ष मूल्य की तुलना द्वारा किया जाता है। जब जैसे भाप से अधिक सहसंबंध की गणना गुणांक से अधिक कहने के लिए महत्वपूर्ण हो सकता है, संभावना की पूर्व निर्धारित डिग्री कि रैखिक युग्मन महत्व के रिक्त परिकल्पना को अस्वीकार कर दिया नहीं है के संबंध में।
अंत में
वैज्ञानिक अनुसंधान विधि में प्रयोग करेंसहसंबंध विश्लेषण आपको विभिन्न कारकों और प्रदर्शन संकेतकों के बीच संबंध निर्धारित करने की अनुमति देता है। इस मामले में, यह ध्यान रखना आवश्यक है कि एक उच्च सहसंबंध गुणांक एक बेतुका जोड़ी या डेटा के एक सेट से प्राप्त किया जा सकता है, और इस प्रकार का विश्लेषण पर्याप्त बड़े डेटा सेट पर किया जाना चाहिए।
आर के गणना मूल्य प्राप्त करने के बाद, यहआर एक विशेष मूल्य के सांख्यिकीय महत्व की पुष्टि करने के लिए महत्वपूर्ण के साथ तुलना करने के लिए वांछनीय। सहसंबंध विश्लेषण मैन्युअल रूप से किया जा सकता है, सूत्रों का उपयोग, या सॉफ्टवेयर के द्वारा, विशेष रूप से एमएस एक्सेल में। यहाँ यह बिखराव आरेख (फैलाव) के निर्माण के लिए अध्ययन किया कारकों सहसंबंध विश्लेषण और स्कोरिंग सुविधा के बीच संबंधों को कल्पना करने के लिए संभव है।