सहसंबंध विश्लेषण का तरीका: एक उदाहरण। सहसंबंध विश्लेषण है ...

गठन

वैज्ञानिक अनुसंधान में,उत्पादक और कारक चर के बीच एक लिंक खोजने की आवश्यकता (संस्कृति की उपज और वर्षा की मात्रा, लिंग और उम्र, पल्स दर और शरीर के तापमान आदि द्वारा समरूप समूहों में एक व्यक्ति की ऊंचाई और वजन)।

दूसरा संकेत है जो उनके साथ जुड़े लोगों के परिवर्तन में योगदान देता है (पहला)।

सहसंबंध विश्लेषण की अवधारणा

इस शब्द की कई परिभाषाएं हैं। पूर्वगामी से आगे बढ़ते हुए, यह कहा जा सकता है कि सहसंबंध विश्लेषण एक विधि है जो दो या दो से अधिक चर के सांख्यिकीय महत्व के बारे में एक परिकल्पना का परीक्षण करने के लिए प्रयोग किया जाता है, यदि शोधकर्ता उन्हें माप सकता है, लेकिन उन्हें नहीं बदल सकता है।

की अन्य परिभाषाएं हैंअवधारणाओं। सहसंबंध विश्लेषण सांख्यिकीय डेटा को संसाधित करने का एक तरीका है, जिसमें चर के बीच सहसंबंध गुणांक का अध्ययन करने में शामिल है। यह सहसंबंध गुणांक की तुलना एक जोड़ी या विशेषताओं के जोड़े के सेट के बीच उनके बीच सांख्यिकीय संबंध स्थापित करने के लिए करता है। सहसंबंध विश्लेषण एक सख्त कार्यात्मक चरित्र की वैकल्पिक उपस्थिति के साथ यादृच्छिक चर के बीच सांख्यिकीय निर्भरता का अध्ययन करने का एक तरीका है, जिसमें एक यादृच्छिक चर की गतिशीलता दूसरे की गणितीय अपेक्षा की गतिशीलता की ओर ले जाती है।

सहसंबंध की झूठीता की अवधारणा

एक सहसंबंध विश्लेषण आयोजित करते समय,ध्यान रखें कि यह विशेषताओं के किसी भी सेट के संबंध में किया जा सकता है, जो अक्सर एक-दूसरे के संबंध में बेतुका होता है। कभी-कभी उनके पास एक दूसरे के साथ कोई कारण नहीं है।

इस मामले में, वे झूठी सहसंबंध की बात करते हैं।

सहसंबंध विश्लेषण की समस्याएं

उपर्युक्त परिभाषाओं के आधार पर, आप कर सकते हैंवर्णित विधि के निम्नलिखित कार्यों को तैयार करने के लिए: किसी अन्य के माध्यम से अज्ञात चर के बारे में जानकारी प्राप्त करने के लिए; अध्ययन किए जा रहे चर के बीच संबंधों की मजबूती का निर्धारण करें।

सहसंबंध विश्लेषण में अध्ययन की जा रही सुविधाओं के बीच संबंध निर्धारित करना शामिल है, और इसलिए सहसंबंध विश्लेषण के कार्यों को निम्नलिखित के साथ पूरक किया जा सकता है:

  • परिणाम पर सबसे बड़ा प्रभाव वाले कारकों की पहचान;
  • लिंक के पहले अस्पष्ट कारणों की पहचान;
  • अपने पैरामीट्रिक विश्लेषण के साथ एक सहसंबंध मॉडल का निर्माण;
  • संचार मानकों और उनके अंतराल अनुमान के महत्व का अध्ययन।

सहसंबंध विश्लेषण और प्रतिगमन के बीच सहसंबंध

सहसंबंध-प्रतिगमन विश्लेषण विधि
सहसंबंध विश्लेषण की विधि अक्सर नहीं होती हैजांच की गई मात्रा के बीच कनेक्शन की मजबूती खोजने के लिए सीमित है। कभी-कभी इसे रिग्रेशन समीकरणों के निर्माण द्वारा पूरक किया जाता है, जो समान नाम विश्लेषण की सहायता से प्राप्त होते हैं, और परिणामी और कारक (फीचर) विशेषताओं के बीच सहसंबंध का वर्णन होते हैं। विचार के तहत विश्लेषण के साथ, यह विधि, सहसंबंध-प्रतिगमन विश्लेषण की विधि है।

उपयोग की शर्तें

प्रभावी कारक एक पर निर्भर करते हैंकई कारक सहसंबंध विश्लेषण की विधि का उपयोग तब किया जा सकता है जब उत्पादक और कारक संकेतकों (कारकों) की परिमाण के बारे में बड़ी संख्या में अवलोकन हो, जबकि अध्ययन किए गए कारक मात्रात्मक और विशिष्ट स्रोतों में प्रतिबिंबित होना चाहिए। पहला सामान्य कानून द्वारा निर्धारित किया जा सकता है - इस मामले में पियरसन सहसंबंध गुणांक सहसंबंध विश्लेषण का परिणाम हैं, या यदि संकेत इस कानून का पालन नहीं करते हैं, तो स्पीरमैन रैंक सहसंबंध गुणांक का उपयोग किया जाता है।

सहसंबंध विश्लेषण है

सहसंबंध विश्लेषण कारकों के चयन के लिए नियम

इस विधि को लागू करते समय, यह आवश्यक हैकारक है कि प्रदर्शन संकेतक को प्रभावित निर्धारित करने के लिए। वे तथ्य यह है कि संकेतक के बीच अनौपचारिक सम्बन्ध पेश करना होगा को ध्यान में रखते चुने गए हैं। एक बहु कारक सहसंबंध मॉडल के मामले में उन जिसके परिणामस्वरूप सूचक पर एक महत्वपूर्ण प्रभाव पड़ता है, अन्योन्याश्रित संबंध को मॉडल में एक से अधिक 0.85 की एक सहसंबंध गुणांक के साथ रखा कारकों के रूप में अच्छी तरह से पसंद किया जाता शामिल नहीं है उन जिसमें प्रभावी पैरामीटर के साथ संचार गैर सीधे है के रूप में चयनित या प्रकृति में कार्यात्मक।

प्रदर्शन परिणाम

सहसंबंध विश्लेषण के परिणाम पाठ और ग्राफिक रूपों में प्रस्तुत किए जा सकते हैं। पहले मामले में, उन्हें एक सहसंबंध गुणांक के रूप में दर्शाया जाता है, दूसरे में - स्कैटर आरेख के रूप में।

सहसंबंध विश्लेषण के परिणाम

यदि बिंदु के पैरामीटर के बीच कोई सहसंबंध नहीं हैआरेख पर अराजकता से स्थित हैं, संचार की औसत डिग्री को ऑर्डरिंग की एक बड़ी डिग्री द्वारा विशेषता है और मध्यस्थ से चिह्नित अंकों की कम या कम समानता की विशेषता है। एक मजबूत लिंक एक सीधी रेखा में जाता है, और आर = 1 के लिए एक बिंदु चार्ट एक भी रेखा है। उलटा सहसंबंध ऊपरी बाएं से निचले दाएं तक की दिशा की दिशा से अलग है, निचले बाएं से ऊपरी दाएं कोने तक सीधी रेखा।

स्कैटर (स्कैटरिंग) आरेख का त्रि-आयामी प्रतिनिधित्व

स्कैटर आरेख के पारंपरिक 2 डी प्रतिनिधित्व के अलावा, सहसंबंध विश्लेषण के आलेखीय प्रतिनिधित्व का एक 3 डी मैपिंग वर्तमान में उपयोग किया जाता है।

सहसंबंध विश्लेषण कारक

स्कैटरिंग आरेख का एक मैट्रिक्स भी प्रयोग किया जाता है,जो सभी युग्मित ग्राफ को मैट्रिक्स प्रारूप में एक आकृति में प्रदर्शित करता है। एन चर के लिए, मैट्रिक्स में एन पंक्तियां और एन कॉलम होते हैं। आई-वें पंक्ति और जे-वें कॉलम के चौराहे पर स्थित चित्र XJ के साथ तुलना में चर Xi का एक ग्राफ है। इस प्रकार, प्रत्येक पंक्ति और स्तंभ एक आयाम है, एक एकल कक्ष दो आयामों का एक स्कैटर आरेख प्रदर्शित करता है।

सहसंबंध विश्लेषण समाधान

संचार की मजबूती का अनुमान

सहसंबंध संबंध की मजबूती से निर्धारित किया जाता हैसहसंबंध गुणांक (आर): मजबूत - आर = ± 0.7 1 ± करने के लिए, औसत - आर = ± 0.3 0.699 ± करने के लिए, कमजोर - आर = 0 ± करने के लिए 0.299। यह वर्गीकरण सख्त नहीं है। आंकड़ा थोड़ा अलग योजना दिखाता है।

सहसंबंध विश्लेषण का तरीका

सहसंबंध विश्लेषण की विधि के आवेदन का एक उदाहरण

ब्रिटेन में, एक उत्सुक अध्ययन शुरू किया गया था। यह फेफड़ों के कैंसर से धूम्रपान के संबंध में समर्पित है, और सहसंबंध विश्लेषण द्वारा किया गया था। यह अवलोकन नीचे प्रस्तुत किया गया है।

सहसंबंध विश्लेषण के लिए प्रारंभिक डेटा

व्यावसायिक समूह

धूम्रपान

मृत्यु दर

किसान, फॉरेस्टर और मछुआरे

77

84

खनिक और खदान मजदूर

137

116

गैस, कोक और रसायनों के निर्माता

117

123

कांच और चीनी मिट्टी के निर्माता

94

128

भट्टियों, फोर्ज, कास्टिंग और रोलिंग मिलों के श्रमिक

116

155

इलेक्ट्रिकल इंजीनियरिंग और इलेक्ट्रॉनिक्स के श्रमिक

102

101

इंजीनियरिंग और संबंधित व्यवसाय

111

118

लकड़ी का उत्पादन

93

113

चमड़े के सामान

88

104

कपड़ा श्रमिक

102

88

काम के कपड़े के निर्माता

91

104

भोजन, पेय और तंबाकू श्रमिक

104

129

कागज और मुद्रण के निर्माता

107

86

अन्य उत्पादों के निर्माता

112

96

बिल्डरों

113

144

कलाकार और सजावटी

110

139

स्थिर इंजन, क्रेन, आदि के ड्राइवर्स

125

113

श्रमिकों को कहीं और शामिल नहीं किया गया

133

146

परिवहन और संचार श्रमिक

115

128

वेयरहाउस श्रमिक, दुकानदार, पैकर और मशीन भरने के श्रमिक

105

115

कार्यालय कार्यकर्ता

87

79

विक्रेताओं

91

85

खेल और मनोरंजन सेवा के कर्मचारी

100

120

प्रशासक और प्रबंधकों

76

60

पेशेवर, तकनीशियन और कलाकार

66

51

हम सहसंबंध विश्लेषण शुरू करते हैं। समाधान ग्राफिकल विधि के साथ स्पष्टता के लिए शुरू करना बेहतर है, जिसके लिए हम एक स्कैटर आरेख (फैल) बनाते हैं।

सहसंबंध विश्लेषण उदाहरण

यह एक सीधा कनेक्शन दिखाता है। हालांकि, केवल ग्राफिक विधि के आधार पर, एक स्पष्ट निष्कर्ष निकालना मुश्किल है। इसलिए, हम सहसंबंध विश्लेषण करना जारी रखते हैं। सहसंबंध गुणांक की गणना करने का एक उदाहरण नीचे प्रस्तुत किया गया है।

सॉफ्टवेयर का उपयोग (उदाहरण के लिए, एमएसएक्सेल में वर्णित किया जा जाएगा बाद में) एक सहसंबंध गुणांक, 0.716 की है जो है, जो अध्ययन किया मानकों के बीच एक मजबूत बंधन का मतलब निर्धारण करते हैं। इसी तालिका के प्राप्त मूल्यों के संख्यात्मक मान्यता को परिभाषित करें, तो हम मान के दो जोड़े से 25 घटाना है, जिससे 23 प्राप्त की जरूरत है और तालिका में इस पंक्ति महत्वपूर्ण आर पी = 0,01 खोजने के लिए (के रूप में इस चिकित्सा डेटा और अधिक कठोर उपयोग किया जाता है निर्भरता, अन्य मामलों में यह पर्याप्त पी = 0,05) है, जो सहसंबंध विश्लेषण के लिए 0.51 है। उदाहरण दिखा दिया है कि लंबे समय तक गणना की आर आर महत्वपूर्ण सहसंबंध गुणांक का मान सांख्यिकीय रूप से महत्वपूर्ण माना जाता है।

एक सहसंबंध विश्लेषण आयोजित करने में सॉफ्टवेयर का उपयोग

सांख्यिकीय डेटा प्रोसेसिंग का वर्णित प्रकारविशेष रूप से, एमएस एक्सेल, सॉफ़्टवेयर का उपयोग करके कार्यान्वित किया जा सकता है। एक्सेल में सहसंबंध विश्लेषण में फ़ंक्शंस का उपयोग करके निम्नलिखित पैरामीटर की गणना शामिल है:

1. सहसंबंध गुणांक को कोरल फ़ंक्शन (array1, array2) का उपयोग करके निर्धारित किया जाता है। Array1,2 उत्पादक और कारक चर के मूल्यों की एक श्रृंखला का एक सेल है।

रैखिक सहसंबंध गुणांक भी पियर्सन की सहसंबंध गुणांक कहा जाता है, और इसलिए, के बाद से Excel 2007 में एक ही सरणी के साथ PEARSON समारोह (PEARSON) का उपयोग कर सकते हैं।

Excel में सहसंबंध विश्लेषण का आलेखीय प्रतिनिधित्व "स्पॉट चार्ट" चयन के साथ "आरेख" पैनल का उपयोग करके किया जाता है।

प्रारंभिक डेटा इंगित करने के बाद, हम एक ग्राफ प्राप्त करते हैं।

2. छात्र के टी-टेस्ट का उपयोग कर जोड़ी सहसंबंध गुणांक के महत्व का मूल्यांकन। टी-टेस्ट का गणना मूल्य टैब्यूलर (महत्वपूर्ण) मान के साथ तुलना की जाती हैइस संकेतक के मानदंड पैरामीटर के मूल्यों की इसी तालिका से महत्व के एक स्तर को ध्यान में रखते हुए और आजादी की डिग्री की संख्या को ध्यान में रखते हुए। यह मूल्यांकन कार्य टायर (संभावना, डिग्री_फ्रीडम) का उपयोग करके किया जाता है।

3. जोड़ी सहसंबंध के गुणांक के मैट्रिक्स। विश्लेषण "डेटा विश्लेषण" का अर्थ है, जिसमें चयनित का उपयोग किया जाता है "सहसंबंध।" सहसंबंध गुणांक की जोड़ी के सांख्यिकीय मूल्यांकन एक मेज (महत्वपूर्ण) मूल्य के साथ अपने निरपेक्ष मूल्य की तुलना द्वारा किया जाता है। जब जैसे भाप से अधिक सहसंबंध की गणना गुणांक से अधिक कहने के लिए महत्वपूर्ण हो सकता है, संभावना की पूर्व निर्धारित डिग्री कि रैखिक युग्मन महत्व के रिक्त परिकल्पना को अस्वीकार कर दिया नहीं है के संबंध में।

अंत में

वैज्ञानिक अनुसंधान विधि में प्रयोग करेंसहसंबंध विश्लेषण आपको विभिन्न कारकों और प्रदर्शन संकेतकों के बीच संबंध निर्धारित करने की अनुमति देता है। इस मामले में, यह ध्यान रखना आवश्यक है कि एक उच्च सहसंबंध गुणांक एक बेतुका जोड़ी या डेटा के एक सेट से प्राप्त किया जा सकता है, और इस प्रकार का विश्लेषण पर्याप्त बड़े डेटा सेट पर किया जाना चाहिए।

आर के गणना मूल्य प्राप्त करने के बाद, यहआर एक विशेष मूल्य के सांख्यिकीय महत्व की पुष्टि करने के लिए महत्वपूर्ण के साथ तुलना करने के लिए वांछनीय। सहसंबंध विश्लेषण मैन्युअल रूप से किया जा सकता है, सूत्रों का उपयोग, या सॉफ्टवेयर के द्वारा, विशेष रूप से एमएस एक्सेल में। यहाँ यह बिखराव आरेख (फैलाव) के निर्माण के लिए अध्ययन किया कारकों सहसंबंध विश्लेषण और स्कोरिंग सुविधा के बीच संबंधों को कल्पना करने के लिए संभव है।