पायथन में अनुमानित आँकड़ों के लिए कोड से जुड़ी मुख्य समस्या यह है कि परिणामों को समझना और व्याख्या करना मुश्किल हो सकता है। पायथन एक शक्तिशाली भाषा है, लेकिन अनुमानित आँकड़ों के लिए उपयोग किए जाने वाले कोड को पढ़ना और समझना मुश्किल हो सकता है। इसके अतिरिक्त, पायथन में आनुमानिक आँकड़ों के लिए कई अलग-अलग पैकेज उपलब्ध हैं, जो किसी विशेष विश्लेषण के लिए सही का चयन करना कठिन बना सकते हैं। अंत में, इनमें से कुछ पैकेज दूसरों की तरह अप-टू-डेट या विश्वसनीय नहीं हो सकते हैं, इसलिए उनका उपयोग करने से पहले शोध करना महत्वपूर्ण है।
1. Chi-Square Test of Independence: from scipy.stats import chi2_contingency chi2, p, dof, expected = chi2_contingency(observed) 2. One-Way ANOVA: from scipy import stats F, p = stats.f_oneway(sample1, sample2, sample3) 3. Pearson’s Correlation Coefficient: from scipy.stats import pearsonr corr, _ = pearsonr(x, y)
पंक्ति 1: यह पंक्ति scipy.stats लाइब्रेरी से chi2_contingency फ़ंक्शन को आयात करती है, और फिर इसका उपयोग देखे गए डेटा पर स्वतंत्रता के ची-स्क्वायर परीक्षण की गणना करने के लिए करती है। इस परीक्षण के परिणाम चर chi2, p, dof और अपेक्षित में संग्रहीत हैं।
लाइन 2: यह लाइन scipy लाइब्रेरी से f_oneway फ़ंक्शन को आयात करती है, और फिर इसका उपयोग तीन नमूनों (नमूना1, नमूना2, नमूना3) पर एक तरफ़ा एनोवा की गणना करने के लिए करती है। इस परीक्षण के परिणाम चर F और p में संग्रहीत हैं।
लाइन 3: यह लाइन scipy.stats लाइब्रेरी से पीयरसन फ़ंक्शन को आयात करती है, और फिर इसका उपयोग दो चर (x और y) के बीच पियर्सन के सहसंबंध गुणांक की गणना करने के लिए करती है। इस परीक्षण के परिणाम चर corr और _ में संग्रहीत हैं।
अनुमान सांख्यिकी क्या है
आनुमानिक आँकड़े आँकड़ों की एक शाखा है जो किसी जनसंख्या के बारे में निष्कर्ष या सामान्यीकरण करने के लिए नमूने से डेटा का उपयोग करता है। इसमें एक नमूने से एकत्र किए गए आंकड़ों के आधार पर जनसंख्या के बारे में निष्कर्ष निकालना शामिल है। पायथन में, परिकल्पना परीक्षण, सहसंबंध विश्लेषण, प्रतिगमन विश्लेषण, और अधिक जैसी विभिन्न तकनीकों का उपयोग करके निष्कर्ष निकालने और भविष्यवाणियां करने के लिए अनुमानित आंकड़ों का उपयोग किया जा सकता है। ये तकनीकें हमें अपने डेटा से सार्थक अंतर्दृष्टि प्राप्त करने और बेहतर निर्णय लेने में मदद करती हैं।
अनुमानित सांख्यिकी के प्रकार
पायथन में, कई प्रकार के अनुमानात्मक आँकड़े हैं जिनका उपयोग डेटा का विश्लेषण करने के लिए किया जा सकता है। इनमें टी-टेस्ट, एनोवा, ची-स्क्वायर टेस्ट, सहसंबंध परीक्षण और रिग्रेशन विश्लेषण शामिल हैं। डेटा के दो या दो से अधिक समूहों के साधनों की तुलना करने के लिए टी-टेस्ट का उपयोग किया जाता है। एनोवा का उपयोग डेटा के कई समूहों के साधनों की तुलना करने के लिए किया जाता है। ची-स्क्वायर परीक्षणों का उपयोग श्रेणीबद्ध चर के बीच संबंधों के परीक्षण के लिए किया जाता है। सहसंबंध परीक्षण दो चरों के बीच एक रैखिक संबंध की शक्ति और दिशा को मापते हैं। अंत में, प्रतिगमन विश्लेषण का उपयोग एक या अधिक स्वतंत्र चर से आश्रित चर की भविष्यवाणी करने के लिए किया जाता है।
आप अनुमानित आँकड़े कैसे लिखते हैं
आनुमानिक आँकड़े आँकड़ों की एक शाखा है जो एक नमूने से डेटा का उपयोग उस आबादी के बारे में अनुमान लगाने के लिए करता है जिससे नमूना लिया गया था। पायथन में, विभिन्न पुस्तकालयों जैसे SciPy, StatsModels, और NumPy का उपयोग करके अनुमानित आँकड़े प्रदर्शित किए जा सकते हैं।
पायथन में अनुमानित आंकड़े करने के लिए, आपको पहले आवश्यक पुस्तकालयों को आयात करने की आवश्यकता होगी और फिर माध्य (), माध्यिका (), मोड (), भिन्नता (), मानक विचलन (), टी-टेस्ट (), ची जैसे कार्यों का उपयोग करना होगा। -स्क्वायर टेस्ट () आदि। उदाहरण के लिए, यदि आप किसी दिए गए डेटासेट के माध्य की गणना करना चाहते हैं, तो आप NumPy से माध्य () फ़ंक्शन का उपयोग कर सकते हैं:
आयात एनपीपी के रूप में सुन्न
डेटा = [1,2,3,4]
माध्य_मूल्य = np.माध्य (डेटा)
प्रिंट (mean_value) # आउटपुट: 2.5