NumPy 1.14 - numpy.random.standard_t()

numpy.random.standard_t




numpy

numpy.random.standard_t

numpy.random.standard_t(df, size=None)

स्वतंत्रता के df डिग्री के साथ एक मानक छात्र के टी वितरण से नमूने ड्रा।

हाइपरबोलिक वितरण का एक विशेष मामला। जैसे ही df बड़ा होता है, परिणाम सामान्य सामान्य वितरण ( standard_normal ) जैसा दिखता है।

पैरामीटर:

df : फ्लोट्स की फ़्लोट या array_like

स्वतंत्रता की डिग्री, होना चाहिए> 0।

आकार : इंट या टुपल इन्टस, वैकल्पिक

आउटपुट आकार। यदि दी गई आकृति है, जैसे, (m, n, k) , तो m * n * k नमूने खींचे जाते हैं। यदि आकार None (डिफ़ॉल्ट), यदि df एक अदिश राशि है तो एक एकल मान लौटाया जाता है। अन्यथा, np.array(df).size नमूने तैयार किए जाते हैं।

यह दिखाता है:

बाहर : ndarray या स्केलर

पैरामीटर किए गए मानक छात्र के टी वितरण से नमूने खींचे।

टिप्पणियाँ

टी वितरण के लिए संभाव्यता घनत्व फ़ंक्शन है

P (x, df) = \ frac {\ Gamma (\ frac {df + 1} {2})} {\ sqrt {\ pi df} \ Gamma (\ frac {df} {2}) \ Bigl (1) + \ frac {x ^ 2} {df} \ Bigr) ^ {- (df + 1) / 2}

टी परीक्षण एक धारणा पर आधारित है कि डेटा एक सामान्य वितरण से आता है। टी परीक्षण यह जांचने का एक तरीका प्रदान करता है कि क्या नमूना माध्य (डेटा से गणना की गई माध्यिका) सही माध्य का एक अच्छा अनुमान है।

टी-डिस्ट्रीब्यूशन की व्युत्पत्ति पहली बार 1908 में विलियम गोसेट द्वारा डबलिन में गिनीज ब्रेवरी के लिए काम करते हुए प्रकाशित हुई थी। मालिकाना मुद्दों के कारण, उन्हें छद्म नाम से प्रकाशित करना पड़ा, और इसलिए उन्होंने छात्र नाम का उपयोग किया।

संदर्भ

[R535536] ( 1 , 2 ) डेलगार्ड, पीटर, "आर के साथ परिचयात्मक सांख्यिकी", स्प्रिंगर, 2002।
[R536536] विकिपीडिया, "छात्र का वितरण" http://en.wikipedia.org/wiki/Student’s_t-distribution

उदाहरण

दलगार्ड पृष्ठ 83 [R535536] , मान लीजिए कि [R535536] में 11 महिलाओं के लिए दैनिक ऊर्जा की खपत है:

>>> intake = np.array([5260., 5470, 5640, 6180, 6390, 6515, 6805, 7515, \
...                    7515, 8230, 8770])

क्या उनकी ऊर्जा का सेवन 7725 kJ के अनुशंसित मूल्य से व्यवस्थित रूप से होता है?

हमारे पास 10 डिग्री की स्वतंत्रता है, इसलिए अनुशंसित मूल्य के 95% के भीतर नमूना मतलब है?

>>> s = np.random.standard_t(10, size=100000)
>>> np.mean(intake)
6753.636363636364
>>> intake.std(ddof=1)
1142.1232221373727

टी स्टेटिस्टिक की गणना करें, निष्पक्ष मान को ddof पैरामीटर सेट करें ताकि मानक विचलन में भाजक स्वतंत्रता की डिग्री हो, एन -1।

>>> t = (np.mean(intake)-7725)/(intake.std(ddof=1)/np.sqrt(len(intake)))
>>> import matplotlib.pyplot as plt
>>> h = plt.hist(s, bins=100, normed=True)

एक तरफा टी-टेस्ट के लिए, वितरण में कितनी दूर टी सांख्यिकीय दिखाई देती है?

>>> np.sum(s<t) / float(len(s))
0.0090699999999999999  #random

इसलिए पी-वैल्यू लगभग 0.009 है, जो कहता है कि अशक्त परिकल्पना के लगभग 99% सत्य होने की संभावना है।

../../_images/numpy-random-standard_t-1.png