NumPy 1.14 - numpy.cov()

numpy.cov




numpy

numpy.cov

numpy.cov(m, y=None, rowvar=True, bias=False, ddof=None, fweights=None, aweights=None) [source]

डेटा और भार को देखते हुए एक सहसंयोजक मैट्रिक्स का अनुमान लगाएं।

कोवरियनस उस स्तर को इंगित करता है जिस स्तर पर दो चर एक साथ भिन्न होते हैं। यदि हम एन-आयामी नमूनों की जांच करते हैं, X = [x_1, x_2, ... x_N] ^ टी , फिर सहसंयोजक मैट्रिक्स तत्व C_ {} ij का सहसंयोजक है x_i तथा x_j । तत्व C_ {} ii का विचरण है x_i

एल्गोरिथ्म की रूपरेखा के लिए नोट्स देखें।

पैरामीटर:

m : array_like

एक 1-डी या 2-डी सरणी जिसमें कई चर और अवलोकन होते हैं। m की प्रत्येक पंक्ति एक चर का प्रतिनिधित्व करती है, और प्रत्येक स्तंभ उन सभी चर का एक एकल अवलोकन करता है। नीचे rowvar भी देखें।

y : array_like, वैकल्पिक

चर और टिप्पणियों का एक अतिरिक्त सेट। y का रूप m

rowvar : बूल, वैकल्पिक

यदि rowvar ट्रू (डिफ़ॉल्ट) है, तो प्रत्येक पंक्ति कॉलम में टिप्पणियों के साथ एक चर का प्रतिनिधित्व करती है। अन्यथा, रिश्ते को ट्रांसपोज़ किया जाता है: प्रत्येक कॉलम एक चर का प्रतिनिधित्व करता है, जबकि पंक्तियों में अवलोकन होते हैं।

पूर्वाग्रह : बूल, वैकल्पिक

डिफ़ॉल्ट सामान्यीकरण (गलत) द्वारा (N - 1) , जहाँ N दी गई टिप्पणियों की संख्या (निष्पक्ष अनुमान) है। यदि bias सत्य है, तो सामान्यीकरण N द्वारा N । इन मानों को संख्यात्मक संस्करण> = 1.5 में ddof कीवर्ड का उपयोग करके ओवरराइड किया जा सकता है।

ddof : int, वैकल्पिक

यदि कोई None तो bias द्वारा निहित डिफ़ॉल्ट मूल्य ओवरराइड नहीं है। ध्यान दें कि ddof=1 निष्पक्ष अनुमान fweights , भले ही fweights और aweights दोनों निर्दिष्ट हों, और ddof=0 सरल औसत लौटाएगा। विवरण के लिए नोट देखें। डिफ़ॉल्ट मान None

संस्करण 1.5 में नया।

fweights : array_like, int, वैकल्पिक

पूर्णांक फ्रीजेंसी भार का 1-डी सरणी; प्रत्येक अवलोकन वेक्टर को कितनी बार दोहराया जाना चाहिए।

संस्करण 1.10 में नया।

खौफ : array_like, वैकल्पिक

अवलोकन वेक्टर वजन के 1-डी सरणी। ये सापेक्ष भार आम तौर पर "महत्वपूर्ण" मानी जाने वाली टिप्पणियों के लिए बड़े होते हैं और कम "महत्वपूर्ण" मानी जाने वाली टिप्पणियों के लिए छोटे होते हैं। यदि ddof=0 वजन की सरणी का उपयोग अवलोकन वैक्टरों को संभाव्यता प्रदान करने के लिए किया जा सकता है।

संस्करण 1.10 में नया।

यह दिखाता है:

बाहर : ndarray

चर का सहसंयोजक मैट्रिक्स।

यह भी देखें

corrcoef
सामान्यीकृत सहसंयोजक मैट्रिक्स

टिप्पणियाँ

मान लें कि अवलोकन अवलोकन m के कॉलम में हैं और f = fweights और संक्षिप्तता के लिए a = aweights । भारित सहसंयोजक की गणना करने के चरण इस प्रकार हैं:

>>> w = f * a
>>> v1 = np.sum(w)
>>> v2 = np.sum(w * a)
>>> m -= np.sum(m * w, axis=1, keepdims=True) / v1
>>> cov = np.dot(m * w, m.T) * v1 / (v1**2 - ddof * v2)

ध्यान दें कि जब a == 1 , सामान्यीकरण कारक v1 / (v1**2 - ddof * v2) 1 / (np.sum(f) - ddof) पर चला जाता है, जैसा कि यह चाहिए।

उदाहरण

दो चर पर विचार करें, x_0 तथा x_1 , जो पूरी तरह से परस्पर संबंधित है, लेकिन विपरीत दिशाओं में:

>>> x = np.array([[0, 2], [1, 1], [2, 0]]).T
>>> x
array([[0, 1, 2],
       [2, 1, 0]])

ध्यान दें कि कैसे x_0 जबकि बढ़ जाता है x_1 घट जाती है। सहसंयोजक मैट्रिक्स यह स्पष्ट रूप से दिखाता है:

>>> np.cov(x)
array([[ 1., -1.],
       [-1.,  1.]])

उस तत्व को नोट करें C_ {0,1} , जो बीच के संबंध को दर्शाता है x_0 तथा x_1 , नकारात्मक है।

आगे, ध्यान दें कि कैसे x और y संयुक्त हैं:

>>> x = [-2.1, -1,  4.3]
>>> y = [3,  1.1,  0.12]
>>> X = np.stack((x, y), axis=0)
>>> print(np.cov(X))
[[ 11.71        -4.286     ]
 [ -4.286        2.14413333]]
>>> print(np.cov(x, y))
[[ 11.71        -4.286     ]
 [ -4.286        2.14413333]]
>>> print(np.cov(x))
11.71