pandas 0.23 - api.extensions.ExtensionArray[source]

pandas.api.extensions.ExtensionArray




pandas

pandas.api.extensions.ExtensionArray

class pandas.api.extensions.ExtensionArray [source]

कस्टम 1-डी सरणी प्रकारों के लिए सार बेस क्लास।

पांडा इस वर्ग के उदाहरणों को एक कस्टम प्रकार के साथ उचित सरणियों के रूप में पहचानेंगे और उन्हें वस्तुओं के साथ जबरदस्ती करने का प्रयास नहीं करेंगे। वे सीधे एक DataFrame या Series अंदर संग्रहीत किए जा सकते हैं।

संस्करण में नया 0.23.0।

टिप्पणियाँ

इंटरफ़ेस में निम्नलिखित सार विधियाँ शामिल हैं जिन्हें उपवर्गों द्वारा कार्यान्वित किया जाना चाहिए:

  • _from_sequence
  • _from_factorized
  • __वस्तु ले आओ__
  • __len__
  • dtype
  • nbytes
  • ISNA
  • लेना
  • प्रतिलिपि
  • _concat_same_type

पांडा की आंतरिक, निजी ब्लॉक एपीआई को संतुष्ट करने के लिए एक अतिरिक्त तरीका उपलब्ध है।

  • _formatting_values

कुछ तरीकों को self.astype(object) साथ Python ऑब्जेक्ट्स के self.astype(object) को ExtensionArray की कास्टिंग की आवश्यकता होती है, जो महंगा हो सकता है। जब प्रदर्शन एक चिंता का विषय है, तो हम निम्नलिखित तरीकों को ओवरराइड करने की सलाह देते हैं:

  • fillna
  • अद्वितीय
  • फैक्टराइज़ / _values_for_factorize
  • argsort / _values_for_argsort

यह वर्ग प्रदर्शन कारणों से 'abc.ABCMeta' से विरासत में नहीं मिला है। इंटरफ़ेस द्वारा आवश्यक तरीके और गुण pandas.errors.AbstractMethodError और वर्चुअल उपवर्गों के पंजीकरण के लिए कोई register विधि प्रदान नहीं की जाती है।

ExtensionArrays 1 आयाम तक सीमित हैं।

वे कोई भी, एक या कई NumPy सरणियों द्वारा समर्थित हो सकते हैं। उदाहरण के लिए, pandas.Categorical दो एरे द्वारा समर्थित एक्सटेंशन सरणी है, एक कोड के लिए और एक श्रेणियों के लिए। IPv6 पते की एक सरणी दो क्षेत्रों के साथ एक NumPy संरचित सरणी द्वारा समर्थित हो सकती है, एक निचले 64 बिट्स के लिए और एक ऊपरी 64 बिट्स के लिए। या वे कुछ अन्य भंडारण प्रकारों द्वारा समर्थित हो सकते हैं, जैसे पायथन सूची। पंडों ने इस बात पर कोई धारणा नहीं बनाई कि डेटा कैसे संग्रहीत किया जाता है, बस इसे एक NumPy सरणी में परिवर्तित किया जा सकता है। ExtensionArray इंटरफ़ेस इस डेटा को कैसे संग्रहीत किया जाता है, इस पर कोई नियम लागू नहीं करता है। हालाँकि, वर्तमान में, बैकिंग डेटा को .values या ._values नामक विशेषताओं में संग्रहीत नहीं किया जा सकता है ताकि पांडा ._values के साथ पूर्ण संगतता सुनिश्चित हो सके। लेकिन अन्य नामों के रूप में ._data , ._items , ._items ,… का स्वतंत्र रूप से उपयोग किया जा सकता है।

गुण

dtype 'ExtensionDtype' का एक उदाहरण।
nbytes इस ऑब्जेक्ट को मेमोरी में स्टोर करने के लिए बाइट्स की संख्या की आवश्यकता होती है।
ndim एक्सटेंशन एरर्स को केवल 1-आयामी होने की अनुमति है।
shape सरणी आयामों का एक टपल लौटें।

तरीके

argsort ([आरोही, तरह]) इस सरणी को सॉर्ट करने वाले सूचकांकों को वापस करें।
astype (dtype [, copy]) 'Dtype' के साथ एक NumPy सरणी के लिए कास्ट करें।
copy ([गहरा]) सरणी की एक प्रति लौटाएं।
factorize ([na_sentinel]) विस्तार सरणी को एन्यूमरेटेड प्रकार के रूप में एन्कोड करें।
fillna ([मूल्य, विधि, सीमा]) निर्दिष्ट विधि का उपयोग करके NA / NaN मान भरें।
isna () बूलियन NumPy सरणी इंगित करता है यदि प्रत्येक मान अनुपलब्ध है।
take (सूचकांक [, allow_fill, fill_value]) किसी ऐरे से तत्व लें।
unique () अद्वितीय मानों के ExtensionArray की गणना करें।