pandas 0.23 - DataFrame.memory_usage()

pandas.DataFrame.memory_usage




pandas

pandas.DataFrame.memory_usage

DataFrame.memory_usage(index=True, deep=False) [source]

बाइट्स में प्रत्येक कॉलम का मेमोरी उपयोग लौटाएं।

मेमोरी उपयोग वैकल्पिक रूप से object dtype के सूचकांक और तत्वों के योगदान को शामिल कर सकता है।

यह मान डिफ़ॉल्ट रूप से DataFrame.info में प्रदर्शित होता है। यह pandas.options.display.memory_usage को गलत पर सेट करके दबाया जा सकता है।

पैरामीटर:

सूचकांक : बूल, डिफ़ॉल्ट सही

निर्दिष्ट करता है कि क्या दिए गए श्रृंखला में डेटाफ्रेम के सूचकांक के मेमोरी उपयोग को शामिल करना है। यदि index=True का मेमोरी उपयोग index=True है तो आउटपुट में पहला आइटम।

गहरी : बूल, डिफ़ॉल्ट गलत

यदि यह सही है, तो सिस्टम-स्तरीय मेमोरी खपत के लिए object dtypes से पूछताछ करके डेटा को गहन रूप से आत्मसात करें और इसे लौटे हुए मानों में शामिल करें।

यह दिखाता है:

आकार : श्रृंखला

एक श्रृंखला जिसका सूचकांक मूल कॉलम नाम है और जिसका मान बाइट्स में प्रत्येक कॉलम का मेमोरी उपयोग है।

यह भी देखें

numpy.ndarray.nbytes
एक ndarray के तत्वों द्वारा खपत कुल बाइट्स।
Series.memory_usage
बाइट्स एक श्रृंखला द्वारा सेवन किया जाता है।
pandas.Categorical
कई दोहराया मूल्यों के साथ स्ट्रिंग मूल्यों के लिए मेमोरी-कुशल सरणी।
DataFrame.info
एक DataFrame का संक्षिप्त सारांश।

उदाहरण

>>> dtypes = ['int64', 'float64', 'complex128', 'object', 'bool']
>>> data = dict([(t, np.ones(shape=5000).astype(t))
...              for t in dtypes])
>>> df = pd.DataFrame(data)
>>> df.head()
   int64  float64  complex128 object  bool
0      1      1.0      (1+0j)      1  True
1      1      1.0      (1+0j)      1  True
2      1      1.0      (1+0j)      1  True
3      1      1.0      (1+0j)      1  True
4      1      1.0      (1+0j)      1  True
>>> df.memory_usage()
Index            80
int64         40000
float64       40000
complex128    80000
object        40000
bool           5000
dtype: int64
>>> df.memory_usage(index=False)
int64         40000
float64       40000
complex128    80000
object        40000
bool           5000
dtype: int64

object dtype कॉलम की मेमोरी फ़ुटप्रिंट को डिफ़ॉल्ट रूप से अनदेखा किया जाता है:

>>> df.memory_usage(deep=True)
Index             80
int64          40000
float64        40000
complex128     80000
object        160000
bool            5000
dtype: int64

कई दोहराए गए मानों के साथ ऑब्जेक्ट-डीटीपी कॉलम के कुशल भंडारण के लिए एक श्रेणीबद्ध का उपयोग करें।

>>> df['object'].astype('category').memory_usage(deep=True)
5168