pandas 0.23 - 6. Intro to Data Structures

डेटा संरचनाओं के लिए परिचय




pandas

डेटा संरचनाओं के लिए परिचय

हम आरंभ करने के लिए पांडा में मूलभूत डेटा संरचनाओं के त्वरित, गैर-व्यापक अवलोकन के साथ शुरुआत करेंगे। डेटा प्रकार, अनुक्रमण, और अक्ष लेबलिंग / संरेखण के बारे में मौलिक व्यवहार सभी वस्तुओं पर लागू होते हैं। आरंभ करने के लिए, अपने नामस्थान में NumPy और लोड पांडा आयात करें:

In [1]: import numpy as np

In [2]: import pandas as pd

यहां एक बुनियादी सिद्धांत को ध्यान में रखना है: डेटा संरेखण आंतरिक है । जब तक आपके द्वारा स्पष्ट रूप से ऐसा नहीं किया जाता है तब तक लेबल और डेटा के बीच की कड़ी नहीं तोड़ी जाएगी।

हम डेटा संरचनाओं को एक संक्षिप्त परिचय देंगे, फिर सभी व्यापक श्रेणियों की कार्यप्रणाली और विभिन्न वर्गों में विधियों पर विचार करेंगे।

शृंखला

Series एक आयामी लेबल वाली सरणी है जो किसी भी डेटा प्रकार (पूर्णांक, स्ट्रिंग्स, फ्लोटिंग पॉइंट नंबर, पायथन ऑब्जेक्ट्स आदि) को पकड़ने में सक्षम है। अक्ष लेबल को सामूहिक रूप से सूचकांक के रूप में संदर्भित किया जाता है। श्रृंखला बनाने का मूल तरीका कॉल करना है:

>>> s = pd.Series(data, index=index)

यहां, data कई अलग-अलग चीजें हो सकती हैं:

  • एक अजगर तानाशाह
  • एक ndarray
  • अदिश मान (जैसे 5)

पारित सूचकांक अक्ष लेबल की एक सूची है। इस प्रकार, यह कुछ मामलों में अलग हो जाता है जो डेटा पर निर्भर करता है :

Ndarray से

यदि data एक ndarray है, तो सूचकांक डेटा के समान लंबाई होना चाहिए। यदि कोई सूचकांक पारित नहीं किया जाता है, तो एक का निर्माण मूल्यों के साथ किया जाएगा [0, ..., len(data) - 1]

In [3]: s = pd.Series(np.random.randn(5), index=['a', 'b', 'c', 'd', 'e'])

In [4]: s
Out[4]: 
a    0.4691
b   -0.2829
c   -1.5091
d   -1.1356
e    1.2121
dtype: float64

In [5]: s.index