pandas 0.23 - 5. Cookbook

Cookbook




pandas

Cookbook

यह छोटे और मीठे उदाहरणों के लिए एक भंडार है और उपयोगी पांडा व्यंजनों के लिए लिंक है। हम उपयोगकर्ताओं को इस दस्तावेज़ में जोड़ने के लिए प्रोत्साहित करते हैं।

इस खंड में दिलचस्प लिंक और / या इनलाइन उदाहरण जोड़ना एक महान फर्स्ट पुल अनुरोध है

सरल, संघनित, नए-उपयोगकर्ता के अनुकूल, इन-लाइन उदाहरण सम्मिलित किए गए हैं जहां स्टैक-ओवरफ्लो और गिटहब लिंक को बढ़ाना संभव है। कई लिंक में विस्तृत जानकारी होती है, जो इन-लाइन उदाहरण पेश करता है।

पंड (pd) और Numpy (np) केवल दो संक्षिप्त रूप से आयातित मॉड्यूल हैं। बाकी नए उपयोगकर्ताओं के लिए स्पष्ट रूप से आयात किए जाते हैं।

ये उदाहरण पायथन के लिए लिखे गए हैं। 3. पहले के अजगर संस्करणों के लिए मामूली मोड़ आवश्यक हो सकते हैं।

मुहावरे

ये कुछ साफ सुथरे पांडा idioms

अगर-तब / यदि-तब-तब एक स्तंभ पर, और दूसरे एक या अधिक स्तंभों को असाइनमेंट:

In [1]: df = pd.DataFrame(
   ...:      {'AAA' : [4,5,6,7], 'BBB' : [10,20,30,40],'CCC' : [100,50,-30,-50]}); df
   ...: 
Out[1]: 
   AAA  BBB  CCC
0    4   10  100
1    5   20   50
2    6   30  -30
3    7   40  -50

तो अगर…

एक-तो एक कॉलम पर

In [2]: df.loc[df.AAA >= 5,'BBB'] = -1; df
Out[2]: 
   AAA  BBB  CCC
0    4   10  100
1    5   -1   50
2    6   -1  -30
3    7   -1  -50

2 कॉलमों को असाइनमेंट के साथ एक अगर-तब:

In [3]: df.loc[df.AAA >= 5,['BBB','CCC']] = 555; df
Out[3]: 
   AAA  BBB  CCC
0    4   10  100
1    5  555  555
2    6  555  555
3    7  555  555

अलग-अलग लॉजिक के साथ एक और लाइन जोड़ें, -लेश करने के लिए

In [4]: df.loc[df.AAA < 5,['BBB','CCC']] = 2000; df
Out[4]: 
   AAA   BBB   CCC
0    4  2000  2000
1    5   555   555
2    6   555   555
3    7   555   555

या जहां आपने मास्क लगाया है उसके बाद पांडा का उपयोग करें

In [5]: df_mask = pd.DataFrame({'AAA' : [True] * 4, 'BBB' : [False] * 4,'CCC' : [True,False] * 2})

In [6]: df.where(df_mask,-1000)
Out[6]: 
   AAA   BBB   CCC
0    4 -1000  2000
1    5 -1000 -1000
2    6 -1000   555
3    7 -1000 -1000

अगर-तब-तब सुन्न का उपयोग करके कहाँ ()

In [7]: df = pd.DataFrame(
   ...:      {'AAA' : [4,5,6,7], 'BBB' : [10,20,30,40],'CCC' : [100,50,-30,-50]}); df
   ...: 
Out[7]: 
   AAA  BBB  CCC
0    4   10  100
1    5   20   50
2    6   30  -30
3    7   40  -50

In [8]: df['logic'] = np.where(df['AAA'] > 5,'high','low'); df