pandas 0.23 - DataFrame.join()
pandas.DataFrame.join

pandas.DataFrame.join
-
DataFrame.join(other, on=None, how='left', lsuffix='', rsuffix='', sort=False)
[source] -
अन्य DataFrame के साथ कॉलम को इंडेक्स पर या किसी कुंजी कॉलम पर शामिल करें। सूची में एक बार अनुक्रमणिका द्वारा एकाधिक डेटाफ़्रेम ऑब्जेक्ट्स को कुशलतापूर्वक सम्मिलित करें।
पैरामीटर: अन्य : डेटाफ़्रेम, नाम फ़ील्ड सेट के साथ श्रृंखला या डेटाफ़्रेम की सूची
सूचकांक इस एक के कॉलम के समान होना चाहिए। यदि कोई श्रृंखला पारित की जाती है, तो उसका नाम विशेषता सेट होनी चाहिए, और इसका उपयोग डेटाफ़्रेम में शामिल किए गए कॉलम नाम के रूप में किया जाएगा
on : नाम, tuple / नामों की सूची, या सरणी की तरह
कॉलर में कॉलम या इंडेक्स लेवल नेम (ओं) को
other
में इंडेक्स में शामिल होने के लिए, अन्यथा इंडेक्स-ऑन-इंडेक्स में शामिल होता है। यदि कई मान दिए गए हैं, तोother
DataFrame में एक MultiIndex होना चाहिए। अगर यह पहले से ही कॉलिंग डाटाफ्रेम में सम्मिलित नहीं है, तो ज्वाइन की के रूप में एक एरे पास कर सकते हैं। एक एक्सेल VLOOKUP ऑपरेशन की तरहकैसे : {'बाएं', 'दाएं', 'बाहरी', 'भीतरी'}, डिफ़ॉल्ट: 'बाएं'
कैसे दो वस्तुओं के संचालन को संभालने के लिए।
- बाएं: कॉलिंग फ्रेम के सूचकांक का उपयोग करें (या यदि निर्दिष्ट किया गया है तो स्तंभ)
- सही: अन्य फ्रेम के सूचकांक का उपयोग करें
- बाहरी: फ्रेम के सूचकांक (या यदि निर्दिष्ट किया गया है तो स्तंभ) के रूप में संघ दूसरे फ्रेम के सूचकांक के साथ है, और इसे शाब्दिक रूप से क्रमबद्ध करें
- इनर: कॉलिंग फ्रेम के इंडेक्स का फॉर्म चौराहा (या यदि स्तंभ निर्दिष्ट है) अन्य फ्रेम इंडेक्स के साथ, कॉलिंग के क्रम को संरक्षित करते हुए
lsuffix : स्ट्रिंग
बाएं फ्रेम के ओवरलैपिंग कॉलम से उपयोग करने के लिए प्रत्यय
rsuffix : स्ट्रिंग
सही फ्रेम के ओवरलैपिंग कॉलम से उपयोग करने के लिए प्रत्यय
सॉर्ट : बूलियन, डिफ़ॉल्ट गलत
ज्वाइन की के द्वारा डाटाफ्रेम को लेक्सोग्राफिक रूप से ऑर्डर करें। यदि गलत है, तो ज्वाइन कुंजी का क्रम ज्वाइन प्रकार (कैसे कीवर्ड) पर निर्भर करता है
यह दिखाता है: -
joined : DataFrame
यह भी देखें
-
DataFrame.merge
- कॉलम (एस) -ऑन-कॉलम (एस) के संचालन के लिए
टिप्पणियाँ
DataFrame ऑब्जेक्ट्स की सूची को पास करते समय lsuffix और rsuffix विकल्पों का समर्थन नहीं किया जाता है
इंडेक्स के स्तर को निर्दिष्ट करने के लिए समर्थन के रूप में पैरामीटर 0.23.0 संस्करण में जोड़ा गया था
उदाहरण
>>> caller = pd.DataFrame({'key': ['K0', 'K1', 'K2', 'K3', 'K4', 'K5'], ... 'A': ['A0', 'A1', 'A2', 'A3', 'A4', 'A5']})
>>> caller A key 0 A0 K0 1 A1 K1 2 A2 K2 3 A3 K3 4 A4 K4 5 A5 K5
>>> other = pd.DataFrame({'key': ['K0', 'K1', 'K2'], ... 'B': ['B0', 'B1', 'B2']})
>>> other B key 0 B0 K0 1 B1 K1 2 B2 K2
अपने अनुक्रमणिका का उपयोग करके DataFrames में शामिल हों।
>>> caller.join(other, lsuffix='_caller', rsuffix='_other')
>>> A key_caller B key_other 0 A0 K0 B0 K0 1 A1 K1 B1 K1 2 A2 K2 B2 K2 3 A3 K3 NaN NaN 4 A4 K4 NaN NaN 5 A5 K5 NaN NaN
यदि हम कुंजी कॉलम का उपयोग करना चाहते हैं, तो हमें कॉलर और अन्य दोनों में इंडेक्स होने के लिए कुंजी सेट करने की आवश्यकता है। शामिल किए गए DataFrame में इसके सूचकांक के रूप में कुंजी होगी।
>>> caller.set_index('key').join(other.set_index('key'))
>>> A B key K0 A0 B0 K1 A1 B1 K2 A2 B2 K3 A3 NaN K4 A4 NaN K5 A5 NaN
मुख्य कॉलम का उपयोग करने के लिए शामिल होने का एक अन्य विकल्प पैरामीटर पर उपयोग करना है। DataFrame.join हमेशा दूसरे के इंडेक्स का उपयोग करता है लेकिन हम कॉलर में किसी भी कॉलम का उपयोग कर सकते हैं। यह विधि परिणाम में मूल कॉलर के सूचकांक को संरक्षित करती है।
>>> caller.join(other.set_index('key'), on='key')
>>> A key B 0 A0 K0 B0 1 A1 K1 B1 2 A2 K2 B2 3 A3 K3 NaN 4 A4 K4 NaN 5 A5 K5 NaN