pandas 0.23 - DataFrame.join()

pandas.DataFrame.join




pandas

pandas.DataFrame.join

DataFrame.join(other, on=None, how='left', lsuffix='', rsuffix='', sort=False) [source]

अन्य DataFrame के साथ कॉलम को इंडेक्स पर या किसी कुंजी कॉलम पर शामिल करें। सूची में एक बार अनुक्रमणिका द्वारा एकाधिक डेटाफ़्रेम ऑब्जेक्ट्स को कुशलतापूर्वक सम्मिलित करें।

पैरामीटर:

अन्य : डेटाफ़्रेम, नाम फ़ील्ड सेट के साथ श्रृंखला या डेटाफ़्रेम की सूची

सूचकांक इस एक के कॉलम के समान होना चाहिए। यदि कोई श्रृंखला पारित की जाती है, तो उसका नाम विशेषता सेट होनी चाहिए, और इसका उपयोग डेटाफ़्रेम में शामिल किए गए कॉलम नाम के रूप में किया जाएगा

on : नाम, tuple / नामों की सूची, या सरणी की तरह

कॉलर में कॉलम या इंडेक्स लेवल नेम (ओं) को other में इंडेक्स में शामिल होने के लिए, अन्यथा इंडेक्स-ऑन-इंडेक्स में शामिल होता है। यदि कई मान दिए गए हैं, तो other DataFrame में एक MultiIndex होना चाहिए। अगर यह पहले से ही कॉलिंग डाटाफ्रेम में सम्‍मिलित नहीं है, तो ज्वाइन की के रूप में एक एरे पास कर सकते हैं। एक एक्सेल VLOOKUP ऑपरेशन की तरह

कैसे : {'बाएं', 'दाएं', 'बाहरी', 'भीतरी'}, डिफ़ॉल्ट: 'बाएं'

कैसे दो वस्तुओं के संचालन को संभालने के लिए।

  • बाएं: कॉलिंग फ्रेम के सूचकांक का उपयोग करें (या यदि निर्दिष्ट किया गया है तो स्तंभ)
  • सही: अन्य फ्रेम के सूचकांक का उपयोग करें
  • बाहरी: फ्रेम के सूचकांक (या यदि निर्दिष्ट किया गया है तो स्तंभ) के रूप में संघ दूसरे फ्रेम के सूचकांक के साथ है, और इसे शाब्दिक रूप से क्रमबद्ध करें
  • इनर: कॉलिंग फ्रेम के इंडेक्स का फॉर्म चौराहा (या यदि स्तंभ निर्दिष्ट है) अन्य फ्रेम इंडेक्स के साथ, कॉलिंग के क्रम को संरक्षित करते हुए

lsuffix : स्ट्रिंग

बाएं फ्रेम के ओवरलैपिंग कॉलम से उपयोग करने के लिए प्रत्यय

rsuffix : स्ट्रिंग

सही फ्रेम के ओवरलैपिंग कॉलम से उपयोग करने के लिए प्रत्यय

सॉर्ट : बूलियन, डिफ़ॉल्ट गलत

ज्वाइन की के द्वारा डाटाफ्रेम को लेक्सोग्राफिक रूप से ऑर्डर करें। यदि गलत है, तो ज्वाइन कुंजी का क्रम ज्वाइन प्रकार (कैसे कीवर्ड) पर निर्भर करता है

यह दिखाता है:
joined : DataFrame

यह भी देखें

DataFrame.merge
कॉलम (एस) -ऑन-कॉलम (एस) के संचालन के लिए

टिप्पणियाँ

DataFrame ऑब्जेक्ट्स की सूची को पास करते समय lsuffix और rsuffix विकल्पों का समर्थन नहीं किया जाता है

इंडेक्स के स्तर को निर्दिष्ट करने के लिए समर्थन के रूप में पैरामीटर 0.23.0 संस्करण में जोड़ा गया था

उदाहरण

>>> caller = pd.DataFrame({'key': ['K0', 'K1', 'K2', 'K3', 'K4', 'K5'],
...                        'A': ['A0', 'A1', 'A2', 'A3', 'A4', 'A5']})
>>> caller
    A key
0  A0  K0
1  A1  K1
2  A2  K2
3  A3  K3
4  A4  K4
5  A5  K5
>>> other = pd.DataFrame({'key': ['K0', 'K1', 'K2'],
...                       'B': ['B0', 'B1', 'B2']})
>>> other
    B key
0  B0  K0
1  B1  K1
2  B2  K2

अपने अनुक्रमणिका का उपयोग करके DataFrames में शामिल हों।

>>> caller.join(other, lsuffix='_caller', rsuffix='_other')
>>>     A key_caller    B key_other
    0  A0         K0   B0        K0
    1  A1         K1   B1        K1
    2  A2         K2   B2        K2
    3  A3         K3  NaN       NaN
    4  A4         K4  NaN       NaN
    5  A5         K5  NaN       NaN

यदि हम कुंजी कॉलम का उपयोग करना चाहते हैं, तो हमें कॉलर और अन्य दोनों में इंडेक्स होने के लिए कुंजी सेट करने की आवश्यकता है। शामिल किए गए DataFrame में इसके सूचकांक के रूप में कुंजी होगी।

>>> caller.set_index('key').join(other.set_index('key'))
>>>      A    B
    key
    K0   A0   B0
    K1   A1   B1
    K2   A2   B2
    K3   A3  NaN
    K4   A4  NaN
    K5   A5  NaN

मुख्य कॉलम का उपयोग करने के लिए शामिल होने का एक अन्य विकल्प पैरामीटर पर उपयोग करना है। DataFrame.join हमेशा दूसरे के इंडेक्स का उपयोग करता है लेकिन हम कॉलर में किसी भी कॉलम का उपयोग कर सकते हैं। यह विधि परिणाम में मूल कॉलर के सूचकांक को संरक्षित करती है।

>>> caller.join(other.set_index('key'), on='key')
>>>     A key    B
    0  A0  K0   B0
    1  A1  K1   B1
    2  A2  K2   B2
    3  A3  K3  NaN
    4  A4  K4  NaN
    5  A5  K5  NaN