pandas 0.23 - DataFrame.from_csv()

pandas.DataFrame.from_csv




pandas

pandas.DataFrame.from_csv

classmethod DataFrame.from_csv(path, header=0, sep=', ', index_col=0, parse_dates=True, encoding=None, tupleize_cols=None, infer_datetime_format=False) [source]

CSV फ़ाइल पढ़ें।

संस्करण 0.21.0 के बाद से पदावनत: इसके बजाय pandas.read_csv() उपयोग करें।

अधिक सामान्य उद्देश्यों के लिए अधिक शक्तिशाली pandas.read_csv() का उपयोग करना बेहतर होता है, लेकिन from_csv एक फ़ाइल के लिए ( to_csv का सटीक प्रतिपक्ष) के लिए एक आसान राउंडट्रिप बनाता है, विशेष रूप से टाइम सीरीज़ डेटा के डेटाब्रैम के साथ।

यह विधि केवल कुछ डिफ़ॉल्ट में पसंदीदा pandas.read_csv() से भिन्न होती है:

  • index_col किसी के बजाय 0 (डिफ़ॉल्ट रूप से सूचकांक के रूप में पहला कॉलम लें)
  • parse_dates False बजाय True (डिफ़ॉल्ट रूप से parse_dates को parse_dates रूप में पार्स करने का प्रयास करें)

तो एक pd.DataFrame.from_csv(path) को pd.read_csv(path, index_col=0, parse_dates=True) द्वारा प्रतिस्थापित किया जा सकता है।

पैरामीटर:
path : string file path or file handle / StringIO

शीर्ष लेख : int, डिफ़ॉल्ट ०

शीर्ष लेख के रूप में उपयोग करने के लिए पंक्ति (पूर्व पंक्तियों को छोड़ें)

sep : स्ट्रिंग, डिफ़ॉल्ट ','

क्षेत्र का परिसीमन

index_col : int या अनुक्रम, डिफ़ॉल्ट 0

सूचकांक के लिए उपयोग करने के लिए कॉलम। यदि कोई अनुक्रम दिया जाता है, तो एक मल्टीइन्डेक्स का उपयोग किया जाता है। Read_table से अलग डिफ़ॉल्ट

parse_dates : बूलियन, डिफ़ॉल्ट सत्य

पार्स डेट्स। Read_table से अलग डिफ़ॉल्ट

tupleize_cols : बूलियन, डिफ़ॉल्ट गलत

tuples (यदि सही है) या नया (विस्तारित प्रारूप) यदि गलत है तो एक सूची के रूप में multi_index कॉलम लिखें

infer_datetime_format: बूलियन, डिफ़ॉल्ट गलत

यदि स्तंभ के लिए True और parse_dates सत्य है, तो पहले डेटाटाइम स्ट्रिंग के आधार पर parse_dates प्रारूप का अनुमान लगाने का प्रयास करें। यदि प्रारूप का अनुमान लगाया जा सकता है, तो अक्सर एक बड़ी पार्सिंग गति होगी।

यह दिखाता है:
y : DataFrame

यह भी देखें

pandas.read_csv()