pandas 0.23 - pandas.read_stata()

pandas.read_stata




pandas

pandas.read_stata

pandas.read_stata(filepath_or_buffer, convert_dates=True, convert_categoricals=True, encoding=None, index_col=None, convert_missing=False, preserve_dtypes=True, columns=None, order_categoricals=True, chunksize=None, iterator=False)

DataFrame में Stata फाइल पढ़ें।

पैरामीटर:

filepath_or_buffer : स्ट्रिंग या फ़ाइल जैसी वस्तु

बाइनरी रीड () फ़ंक्शन को लागू करने के लिए .dta फ़ाइल या ऑब्जेक्ट पर पथ

Convert_dates : बूलियन, ट्रू के लिए चूक

डेटा चर समय मानों के लिए दिनांक चर परिवर्तित करें।

Convert_categoricals : बूलियन, डिफॉल्ट टू ट्रू

मूल्य लेबल पढ़ें और कॉलम को श्रेणीबद्ध / कारक चर में बदलें।

एन्कोडिंग : स्ट्रिंग, कोई नहीं या एन्कोडिंग

फ़ाइलों को पार्स करने के लिए उपयोग किया गया एन्कोडिंग। लैटिन -1 के लिए कोई भी चूक नहीं है।

index_col : स्ट्रिंग, वैकल्पिक, डिफ़ॉल्ट: कोई नहीं

सूचकांक के रूप में सेट करने के लिए कॉलम।

Convert_missing : बूलियन, झूठी के लिए चूक

यह दर्शाता है कि लापता मूल्यों को उनके स्टाटा अभ्यावेदन में परिवर्तित करना है या नहीं। यदि गलत, अनुपलब्ध मान को नेन से बदल दिया जाता है। यदि सत्य है, तो लापता मान वाले स्तंभों को ऑब्जेक्ट डेटा प्रकारों के साथ लौटा दिया जाता है और लापता मानों को StataMissingValue ऑब्जेक्ट द्वारा दर्शाया जाता है।

preserve_dtypes : बूलियन, डिफॉल्ट टू ट्रू

स्टैटा डेटेटिप्स को संरक्षित करें। यदि गलत, संख्यात्मक डेटा विदेशी डेटा (फ्लोट64 या इंट64) के लिए पंडों के डिफ़ॉल्ट प्रकारों के लिए बनाए जाते हैं।

कॉलम : सूची या कोई भी नहीं

बनाए रखने के लिए कॉलम। दिए गए क्रम में कॉलम वापस किए जाएंगे। सभी कॉलमों को कोई नहीं लौटाता है।

order_categoricals : बूलियन, ट्रू को चूक

यह दर्शाता है कि परिवर्तित वर्गीकृत डेटा का आदेश दिया गया है।

chunksize : int, default कोई नहीं

पुनरावृत्तियों के लिए StataReader ऑब्जेक्ट लौटाएं, दिए गए लाइनों की संख्या के साथ विखंडू लौटाता है।

पुनरावृत्त : बूलियन, डिफ़ॉल्ट गलत

वापसी StataReader ऑब्जेक्ट।

यह दिखाता है:
DataFrame या StataReader

यह भी देखें

pandas.io.stata.StataReader
Stata डेटा फ़ाइलों के लिए निम्न-स्तरीय रीडर
pandas.DataFrame.to_stata
Stata डेटा फ़ाइलों को निर्यात करें

उदाहरण

Stata dta फ़ाइल पढ़ें:

>>> import pandas as pd
>>> df = pd.read_stata('filename.dta')

10,000 लाइन चंक्स में एक स्टाटा ड्टा फाइल पढ़ें:

>>> itr = pd.read_stata('filename.dta', chunksize=10000)
>>> for chunk in itr:
...     do_something(chunk)