pandas 0.23 - DataFrame.to_stata()

pandas.DataFrame.to_stata




pandas

pandas.DataFrame.to_stata

DataFrame.to_stata(fname, convert_dates=None, write_index=True, encoding='latin-1', byteorder=None, time_stamp=None, data_label=None, variable_labels=None, version=114, convert_strl=None)

Stata बाइनरी dta फ़ाइलों को निर्यात करें।

पैरामीटर:

fname : पाथ (स्ट्रिंग), बफर या पाथ ऑब्जेक्ट

string, path object (pathlib.Path or py._path.local.LocalPath) या बाइनरी राइटिंग () फ़ंक्शन को लागू करने वाली ऑब्जेक्ट। यदि बफर का उपयोग कर रहे हैं तो फ़ाइल डेटा लिखे जाने के बाद बफर स्वचालित रूप से बंद नहीं होगा।

Convert_dates : तानाशाही

डेट्स को लिखते समय उपयोग करने के लिए डेटा स्वरूप के लिए डेटाटाइम प्रकार वाले शब्दकोश मैपिंग कॉलम। विकल्प 'tc', 'td', 'tm', 'tw', 'th', 'tq', 'ty' हैं। स्तंभ एक पूर्णांक या एक नाम हो सकता है। जिन डाइमटाइम कॉलमों में रूपांतरण प्रकार निर्दिष्ट नहीं है, उन्हें 'टीसी' में बदल दिया जाएगा। यदि एक डेटाटाइम कॉलम में समय-सीमा की जानकारी है तो NotImplementedError को बढ़ाता है।

write_index : बूल

सूचकांक को स्टैटा डेटासेट में लिखें।

एन्कोडिंग : str

डिफ़ॉल्ट लैटिन -1 है। यूनिकोड समर्थित नहीं है।

बाइटऑर्डर : str

">", "<", "छोटा" या "बड़ा" हो सकता है। डिफ़ॉल्ट sys.byteorder

time_stamp : डेटाटाइम

फ़ाइल निर्माण तिथि के रूप में उपयोग करने के लिए एक डेटाइम। डिफ़ॉल्ट वर्तमान समय है।

data_label : str

डेटा सेट के लिए एक लेबल। 80 अक्षर या उससे छोटे होने चाहिए।

चर_लबल: तानाशाही

मानों के रूप में कुंजी और चर लेबल के रूप में कॉलम वाले शब्दकोश। प्रत्येक लेबल 80 वर्ण या उससे छोटा होना चाहिए।

संस्करण में नया 0.19.0।

संस्करण : {११४, ११:}

आउटपुट dta फ़ाइल में उपयोग करने के लिए संस्करण। वर्जन 114 को स्टाटा 10 और बाद में पढ़ा जा सकता है। वर्जन 117 को स्टाटा 13 या उसके बाद पढ़ा जा सकता है। संस्करण 114 स्ट्रिंग चर को 244 वर्ण या उससे कम समय तक सीमित करता है जबकि 117 स्ट्रिंग को 2,000,000 वर्णों तक की लंबाई के साथ अनुमति देता है।

संस्करण में नया 0.23.0।

Convert_strl : सूची, वैकल्पिक

स्ट्रिंग कॉलम को स्टैटा स्ट्राल प्रारूप में बदलने के लिए कॉलम नामों की सूची। यदि संस्करण 117 है तो ही उपलब्ध है। StrL फॉर्मेट में स्ट्रिंग्स को स्टोर करने पर छोटी dta फाइलें उत्पन्न हो सकती हैं यदि स्ट्रिंग्स में 8 से अधिक अक्षर हों और मानों को दोहराया जाए।

संस्करण में नया 0.23.0।

जन्म देती है:

NotImplementedError

  • यदि डेटेटाइम में टाइमजोन की जानकारी होती है
  • स्तूप में स्तंभ dtype प्रतिनिधित्व योग्य नहीं है

ValueError

  • Convert_dates में सूचीबद्ध कॉलम न तो datetime64 [ns] या datetime.datetime हैं
  • Convert_dates में सूचीबद्ध कॉलम DataFrame में नहीं है
  • श्रेणीबद्ध लेबल में 32,000 से अधिक वर्ण हैं

संस्करण में नया 0.19.0।

यह भी देखें

pandas.read_stata
स्टाटा डेटा फ़ाइलों को आयात करें
pandas.io.stata.StataWriter
Stata डेटा फ़ाइलों के लिए निम्न-स्तरीय लेखक
pandas.io.stata.StataWriter117
संस्करण 117 फ़ाइलों के लिए निम्न-स्तरीय लेखक

उदाहरण

>>> data.to_stata('./data_file.dta')

या तिथियों के साथ

>>> data.to_stata('./date_data_file.dta', {2 : 'tw'})

वैकल्पिक रूप से आप StataWriter वर्ग का एक उदाहरण बना सकते हैं

>>> writer = StataWriter('./data_file.dta', data)
>>> writer.write_file()

दिनांक के साथ:

>>> writer = StataWriter('./date_data_file.dta', data, {2 : 'tw'})
>>> writer.write_file()