pandas 0.23 - Series.to_hdf()
pandas.Series.to_hdf

pandas.Series.to_hdf
-
Series.to_hdf(path_or_buf, key, **kwargs)
[source] -
HDFStore का उपयोग करके HDF5 फ़ाइल में निहित डेटा लिखें।
पदानुक्रमित डेटा प्रारूप (HDF) आत्म-वर्णन है, जो किसी फ़ाइल की संरचना और सामग्री को बिना किसी बाहरी जानकारी के व्याख्या करने की अनुमति देता है। एक एचडीएफ फ़ाइल संबंधित वस्तुओं का मिश्रण रख सकती है जिसे एक समूह या व्यक्तिगत वस्तुओं के रूप में एक्सेस किया जा सकता है।
मौजूदा HDF फ़ाइल में एक और डेटाफ़्रेम या श्रृंखला जोड़ने के लिए कृपया ऐपेंड मोड और एक अलग कुंजी का उपयोग करें।
अधिक जानकारी के लिए उपयोगकर्ता गाइड देखें।
पैरामीटर: path_or_buf : str या pandas.HDFStore
फ़ाइल पथ या HDFStore ऑब्जेक्ट।
कुंजी : str
स्टोर में समूह के लिए पहचानकर्ता।
मोड : {'a', 'w', 'r +'}, डिफ़ॉल्ट 'a'
फ़ाइल खोलने का तरीका:
- 'w': लिखें, एक नई फ़ाइल बनाई गई है (उसी नाम से एक मौजूदा फ़ाइल को हटा दिया जाएगा)।
- 'a': परिशिष्ट, एक मौजूदा फ़ाइल पढ़ने और लिखने के लिए खोली जाती है, और यदि फ़ाइल मौजूद नहीं है तो इसे बनाया जाता है।
- 'r +': 'a' के समान, लेकिन फ़ाइल पहले से मौजूद होनी चाहिए।
प्रारूप : {'निश्चित', 'तालिका'}, डिफ़ॉल्ट 'निश्चित'
संभावित मान:
- 'निश्चित': निश्चित प्रारूप। तेजी से लिखना / पढ़ना। न-प्रशंसनीय, और न ही खोज योग्य।
- 'तालिका': तालिका प्रारूप। PyTables तालिका संरचना के रूप में लिखें जो खराब प्रदर्शन कर सकती है लेकिन डेटा के सबसेट को खोजने / चयन करने जैसे अधिक लचीले संचालन की अनुमति देती है।
परिशिष्ट : बूल, डिफ़ॉल्ट गलत
तालिका प्रारूपों के लिए, इनपुट डेटा को मौजूदा में जोड़ें।
data_columns : कॉलम या ट्रू, वैकल्पिक की सूची
ऑन-डिस्क क्वेरी के लिए अनुक्रमित डेटा कॉलम के रूप में बनाने के लिए स्तंभों की सूची, या सभी स्तंभों का उपयोग करने के लिए सही। डिफ़ॉल्ट रूप से केवल ऑब्जेक्ट की कुल्हाड़ियों को अनुक्रमित किया जाता है। डेटा कॉलम के माध्यम से क्वेरी देखें। केवल प्रारूप = 'तालिका' के लिए लागू।
संकलन : {0-9}, वैकल्पिक
डेटा के लिए एक संपीड़न स्तर निर्दिष्ट करता है। 0 का मान संपीड़न को अक्षम करता है।
कॉम्पिब : {' ज़्लिब ', 'लोज़ो', 'बज़िप 2', 'ब्लॉस्क'}, डिफॉल्ट 'ज़ीब'
उपयोग किए जाने वाले संपीड़न लाइब्रेरी को निर्दिष्ट करता है। V0.20.2 के रूप में, ब्लोक्स के लिए ये अतिरिक्त कंप्रेशर्स समर्थित हैं (डिफ़ॉल्ट यदि कोई कंप्रेसर निर्दिष्ट नहीं किया गया है: 'ब्लॉस्क: ब्लॉस्क्ज़'): {'ब्लोक्स: ब्लोस्क्ज़ल', 'ब्लोक्स: एलज़ 4', 'ब्लॉस्क: एलज़ 4 एचसी', 'ब्लॉस्क: स्नैपी' , 'ब्लॉस्क: ज़्लिब', 'ब्लॉस्क: ज़स्टड'}। एक संपीड़न लाइब्रेरी निर्दिष्ट करना जो उपलब्ध नहीं है एक ValueError जारी करता है।
fletcher32 : बूल, डिफ़ॉल्ट गलत
यदि संपीड़न लागू करने के लिए fletcher32 चेकसम का उपयोग करें।
dropna : बूल, डिफ़ॉल्ट गलत
यदि सही है, तो सभी नैनो पंक्तियों को स्टोर करने के लिए नहीं लिखा जाएगा।
त्रुटियाँ : str, डिफ़ॉल्ट 'सख्त'
निर्दिष्ट करता है कि एन्कोडिंग और डिकोडिंग त्रुटियों को कैसे नियंत्रित किया जाना है। विकल्पों की पूरी सूची के लिए
open()
लिए त्रुटियों का तर्क देखें।यह भी देखें
-
DataFrame.read_hdf
- एचडीएफ फ़ाइल से पढ़ें।
-
DataFrame.to_parquet
- बाइनरी पर्च प्रारूप में डेटाफ़्रेम लिखें।
-
DataFrame.to_sql
- एक वर्ग तालिका में लिखें।
-
DataFrame.to_feather
- DataFrames के लिए पंख-प्रारूप लिखें।
-
DataFrame.to_csv
- एक सीएसवी फ़ाइल के लिए लिखें।
उदाहरण
>>> df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]}, ... index=['a', 'b', 'c']) >>> df.to_hdf('data.h5', key='df', mode='w')
हम उसी फ़ाइल में एक और ऑब्जेक्ट जोड़ सकते हैं:
>>> s = pd.Series([1, 2, 3, 4]) >>> s.to_hdf('data.h5', key='s')
HDF फ़ाइल से पढ़ना:
>>> pd.read_hdf('data.h5', 'df') A B a 1 4 b 2 5 c 3 6 >>> pd.read_hdf('data.h5', 's') 0 1 1 2 2 3 3 4 dtype: int64
डेटा के साथ फ़ाइल हटाना:
>>> import os >>> os.remove('data.h5')