pandas 0.23 - Panel.to_hdf()

pandas.Panel.to_hdf




pandas

pandas.Panel.to_hdf

Panel.to_hdf(path_or_buf, key, **kwargs) [source]

HDFStore का उपयोग करके HDF5 फ़ाइल में निहित डेटा लिखें।

पदानुक्रमित डेटा प्रारूप (HDF) आत्म-वर्णन है, जो किसी फ़ाइल की संरचना और सामग्री को बिना किसी बाहरी जानकारी के व्याख्या करने की अनुमति देता है। एक एचडीएफ फ़ाइल संबंधित वस्तुओं का मिश्रण रख सकती है जिसे एक समूह या व्यक्तिगत वस्तुओं के रूप में एक्सेस किया जा सकता है।

मौजूदा HDF फ़ाइल में एक और डेटाफ़्रेम या श्रृंखला जोड़ने के लिए कृपया ऐपेंड मोड और एक अलग कुंजी का उपयोग करें।

अधिक जानकारी के लिए उपयोगकर्ता गाइड देखें।

पैरामीटर:

path_or_buf : str या pandas.HDFStore

फ़ाइल पथ या HDFStore ऑब्जेक्ट।

कुंजी : str

स्टोर में समूह के लिए पहचानकर्ता।

मोड : {'a', 'w', 'r +'}, डिफ़ॉल्ट 'a'

फ़ाइल खोलने का तरीका:

  • 'w': लिखें, एक नई फ़ाइल बनाई गई है (उसी नाम से एक मौजूदा फ़ाइल को हटा दिया जाएगा)।
  • 'a': परिशिष्ट, एक मौजूदा फ़ाइल पढ़ने और लिखने के लिए खोली जाती है, और यदि फ़ाइल मौजूद नहीं है तो इसे बनाया जाता है।
  • 'r +': 'a' के समान, लेकिन फ़ाइल पहले से मौजूद होनी चाहिए।

प्रारूप : {'निश्चित', 'तालिका'}, डिफ़ॉल्ट 'निश्चित'

संभावित मान:

  • 'निश्चित': निश्चित प्रारूप। तेजी से लिखना / पढ़ना। न-प्रशंसनीय, और न ही खोज योग्य।
  • 'तालिका': तालिका प्रारूप। PyTables तालिका संरचना के रूप में लिखें जो खराब प्रदर्शन कर सकती है लेकिन डेटा के सबसेट को खोजने / चयन करने जैसे अधिक लचीले संचालन की अनुमति देती है।

परिशिष्ट : बूल, डिफ़ॉल्ट गलत

तालिका प्रारूपों के लिए, इनपुट डेटा को मौजूदा में जोड़ें।

data_columns : कॉलम या ट्रू, वैकल्पिक की सूची

ऑन-डिस्क क्वेरी के लिए अनुक्रमित डेटा कॉलम के रूप में बनाने के लिए स्तंभों की सूची, या सभी स्तंभों का उपयोग करने के लिए सही। डिफ़ॉल्ट रूप से केवल ऑब्जेक्ट की कुल्हाड़ियों को अनुक्रमित किया जाता है। डेटा कॉलम के माध्यम से क्वेरी देखें। केवल प्रारूप = 'तालिका' के लिए लागू।

संकलन : {0-9}, वैकल्पिक

डेटा के लिए एक संपीड़न स्तर निर्दिष्ट करता है। 0 का मान संपीड़न को अक्षम करता है।

कॉम्पिब : {' ज़्लिब ', 'लोज़ो', 'बज़िप 2', 'ब्लॉस्क'}, डिफॉल्ट 'ज़ीब'

उपयोग किए जाने वाले संपीड़न लाइब्रेरी को निर्दिष्ट करता है। V0.20.2 के रूप में, ब्लोक्स के लिए ये अतिरिक्त कंप्रेशर्स समर्थित हैं (डिफ़ॉल्ट यदि कोई कंप्रेसर निर्दिष्ट नहीं किया गया है: 'ब्लॉस्क: ब्लॉस्क्ज़'): {'ब्लोक्स: ब्लोस्क्ज़ल', 'ब्लोक्स: एलज़ 4', 'ब्लॉस्क: एलज़ 4 एचसी', 'ब्लॉस्क: स्नैपी' , 'ब्लॉस्क: ज़्लिब', 'ब्लॉस्क: ज़स्टड'}। एक संपीड़न लाइब्रेरी निर्दिष्ट करना जो उपलब्ध नहीं है एक ValueError जारी करता है।

fletcher32 : बूल, डिफ़ॉल्ट गलत

यदि संपीड़न लागू करने के लिए fletcher32 चेकसम का उपयोग करें।

dropna : बूल, डिफ़ॉल्ट गलत

यदि सही है, तो सभी नैनो पंक्तियों को स्टोर करने के लिए नहीं लिखा जाएगा।

त्रुटियाँ : str, डिफ़ॉल्ट 'सख्त'

निर्दिष्ट करता है कि एन्कोडिंग और डिकोडिंग त्रुटियों को कैसे नियंत्रित किया जाना है। विकल्पों की पूरी सूची के लिए open() लिए त्रुटियों का तर्क देखें।

यह भी देखें

DataFrame.read_hdf
एचडीएफ फ़ाइल से पढ़ें।
DataFrame.to_parquet
बाइनरी पर्च प्रारूप में डेटाफ़्रेम लिखें।
DataFrame.to_sql
एक वर्ग तालिका में लिखें।
DataFrame.to_feather
DataFrames के लिए पंख-प्रारूप लिखें।
DataFrame.to_csv
एक सीएसवी फ़ाइल के लिए लिखें।

उदाहरण

>>> df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]},
...                   index=['a', 'b', 'c'])
>>> df.to_hdf('data.h5', key='df', mode='w')

हम उसी फ़ाइल में एक और ऑब्जेक्ट जोड़ सकते हैं:

>>> s = pd.Series([1, 2, 3, 4])
>>> s.to_hdf('data.h5', key='s')

HDF फ़ाइल से पढ़ना:

>>> pd.read_hdf('data.h5', 'df')
A  B
a  1  4
b  2  5
c  3  6
>>> pd.read_hdf('data.h5', 's')
0    1
1    2
2    3
3    4
dtype: int64

डेटा के साथ फ़ाइल हटाना:

>>> import os
>>> os.remove('data.h5')