read.csv, पहली पंक्ति पर हेडर, दूसरी पंक्ति को छोड़ें




header skip (2)

मेरे पास दो हैडर पंक्तियों के साथ एक सीएसवी फ़ाइल है, पहली पंक्ति मैं शीर्ष पर रहना चाहता हूं, लेकिन दूसरी पंक्ति जिसे मैं त्यागना चाहता हूं। अगर मैं निम्नलिखित कमांड करता हूं:

data <- read.csv("HK Stocks bbg.csv", header = T, stringsAsFactors = FALSE)

पहली पंक्ति शीर्षक हो जाती है और फ़ाइल की दूसरी पंक्ति मेरे डेटा फ्रेम की पहली पंक्ति बनती है:

  Xaaaaaaaaa       X X.1     Xbbbbbbbbbb     X.2 X.3
1         Date PX_LAST  NA         Date PX_LAST  NA
2   31/12/2002  38.855  NA   31/12/2002  19.547  NA
3   02/01/2003  38.664  NA   02/01/2003  19.547  NA
4   03/01/2003  40.386  NA   03/01/2003  19.547  NA
5   06/01/2003  40.386  NA   06/01/2003  19.609  NA
6   07/01/2003  40.195  NA   07/01/2003  19.609  NA

मुझे सीएसवी फ़ाइल की दूसरी पंक्ति को छोड़ना है और बस मिलना है

  X1.HK.Equity       X X.1 X2.HK.Equity     X.2 X.3
2   31/12/2002  38.855  NA   31/12/2002  19.547  NA
3   02/01/2003  38.664  NA   02/01/2003  19.547  NA
4   03/01/2003  40.386  NA   03/01/2003  19.547  NA
5   06/01/2003  40.386  NA   06/01/2003  19.609  NA
6   07/01/2003  40.195  NA   07/01/2003  19.609  NA

मैंने data <- read.csv("HK Stocks bbg.csv", header = T, stringsAsFactors = FALSE, skip = 1) लेकिन वह रिटर्न:

        Date PX_LAST  X     Date.1 PX_LAST.1 X.1
1 31/12/2002  38.855 NA 31/12/2002    19.547  NA
2 02/01/2003  38.664 NA 02/01/2003    19.547  NA
3 03/01/2003  40.386 NA 03/01/2003    19.547  NA
4 06/01/2003  40.386 NA 06/01/2003    19.609  NA
5 07/01/2003  40.195 NA 07/01/2003    19.609  NA
6 08/01/2003  40.386 NA 08/01/2003    19.547  NA

हैडर पंक्ति मेरी सीएसवी फ़ाइल की दूसरी लाइन से आती है, पहली पंक्ति से नहीं।

धन्यवाद।

https://code.i-harness.com


यह काम कर जाना चाहिए:

all_content = readLines("file.csv")
skip_second = all_content[-2]
dat = read.csv(textConnection(skip_second), header = TRUE, stringsAsFactors = FALSE)

readLines का उपयोग करने readLines पहला चरण एक संपूर्ण सूची को सूची में पढ़ता है, जहां सूची में प्रत्येक आइटम फाइल में एक पंक्ति का प्रतिनिधित्व करता है। इसके बाद, आप इस तथ्य का उपयोग करते हुए दूसरी पंक्ति को त्याग देते हैं कि R में नकारात्मक इंडेक्स का मतलब select all but this index का select all but this index । अंत में, हम इस डेटा को read.csv में संसाधित करने के लिए read.csv को इस फ़ीड को फ़ीड करते हैं।


आप सीधे डेटाफ्रेम से शीर्षलेख के बाद पहली पंक्ति (पों) को पट्टी कर सकते हैं, ताकि आप इसे एक पंक्ति में कर सकें:

df<-read.csv("test.txt",header=T)[-1,]

यदि मेरा डेटाफ़ाइल "test.txt" निम्न है:

var1, var2
units1, units2
2.3,6.8
4.5,6.7

यह मुझे देता है

> read.csv("test.txt",header=T)[-1,]
var1 var2
2  2.3  6.8
3  4.5  6.7

यह आपके प्रश्न का बिल्कुल जवाब देता है, लेकिन जवाब का सामान्यीकरण करने के लिए, आप इस तरीके से एम वें लाइनों को भी छोड़ सकते हैं:

df<-read.csv("test.txt",header=T)[-N:-M,]

जहां एन और एम कोर्स के पूर्णांक हैं





read.csv