読み込めない - rstudio csv 読み込み




csv-datasetをRにインポートしましたが、値は要因になります (4)

私はRにはとても新しいので、インポートしたデータセットにアクセスするのに問題があります。 私はRStudioを使用していて、CSVファイルをインポートするときにImport Dataset関数を使用し、コンソールウィンドウからソースウィンドウに行を貼り付けました。 コードは次のようになります。

setwd("c:/kalle/R")
stuckey <- read.csv("C:/kalle/R/stuckey.csv")
point <- stuckey$PTS
time <- stuckey$MP

しかし、データは整数でも数値でもなく、慣れていますが、要因をプロットしようとするとヒストグラムしか得られません。通常のプロットではありません。 データをチェックするときは、順番になっているように見えますが、それは要素の形式であるため、使用できません。


csvデータファイルをインポートするとき、importコマンドは、各列(;)と数値のfloat-number seperator(数値変数= 2,5の場合は "、")の間のデータ分離を反映する必要があります。

したがって、csvをインポートするためのコマンドは、より多くのコマンドでより包括的でなければなりません:

    stuckey <- read.csv2("C:/kalle/R/stuckey.csv", header=TRUE, sep=";", dec=",")

これは、すべての変数を整数または数値としてインポートする必要があります。


この問題(これはかなり一般的です)に直面したとき、私は通常options( stringsAsFactors=F )から始めoptions( stringsAsFactors=F )

次に、ファイルを次のように読み取りますmy.tab <- read.table( "filename.csv", as.is=T )

通常、 read.delimを使用するとread.delimです。


デフォルトでは、 read.csvはデータの最初の数行をチェックして、各変数を数値として扱うかどうかを調べます。 数値以外の値を検出すると、その変数が文字データであるとみなされ、文字変数が係数に変換されます。

あなたのデータセットのPTSとMPの変数には数値以外が含まれているように見えます。そのため、予期せぬ結果が出ています。 これらの変数を強制的に数値にすることができます

point <- as.numeric(as.character(point))
time <- as.numeric(as.character(time))

しかし、変換できない値はすべて失われます。 (R FAQは因子 - >数値変換のためのやや異なる方法を提供しますが、それは何かを覚えていません。)


データのインポート関数(ここでは: read.csv() )とグローバルオプションのstringsAsFactors=FALSEを指定すると、これを修正する必要があります。