java sparse - LibSVM Eingabeformat




1 Answers

Fragen Sie nach dem Datenformat oder wie konvertiert man die Daten? Für Letzteres müssen Sie experimentieren, um den richtigen Weg zu finden. Die allgemeine Idee besteht darin, Ihre Daten in ein nominales oder ordinales Wertattribut umzuwandeln. Einige davon sind einfach - # 4, # 6 - einige davon werden hart sein - # 1- # 3.

Beispielsweise könnten Sie # 1 als drei Attribute für Tag, Monat und Jahr darstellen oder nur eins, indem Sie es in einen UNIX-ähnlichen Zeitstempel konvertieren.

Das IP ist noch schwieriger - es gibt keine direkte Möglichkeit, dies in einen sinnvollen Ordnungswert umzuwandeln. Die Verwendung jeder IP als nominales Attribut ist je nach Problem möglicherweise nicht sinnvoll.

Sobald Sie das herausgefunden haben, konvertieren Sie Ihre Daten, überprüfen Sie die LibSVM-Dokumente. Dem allgemeinen Format folgt: dh +1 1:0 2:0 .. etc

performance validation

Ich möchte eine Reihe von markierten Instanzen (Daten) in einer Datei darstellen, die als Trainingsdaten an LibSVM übergeben werden. Für das Problem, das in dieser Frage erwähnt wird. Es wird einschließen,

  1. Anmeldedatum
  2. Anmeldezeit
  3. Ort (Ländercode?)
  4. Wochentag
  5. Authentizität (0 - Nicht Authentisch, 1 - Authentisch) - Das Label

Wie kann ich diese Daten so formatieren, dass sie in die SVM eingegeben werden?




Related

java format machine-learning libsvm prediction