prova - spss statistics download free




Come faccio a calcolare queste statistiche? (4)

Sto scrivendo un'app per facilitare la ricerca, e parte di questo implica fare alcuni calcoli statistici. In questo momento, i ricercatori stanno usando un programma chiamato SPSS . Parte dell'output di cui si preoccupano assomiglia a questo:

Sono davvero preoccupati solo per F e Sig. valori. Il mio problema è che non ho alcun background in statistica, e non riesco a capire come vengono chiamati i test o come calcolarli.

Ho pensato che il valore F potesse essere il risultato del test F , ma dopo aver seguito i passaggi forniti su Wikipedia, ho ottenuto un risultato diverso da quello fornito da SPSS .


Ecco una spiegazione dell'output di MANOVA, da un ottimo sito sulle statistiche e su SPSS:

Output con spiegazione: http://faculty.chass.ncsu.edu/garson/PA765/manospss.htm

Come e perché fare MANOVA o GLM multivariato: (stesso percorso come sopra, ma terminando in '/manova.htm')

Scrivere software da zero per calcolare queste uscite sarebbe lungo e difficile; ci sono molti problemi numerici e inversioni di matrice da fare.

Come diceva Henry, usa gli script Python, o R. Suggerirei di lavorare con qualcuno che conosce l'SPSS se esegue lo scripting. Inoltre, SPSS è in grado di esportare le tabelle di output in file usando qualcosa chiamato OMS. Uno script all'interno di SPSS può farlo.

Scopri chi nel tuo gruppo di ricerca conosce SPSS e collabora con loro.


In breve: non farlo a mano, collega / usa il software esistente. E la risposta di sain_grocen non è corretta. :(

Questi sono tutti test per la significatività delle stime dei parametri che sono tipicamente utilizzati nella risposta multivariata Regressioni multiple. Queste non sarebbero cose semplici da fare al di fuori di un ambiente di programmazione statistica. Suggerirei di ottenere l'output da un programma statistico preesistente o di utilizzarne uno a cui è possibile collegarsi e utilizzare quel codice.

Ho paura che la prima risposta (sain_grocen's) ti porterà sulla strada sbagliata. La sua spiegazione è probabilmente un caso speciale di ciò con cui stai effettivamente trattando. L'anova ha spiegato nei suoi collegamenti è per una singola risposta variata, in un design equilibrato. Queste non sono le statistiche F che stai vedendo. I nomi nel tuo output (Pillai's Trace, Hotelling's Trace, ...) sono alcune delle versioni multivariate disponibili. Hanno distribuzioni F sotto determinate ipotesi. Non posso spiegare un libro di testo di valore materiale qui, ti consiglierei di iniziare guardando "Analisi statistica multivariata applicata" di Johnson and Wichern


Presumo dalla tua domanda che i tuoi colleghi di ricerca vogliano automatizzare il processo mediante il quale vengono eseguite determinate analisi statistiche (cioè, vogliono processare i set di dati in batch). Hai due opzioni:

1) SPSS ora è scriptable tramite python (dalla versione 15) - vai su spss.com e cerca python. È possibile scrivere script Python per automatizzare l'analisi dei dati ed estrarre i valori chiave dalle tabelle pivot e quindi elaborare le risposte nel modo desiderato. Ciò ha il merito di consentire un confronto esatto tra i risultati del tuo script python e gli sforzi calcolati a mano in SPSS dei tuoi collaboratori. Quindi non dovrai conoscere davvero nessuna statistica per fare questo lavoro (che è un vantaggio chiave)

2) Puoi farlo in R, un ambiente di statistiche gratuito, che potrebbe probabilmente essere copiato. Questo ha lo svantaggio che dovrai imparare le statistiche per assicurarti di farlo correttamente.


Puoi spiegare di più perché SPSS in sé non è una buona soluzione al problema? È che genera tabelle pivot come output difficili da manipolare? È il costo del programma?

Le statistiche F possono derivare da qualsiasi numero di test particolari. La F è solo una distribuzione (vagamente: una descrizione delle "frequenze" di gruppi di valori), come una Normale (Gaussiana) o Uniforme. In generale derivano da rapporti di varianza. Opinione: molti statistici (incluso me stesso), trovano che i test basati su F siano instabili (gergo: non robusto ).

Le particolari statistiche di output (traccia di Pillai, ecc.) Suggeriscono che l'analisi originale è un esempio di MANOVA, che, come descritto da altri poster, è una procedura complicata e difficile da ottenere.

Immagino anche che, sulla base del MANOVA, e dell'uso di SPSS, questo sia un progetto di psicologia o sociologia ... se non lo è, per favore illumini. Potrebbe essere che altri modelli più semplici potrebbero effettivamente essere più facili da capire e più ripetibili. Consulta il tuo gruppo di consulenza statistica dell'università locale, se ne hai uno.

In bocca al lupo!