Tidligere arrangement:

Alternativer til statistikpakken SPSS – billigere og/eller bedre?

Arrangementet blev afholdt onsdag den 21. november, 2001.

V/ Associeret forsker, cand. psych., ph.d., Jan Ivanouw, Københavns Universitet, Institut for Folkesundhedsvidenskab.

– Omtale af en række forskellige programmer, incl priser og faciliteter. Henvisninger til hjemmesider med nærmere oplysninger.
– Demonstration af Simstat, S-PLUS og Pop-tools.

Vi bruger jo alle sammen SPSS når det drejer sig om databehandling. SPSS har jo nogle uomtvistelige fordele. Først og fremmest at det er standardprogrammet indenfor vores faglige område med omegn. Dvs. at man lettest kommunikerer med hinanden, herunder udveksler syntaksfiler og også får hjælp med problemer, når man bruger dette program

Der er imidlertid også nogle uomtvistelige problemer med programmet:
1. Først og fremmest er det forfærdeligt dyrt. Hvis man ikke er tilknyttet en organisation som har anskaffet det (og det vil vel mest sige en forsknings- eller uddannelsesinstitution), så er det vanskeligt at få adgang til SPSS. Selvom man er ansat i et firma og skal lave noget forskning der indebærer statistik, er det formentlig ret svært at få bevilling til et program i den prisklasse (man skal vel investere 45.000 for de moduler man har brug for, og det er så bare i navngivet bruger versionen, så man ikke en gang må låne maskinen til andre – en single-user version uden navngiven bruger er dyrere endnu). Tytte og jeg har haft den tvivlsomme fornøjelse på forskningskurser at vifte folk om næsen med alt det de har brug for SPSS til, og så fortælle hvor dyrt det er (underforstået at det kan de nok alligevel ikke få adgang til). Metodelærerne på Uni har haft en tilsvarende blandet fornøjelse med at lære en masse ivrige studerende hvordan man bruger SPSS, hvorefter deres licens udløber ved udgangen af semestret, og hvad koster bare en studentereversion af SPSS?.

2. Der er en del begrænsninger i SPSS. En er at det kan være svært at få grafikken til at makke ret, men det allersværeste er at der ikke er noget egentligt programmeringssprog. Ganske vist kan man komme lang med syntakssproget, men man kan ikke tildele værdier eller funktioner til variable, som man kan i ethvert almindeligt programmeringssprog. Man må være meget opfindsom og kreativ for at komme om ved en sådan begrænsning. En anden begrænsning er at det kan være svært at bruge outputtet fra SPSS til yderligere beregninger. Det mest lige for er at man skriver af (eller indkopierer) fra output. Hvis man f.eks. som jeg har skullet, skal bruge bare en simpel endorsementfrekvens fra 567 variable (fordelt på to køn), så er man på den. Eneste mulighed er et omfattende læse og tastearbejde. I modsætning til dette findes der programmer som kan bruge outsputtet som et nyt ‘objekt’ og arbejde videre med det.

Nå, der findes altså to typer alternativer til SPSS:
1. Billigere programmer
2. Programmer der kan noget mere.

Bedre: S-PLUS, (STATA), dedikerede programmer til bestemte formål (f.eks. RUMM og Digram til analyse af psykometriske Raschmodeller).
Billigere: Rene regnearksfunktioner, eksempelvis Excel som har den både fordel og ulempe at programmet løbende automatisk opdaterer resultater når man indtaster., Pop-Tools (et gratisprogram), Simstat (som er et betalingsprogram, men billigere end SPSS)

– Fordele og ulemper:
Billigere (og nogle steder bedre): Simstat: har mange gode funktioner, også funktioner der ikke findes i SPSS (bootstrap). Der er en scriptfunktion (=syntax). Der er en praktisk notesbogfunktion som output. Der er en vældig udmærket SimCalc, som kan beregne ud fra indtastede oplysninger som ikke behøver findes som enkeltcases (som i SPSS). Der er begrænsning på antal variable, og vist også på datahåndtering. Der er vist ikke en masse computemuligheder (og kan man lave simulationer?)

Bedre (og noget billigere): S-PLUS er et rigtigt velfungerende statistiskprogram. Det er objektorienteret. Output kan altid genanvendes. Der findes vældig mange funktioner, og findes de ikke, kan man selv lave dem, eller måske finde andre der har lavet dem. Pga. det objektorienterede er det meget enkelt at anvende. De komplicerede detaljer er ofte indbygget i objekterne, så man kan nøjes med at angive ganske få ‘argumenter’ til en funktion, også når det drejer sig om komplicerede forhold. Man kan definere forskellige ‘arbejdspladser’ til hvert projekt, og gemme de vinduer man har brug for samlet, og hente dem frem når man vil arbejde videre med dette projekt. Bagdelen er først og fremmest at dette sprog er så righoldigt at det kan tage en del tid at lære, og at man gerne må kende noget til matematik og statistik for at bruge det. Der er dog en grafisk brugerflade som kan gøre programmet tilgængeligt også for brugere der ikke har sådanne færdigheder. Der er en historiefunktion og en scriptfunktion, men der mangler en ganske enkel ‘paste’ funktion som i SPSS.

Absolut billigt og anderledes er Pop-tools, et gratis program som fungerer med (nogle versioner af) Excel. Det er stærkest i mere avancerede metoder, og kræver lidt viden om at håndtere regneark.

Efter foredraget er gratisversionen af Splus, programmet R, blevet det program som oftest anvendes inden for mange forskellige forskningsområder.