1 augusti 2014

Idag bjuder jag på data!

Idag bjuder jag inte på några siffror från min datamängd med bakgrundsvariabler. Istället bjuder jag på lite data så att den som vill kan ta fram sina egna siffror.

För nedladdning (.xlsx): Frekvensordlista
 
Datamängden består av en excel-fil med de 350 vanligaste orden i svenska journalisters presentationer på Twitter. Det är samtliga ord i urvalet som förekommer tio gånger eller fler. Urvalet är en korpus om 29 288 ord i 2 543 presentationer.
     Det är fritt för alla att använda datamängden. Gör något roligt! Eller något intressant! Eftersom detta är en del av en unik datamängd (och eftersom jag undervisar och handleder studenter bland annat i hur man redovisar data på ett bra sätt) gäller följande:
  • Den som använder data och publicerar egna siffror ska tala om var datamängden kommer ifrån. Credda mig, helt enkelt.
  • Den som gör tabeller eller grafer ska ange urvalets storlek och aktuella N-tal.
  • Den som grovt misstolkar data kommer att få bakläxa.
  • Den som gör en grovt missvisande eller teoretiskt inte underbyggd analys kommer att bli tillrättavisad.
Jag länkar gärna till material som bygger på frekvensordlistan, så hör gärna av er om ni publicerar något!


Relaterat inlägg: De tio vanligaste orden när svenska journalister beskriver sig själva på Twitter – läs listan här [140728]

Inga kommentarer: