30 juli 2014

Twitters öppna API , bakgrundsvariabler och bristen på kontaktinformation

”Baksidan” av min datamängd med bakgrundsvariabler. Variablerna 1–10 är hämtade via Twitters öppna API, resten kodar jag manuellt.
Mitt avhandlingsprojekt handlar om hur journalister använder sociala medier. Hittills har jag analyserat surveydata från de svenska journalistundersökningarna. Under hösten kommer jag att gå vidare med en innehållsanalys av journalisters twittrande, och jag har just kodat färdigt mina bakgrundsvariabler.
     Mina bakgrundsvariabler hämtar jag från dels journalisternas egna presentationer på sina konton, dels den information som finns om varje konto. Antalet följare och följda, när kontot skapades, antal uppdateringar etc. All den här informationen är tillgänglig via Twitters öppna API, och på fackspråk heter det att man skördar (på engelska harvest) data när man låter ett specialprogram samla in den information man är intresserad av.
     Bakgrundsvariablerna behöver jag för att kunna analysera innehållet i de svenska journalisternas twittrande. Twittrar manliga journalister annorlunda än kvinnliga? Spelar det någon roll hur länge man haft sitt konto? Spelar det någon roll hur ofta man uppdaterar, alltså hur pass aktiv man är? Twittrar Stockholmsjournalisterna annorlunda än de som bor utanför tullarna? Twittrar public service-anställda annorlunda än kvällstidningsfolket eller frilansarna?
     Bakgrundsvariablerna är också väsentliga för att jag ska få en uppfattning om representativiteten i mitt urval. Genom att jämföra mina siffror med till exempel data från journalistundersökningarna kan jag se om urvalet har en rimlig fördelning vad gäller åtminstone kön och arbetsplats. Ju bättre överensstämmelse, desto mer vågar jag generalisera till en större population.

Jag hittar inte alla de bakgrundsvariabler jag vill ha om alla konton i mitt urval (2 543 journalistkonton). Ålder, till exempel – i mitt urval tror jag det är tre individer som talar om hur gamla eller rättare sagt unga de är, och några ytterligare som antyder att de nått pensionsåldern. Men jag hittar förvånansvärt mycket, framför allt när jag kodar innehållet i presentationerna manuellt:
  • De vanligaste arbetsplatserna är SR (14 procent), SVT (9) och kvällstidningarna (8). 26 procent anger inte arbetsplats.
  • 50 procent bor eller arbetar i Stockholm.
  • De beskriver sig själva i första hand som journalist (35 procent), reporter (15) eller redaktör (10).
  • Bara 6 procent har kontaktuppgifter (e-post eller telefon) i sin presentation.
Jag vet inte varför så få journalister har med kontaktinformation i sina Twitterpresentationer.  En rimlig förklaring är att det ju faktiskt går utmärkt att kontakta journalister på Twitter, och att en e-postadress eller ett telefonnummer därmed är ganska onödigt.


Relaterade inlägg: De tio vanligaste orden när svenska journalister beskriver sig själva på Twitter – läs listan här [140728], Journalisten på Twitter – så här ser hen ut [140729]

Inga kommentarer: