Statistikksentralen/Feilkilder og statistiske problemer
Fra Diskusjon.no WIKI
Som all annen statistikk er ikke forumstatistikken uten feilkilder og problemer. Før du gjør tolkninger av tallmaterialet som blir presentert, kan det være en fordel om du leser og setter deg litt inn i hvordan disse tallene er blitt til.
Kategoristrukturen dominerer
Forumet bruker en database der absolutt alt lagres. Problemet med denne databasen er at den ikke kan "huske" hvordan forumstrukturen med alle kategoriene var lagt opp før i tiden, eller eksempelvis hvilken kategori en tråd opprinnelig ble postet i. Opp igjennom forumhistorien har det vært veldig store endringer i forumstrukturen. Dette skaper problemer når man i ettertid lager statistikk over tråder og innlegg for kategoriene på forumet, for det blir ikke tatt hensyn til:
- Kategorier som får nytt navn og bruksområder - Kategorier får nye navn, og av og til nye bruksområder. Kategorien "Annet om maskinvare" kan ha blitt brukt til både skrivere, tastatur, kabinetter og hva ikke annet, uten at dette er tatt med i beregningene.
- Kategorier som slås sammen - Har to kategorier blitt slått sammen vil den nye kategorier se større ut enn hva den faktisk var. Samtidig så har det jo forsvunnet to kategorier uten at rankinglistene fanger opp dette.
- Kategorier som deles opp - Kategorier som var store og populære kan ha blitt delt opp i mindre kategorier, hvilket betyr at de faller lengre ned på rankinglista enn hva den reelle aktiviteten som var i den opprinnelige kategorien skulle tilsi.
- Kategorier som slettes - I tilfeller kategorier har blitt slettet, har trådene enten blitt flyttet til en annen kategori, eller fordelt utover på mer egnede kategorier. Det kan bety at kategorier som faktisk var ganske populære for lenge siden, ikke engang er med på rankinglista.
Så ut fra dette kan vi si at statistikken viser riktig når det gjelder antall tråder og innlegg som ble postet. Men ikke hvor de ble postet, eller hvordan forumstrukturen så ut på den tiden de ble postet. Tallmaterialet for Statistikksentralen ble hentet ut i slutten av juli 2009, og desto lengre tilbake i tid man beveger seg, desto mer misvisende blir rankinglistene i forhold til kategoristrukturen.
Rankinglistene
I rankinglistene kan man se hvordan en kategori har klatret eller falt på top 25-lista under "Endring plassering". Det er også regnet ut hvor stor endring kategorien har sett i prosent fra forrige år. Observante sjeler oppdager kanskje at enkelte kategorier har noen enormt store tall her. Noen kategorier klatrer plutselig over 100 plasser oppover, eller øker med over 20 000% (tyve tusen prosent)! Som nevnt i forrige avsnitt, så "husker" ikke forumdatabasen hvordan forumstrukturen var før i tiden, eller når en ny kategori ble opprettet. Det betyr at vi bare må anta at kategorien ble opprettet samme dato og tidspunkt som det tidligste innlegget som finnes i kategorien. Men dette trenger ikke å være tilfellet.
Eksempel (med fiktive tall)
La oss ta PC-spillet Half-Life som et eksempel. I tiden før Half-Life ble utgitt, ble det postet masse tråder og innlegg om spillet. Etter en stund så man at aktiviteten var så stor at det var på tide med en egen kategori. Deretter ble alle Half-Life-trådene flyttet til Half-Life-kategorien. Men for eksemplets skyld, kan vi tenke oss at de første Half-Life-trådene ble opprettet i desember 2003. La oss si at det ble postet 4 Half-Life-tråder desember 2003, men i løpet av hele 2004 ble det postet 2000 Half-Life-tråder, og at Half-Life-kategorien ble opprettet høsten 2004. Men siden trådene fra 2003 har blitt flyttet til Half-Life-kategorien, så blir det i statistikken regnet som om Half-Life-kategorien har eksistert i hele 2003. Vi får derfor følgende tallmateriale:
- 2003: 4 tråder
- 2004: 2000 tråder
Om vi regner dette i prosent får vi 4/2000 = 50 000%. Om eksemplet med Half-Life-kategorien hadde vært reelt, så hadde det altså i rankinglista stått at Half-Life-kategorien hadde økt med 50 000% siden 2003, noe som egentlig ikke er sant siden kategorien (i eksemplet) ikke ble opprettet før høsten 2004. Tallene viser kanskje hvordan posthistorikken har utviklet seg, men den blir påvirket i alt for stor grad av kalenderen. Dette problemer gjelder både nye innlegg, nye tråder og modereringstatistikken.
I tilfeller der det ikke finnes tråder eller moderatorhandlinger fra året før i en kategori, står det Ny på rankinglistene.
Moderering
I statistikken for moderering finner man antall moderatorhandlinger, advarselsøkninger og advarselssenkninger. Men hva er dette?
Moderatorhandlinger
Moderatorhandlinger omfatter blant annet flytting, sletting, deling, skjuling og godkjenning av tråder og innlegg, bruk av automoderasjon, advarsler og utestengelser. Kort og godt: De innebygde moderatorverktøyene i forumprogramvaren. Mye av moderatorarbeidet er også holdningsskapende og forebyggende arbeid som i stor grad dreier seg om kontakt med brukerne via PM/melding. Denne typen moderatorarbeid er den mest tidkrevende, men den blir heller ikke fanget opp av modereringsstatistikken! Antall moderatorhandlinger kan derfor gi et skjevt bilde av hvor mye arbeid moderatorene i realiteten gjør.
Advarselsøkninger og -senkninger
Advarselsøkning betyr økning av en brukers advarselsnivå, eller utestengelse. Tilsvarende betyr advarselssenking at en brukers advarselsnivå har blitt senket, men det betyr ikke at en utestengelse har opphørt. Utestengelser opphører automatisk etter angitt tid, uten at det samtidig fører til en advarselssenkning. Systemet (scriptet) som automatisk senker advarselsnivå er blitt tatt med i denne statistikken siden advarselssenkningen blir registrert hos moderatoren som kjørte scriptet.
