Score voor blogs en wat stats

Door dcm360 op woensdag 5 augustus 2009 18:08 - Reacties (6)
Categorie: Tweakblogs, Views: 2.160

Het is een tijdje stilgebleven rond mijn zoekmachine, maar achter de schermen zijn mijn scripts druk bezig geweest met een zo uitgebreid mogelijke index van alle tweakblogs te maken. Ondertussen is 95% van alle blogs geheel doorzoekbaar, en naar verwachting zijn overmorgen alle blogs op de meest recente na geÔndexeerd. Voor degegen die statistieken leuk vinden: dat zijn 1948 posts van 263 gebruikers :)

Maar nu zit ik nog wel met een klein probleempje, en dat is namelijk de volgorde van de resultaten. De soorteermethode die ik nu gebruik, sorteren op datum, werkt wel en zal ook wel voldoen, maar eigenlijk wil ik de mensen die veel moeite in hun blog stoppen veel liever op de eerste plaats zetten dan degene die toevallig als laatst was. Kortom, ik ga een poging doen om een post een score te geven...

En dan nu het allerleukste: degene die de score bepaalt ben jij! Huh, watte, moet ik nu iedere blog een score gaan geven? Nou nee, dat ook weer niet ;) Je kan me echter goed helpen door suggesties te geven hoe ik de formule in elkaar moet zetten, namelijk door aan te geven wat jij belangrijk vind aan een blog (helaas wel met als beperking dat een script het moet kunnen berekenen).

Als laatste moet in er wel even bij zeggen dat ik uiteindelijk bepaal hoe de formule er uit komt te zien, maar ik wel bereid ben om mijn mening niet geheel als uitgangspunt te nemen als jullie geheel anders denken.

Oja, vegeet ik het nog bijna, ik heb al een (voolopige) formule in elkaar geprutst. Hieronder staan er een paar grafiekjes van, maar houdt er rekening mee dat de gegevens slechts een steekproef zijn van 600 posts en de formule nog niet vast ligt!

De 10 posts met de minst hoge score
Resultaten posts oplopend

De 10 gebruikers met het laagste gemiddelde
Resulaten gebruikers oplopend

De 10 posts met de hoogste score
Resultaten posts aflopend
De score van de post van Sander is eigenlijk een klein foutje in mn formule, maar ik heb er even een deling (van meer dan 1.5) op toegepast om de rest nog ten opzichte van elkaar te kunnen vergelijken.

De 10 gebruikers het hoogste gemiddelde
Resultaten gebruikers aflopend
Nogmaals: het blijft onder voorbehoud.

En nu tijd om wat te eten :)

Volgende: Enkele foto's 08-'09 Enkele foto's
Volgende: Laatste keer 07-'09 Laatste keer

Reacties


Door Tweakers user Wiethoofd, woensdag 5 augustus 2009 18:13

Die Eerste 10 posts met Aflopende score zijn de 'hoogst gewaardeerde' posts of meest be-/gezochte?

Ik sta dan gewoon op 4 (of 3 als je die van sanderv66 niet meeneemt) :o

Door Tweakers user bobwarley, woensdag 5 augustus 2009 18:22

Woei, ik sta op nummer 1..Had niet anders verwacht. (met Pac-Man filmpje)

Als je het intelligent wilt doen, moet je van lezers hun forumpost-history opvragen (in de gallery). Die woorden link je vervolgens met blogposts. Komen in een blogpost veel woorden voor, die overeenkomen met topics waarin de user gepost heeft, dan heb je waarschijnlijk een match: voor een interessante blogpost voor die user.

[Reactie gewijzigd op woensdag 5 augustus 2009 18:24]


Door Tweakers user dcm360, woensdag 5 augustus 2009 18:35

Oplopend is gesorteerd met ASC in MySQL en aflopend met DESC. Dus degegen in de grafiek aflopend hebben de hoogste score ;) (ik verduidelijk het wel even)
En het is niet geheel het aantal views, het is mn voorlopige formule. Alleen bij de post van Sander is het aantal views geen bonus meer maar hoofdscore...

@Only.Holoris: Alleen jammer dat het het verkeerde grafiekje is ;) Maar ik moet wel toegeven dat het geen slechte score is gekeken naar de formule en jouw post :)
offtopic:
epic_fail kwam maar 2 keer voor in de steekproef, en ik vermoed dat over alle posts zijn gemiddelde negetief uitkomt wegens die min zoveel views op 1 bericht

[Reactie gewijzigd op woensdag 5 augustus 2009 18:50]


Door Tweakers user Lassie dutch, woensdag 5 augustus 2009 23:01

Kan je wellicht ook een zoekfunctie op datum inbouwen? Ik ben een aantal weken op vakantie geweest, en wil graag alle blogs even bekijken die ik gemist heb. Ik kan een heel stuk komen met de lijst die gewoon op tweakblogs.net staat, maar helaas gaat die niet ver genoeg terug.

Dus dat je bijvoorbeeld zoekt op * tussen datum A en datum B

Door Tweakers user sanderev66, donderdag 6 augustus 2009 22:27

Dat ik het hoogste sta bij "hoogste score" is voornamelijk dankzij:
http://www.geenstijl.nl/m..._kloopt_alqaida_kops.html

Wel ironisch gezien hetgeen wat er op die dag gebeurde...

Door Tweakers user dcm360, donderdag 6 augustus 2009 22:54

Dat verklaart het inderdaad :P
Normaal gesproken is de score voor pageviews bedoeld als bonus, alleen bij jouw post is het het overgrote deel geworden. Niet dat het zonder de pageviews meegerekend een slechte post is hoor ;) , maar ik denk dat ik er toch nog iets op moet verzinnen...

Reageren is niet meer mogelijk