Blijven verbeteren

Door dcm360 op dinsdag 7 juli 2009 21:45 - Reacties (10)
Categorie: Tweakblogs, Views: 2.168

De vorige update van mn zoekmachine is al weer een tijdje geleden (vergeleken met de tijd tussen de vorige updates), maar in de tussentijd heb ik niet stilgezeten. Naast het vele schoolwerk dat nog even aan het einde van het schooljaar langskomt heb ik toch nog wat tijd gevonden het een en ander te verbeteren :)

Weergave resultaten
Sommigen hebben het misschien al gezien omdat dit er al bijna een week in zit, maar toch zet ik het er even bij ;) Sinds vorige week staat er bovenaan de pagina met resultaten hoeveel resultaten er in totaal zijn, en onderaan kan je nu zowel naar de volgende als vorige pagina bladeren, of je kan klikken op de paginanummers die daar staan.

Uitzonderigen
Wat al enkele keren terugkwam was dat enkele woorden waar graag op gezocht werd te kort waren. Ik heb nu een uitzonderingenlijst ingebouwd waar ik heel erg belangrijke woorden kan toevoegen waar wel op gezocht kan worden. Dus, als je zoekt op een belangrijk woord en krijg je de melding dat dat woord te kort is, meld het even ;)

Een nieuwe spider
Met alleen de RSS feed ophalen liep ik nogal tegen wat beperkingen aan, dus het werd tijd om daar omheen te werken en wel met een nieuwe spider. Deze keer met volle moed aan de slag gegaan in PHP, met als resultaat dat de code verdacht veel op mn originele Delphi code lijkt :P
Maargoed, dat is allemaal niet voor niets want er zijn natuurlijk wel nieuwe functies bijgekomen:

Volledige inhoud van blogs
In de RSS-feed staat de inhoud van een blogpost tot de more-tag, maar nu pluk ik de volledige tekst uit de HTML-pagina. Hiermee wordt de kans dat een blogpost gevonden wordt natuurlijk groter :)

CategorieŽn
Toen ik toch bezig was, meteen maar lekker doorgegaan: het is vanaf vanavond ook mogelijk om op catergorie te zoeken. Dit kan door te klikken op 'Uitgebreid zoeken' en daar het veld categorie te gebruiken. Echt bruikbaar is het nog niet (zie ook uitleg verderop), maar er is een begin.

Reacties
Een suggestie die ook al eens voorbij kwam was of het misschien mogelijk gemaakt kon worden om in reacties te zoeken. Net als bij de categorieŽn is hier nog veel aan te verbeteren, maar ook hier is het begin er.

Aantal keer bekeken
Het aantal views van een blog wordt nu ook geÔndexeerd, alleen je hebt er nog niets aan :P Voor toekomstig gebruik dus ;)

Vertraging
Heej, wat is dit nu? Gaan we de NS achterna? Mwa, het ligt eraan hoe je het bekijkt :) Zoals ik hierboven als schreef is er nog veel te verbeteren aan de reacties en de categorieŽn, en dit zal grotendeels langzaamaan gebeuren. Met iedere 'standaard' update pakt het script vanaf nu ook enkele oude blogposts en vult daarvan aan wat ik nog niet had.

Een samenvatting:
Nieuw/verbeterd
- Verbeterde weergave resultaten
- De gehele tekst is nu doorzoekbaar,
- eveneens als de reacties
- en de categorieŽn
- Uitzonderigen van bepaalde woorden

Bekende foutjes
- De reacties en categorieŽn zijn bij lange na niet allemaal geÔndexeerd
- Kleuren invoervelden
- Kleine foutjes in de layout

En het resultaat :)

Zoals gewoonlijk, veel plezier en aarzel niet om te reageren ;)

Volgende: Laatste keer 07-'09 Laatste keer
Volgende: De webspider & het resultaat 07-'09 De webspider & het resultaat

Reacties



Door Tweakers user GrooV, dinsdag 7 juli 2009 22:08

Tja, leuk idee maar gaat t.net dit niet maken?

Zij hebben namelijk al een zoekmachine en gewoon de database wat het allemaal iets makkelijker maakt om te maken ;)

Door Tweakers user DonJunior, dinsdag 7 juli 2009 22:10

@GrooV: Hoogstwaarschijnlijk is dit gewoon een persoonlijk project om zelf wat dieper in de stof te komen. Dus gewoon voor eigen gebruik. (en de medemens die er natuurlijk ook gebruik van wilt maken)


Ik vind het vet dat je al zoveel voor elkaar hebt gekregen, hulde!

Door Tweakers user dcm360, dinsdag 7 juli 2009 22:13

@himlims_: net als de link in jouw blog :)

@GrooV: Zover ik weet heeft t.net er wegens tijdgebrek nog geen concrete plannen voor, en tot die tijd kan ik me hiermee vermaken :P

@DonJunior: idd ook wel voor eigen gebruik. Zo af en toe zakt mn kennis van PHP en MySQL weer wat weg en dan is zon projectje handig om er weer goed in te komen. En om erbij te leren, morgen maar eens naar de bieb voor een boek over MySQL, want er is veel meer uit te halen dan ik nu doe.

[Reactie gewijzigd op dinsdag 7 juli 2009 22:16]


Door Tweakers user himlims_, dinsdag 7 juli 2009 22:36

offtopic.
er schort nogal wat aan de blog functie;
- niet kunnen zoeken
- / me werk half
- niet versoenlijk 'bladeren' door blogs (lijkt beperkt tot recentelijke bijdragen)
- geplaatste reacties kunnen niet bewerkt worden
- reageren op een reactie niet (gemakkelijk) mogelijk
- ontbreken enkele standaard functies die je wel hebt als je nieuw topic start (van die ubb functie knopjes)
etc.

[Reactie gewijzigd op dinsdag 7 juli 2009 22:46]


Door Tweakers user dcm360, dinsdag 7 juli 2009 22:40

Maak er een mooi verhaal van en plaats het in lieve devvers zou ik zeggen, daar maak je denk ik meer kans dan hier ;)

Door Tweakers user Calamor, dinsdag 7 juli 2009 22:53

Ik heb nog een bug gevonden. Als je een tekort woord geeft staat onder aan nog steeds de melding. Ook al heb je er na andere zoek opdrachten gedaan.

Nu je het zegt.
Ik zocht op "EVE" en toen op "EVE onine". Zonder "EVE" is de melding weg.

[img=100,75,,,"Zoek error"]http://tweakers.net/ext/f/ksIiCPs68qFApuwfCWqYqkpE/thumb.jpg[/img]

[Reactie gewijzigd op dinsdag 7 juli 2009 23:07]


Door Tweakers user dcm360, dinsdag 7 juli 2009 22:59

Screenshot misschien? (met adresbalk). Net even geprobeerd door eerst te zoeken op asp (komt in de uitzonderingenlijst) en daarna op Coltrui, maar bij die laatste kreeg ik geen melding..
Het zou alleen mogelijk kunnen zijn als je het te korte zoekwoord alsnog meestuurd namelijk. De code kijkt toch alleen naar de variabelen die in de adresbalk meegegeven worden...

Door Tweakers user Pjerry, woensdag 8 juli 2009 03:00

Hulde doet het heel leuk.
Kleine woordjes is zoals je al aangaf nog een probleem. Bijv. D40 kon hij niet vinden, maar Nikon weer wel. Zo'n lijst aanleggen lijkt mij ondoenlijk en erg omslachtig, die lijst is nl. nooit af. Als alternatief zou je natuurlijk je zoekalgoritme aan kunnen passen, maar dat gaat dan natuurlijk weer ten kosten van de gigantische snelheid die je nu haalt.

Vroeger heb ik zelf ook nog wel eens een zoekalgoritme geschreven. Daarin hield ik zelfs rekening met letteromwisseling e.d. fouten die heel erg veel gemaakt worden, ook kon je gebruik maken van * en ?, maar zoals ik al zei ook dat gaat ten kosten van de snelheid.

Wat ik jammer vind is dat ik niet kan zoeken op de headers. Als ik Pjerry intyp, zou ik graag ook alle reacties zien die ik in blogs heb gegeven. Nu vindt het programmaatje alleen Pjerry in de tekst en Pjerry in de Blog-starts.

Het zijn wat ideeŽn, voor de rest niets dan lof.

Door Tweakers user dcm360, woensdag 8 juli 2009 10:01

Wat ik jammer vind is dat ik niet kan zoeken op de headers. Als ik Pjerry intyp, zou ik graag ook alle reacties zien die ik in blogs heb gegeven. Nu vindt het programmaatje alleen Pjerry in de tekst en Pjerry in de Blog-starts.
Komt vanzelf ;) De hoeveelheid reacties in mn database groeit nog gestaag door, dus na verloop van tijd zijn jouw reacties ook te vinden.
Vroeger heb ik zelf ook nog wel eens een zoekalgoritme geschreven. Daarin hield ik zelfs rekening met letteromwisseling e.d. fouten die heel erg veel gemaakt worden, ook kon je gebruik maken van * en ?, maar zoals ik al zei ook dat gaat ten kosten van de snelheid.
Je zou eens % ipv * kunnen proberen en _ ipv ?. Geen garantie dat het blijft werken (omdat het eigenlijk goed fout is dat die twee nog werken), maar nu werkt het als het goed is wel :)

Reageren is niet meer mogelijk