Ontvang nieuwsbrief:  12319 leden Zet de zoekwekker - Bookmark dit  - Contact - Wie?
Terug naar het nieuws
Terug naar beginscherm 

 

Doorzoek Nieuwsgroepen (NL)

Wat is je favoriete Nederlandse zoekmachine?
abc-xyz.nl  
AltaVista NL
Ilse
All The Web  
Yahoo
Voelspriet.nl  
Staat er niet bij  
 Klik HIER om mee te doen

advertentie


 



voor experts.  Dit artikel richt zich op zoekprofessionals

VIJF VRAGEN AAN TRACK

WiseGuys onderhoudt de software en de achterliggende database van Track. We spraken met Frank Scheelen, technisch eindverantwoordelijk voor de zoekmachine.

1. De omvang van de index van Track is een stuk kleiner geworden. Is dat bewust gedaan?


Frank Scheelen: Ja en nee. Gedeeltelijk vloeit het voort uit een herbezinning op de sites die in de oude database zaten (d.w.z. de database zoals deze vandaag voor de laatste dag bij Track draait).

Zoals je wellicht opgemerkt hebt is deze nogal vervuild geraakt met buitenlandse pagina's. Tijdens onze schoonmaakbeurt is de database in omvang afgenomen.

Een gedeelte heeft er ook mee te maken dat de nieuwe zoekmachine ietwat andere eisen stelt dan de oude voordat hij een pagina opneemt in de index. Zo kan het gebeuren dat hij pagina's weigert die vroeger
werden opgenomen.

Overigens werken we er hard aan om de database zo compleet mogelijk te krijgen. Zoals je wellicht gemerkt hebt zit jouw eigen site voelspriet.nl er nog niet in; dit geldt ook voor andere interessante sites. Uiteraard is dit niet de bedoeling, en we beschouwen het vooralsnog als kinderziektes die zo snel mogelijk verholpen moeten
worden.

Ik heb me persoonlijk altijd een beetje gestoord aan de gewoonte van
de media om zoekmachines te beoordelen op aantallen
pagina's. Tenslotte gaat het er niet om of je nu 50.000 of 80.000
resultaten terugkrijgt, maar of de gezochte resultaten op de eerste
pagina staan.

Wij gooien tijdens het indexeren letterlijk miljoenen(!) pagina's
weg omdat ze te klein zijn, teveel rotzooi bevatten, of teveel lijken
op andere pagina's. Dit komt de grootte van de database niet ten
goede, maar wel de kwaliteit.

2. Hoe gaan jullie om met nieuwe opgaven van websites? Worden die ook medegeïndexeerd op basis van het aantal links dat naar de site loopt?

Frank Scheelen: Er spelen hier twee dingen: spidering en indexering/zoeken. Momenteel wordt linkpopulariteit niet gebruikt tijdens spidering. Dit gaat in de nabije toekomst veranderen. Bij
het indexeren en het zoeken wordt linkpopulariteit zoveel mogelijk
gebruikt.  Dit heeft uiteraard tot gevolg dat nieuwe sites, die nog
niet zoveel gelinkt worden, aanvankelijk slechter zullen scoren, maar
dat lijkt ons fair.

3. Welke techniek gebruiken jullie? Eigen techniek? Samenwerking met een partner? HTML-based?

Frank Scheelen: Simpel gesteld kijken we in plaats van alleen naar de inhoud van de pagina's ook naar de verwijzingen tussen pagina's.

Alle techniek is door WiseGuys ontwikkeld. In het totaal zit er een paar manjaar aan ontwikkeltijd in, en dit is inmiddels de derde grote zoekmachine die door ons team ontwikkeld is.

4. Hoeveel sites spidert Track Nieuwe stijl ongeveer per dag? Hoe
groot is de database (aantal websites c.q. aantal pagina's) in de
nieuwe situatie en vroeger?


Frank Scheelen: Bij Track verandert vooralsnog alleen de indexeer- en zoeksoftware. Het spideren gebeurt op dit moment nog met dezelfde spiders die WiseGuys al langer gebruikt voor het vullen van de Track database.
 
Op dit moment is de strategie nog om periodiek een nieuwe kopie van
het Nederlands deel van het web te maken. Hierdoor garandeer je dat je database vers is en weinig kapotte links bevat. Om dit te kunnen doen moet je gedurende een korte tijd vrij intensief spideren. Ons
spidersysteem zijn hier alleszins toe in staat. De net-etiquette
gebiedt ons echter een beetje rustig aan te doen. Daarom beperken
we tijdens tot zo'n 5 miljoen documenten per dag. Met die snelheid slurp je het Nederlandse deel van het web in drie tot vier dagen binnen.

Binnen nu en een maand nemen we een nieuwe spiderengine in gebruik. Linkpopulariteit zal dan ook bij de spider meewegen en bepalen welke pagina's aan een nieuw bezoekje toe zijn. Dit zal voor de eindgebruiker niet zo duidelijk zijn, en daarom zoeken we er ook geen media-aandacht voor.  Overigens verwachten we dat dit nieuwe systeem ook voor de zoekresultaten positieve gevolgen zal hebben.

5. Wat heeft je doen besluiten de nieuwe zoekmachine op dezelfde dag te introduceren als de nieuwe dienst van Ilse?


Frank Scheelen: Hier kan ik weinig over zeggen, aangezien dit een beslissing is van Track. 
 

BRONVERMELDING

Noot voor de media en websites. Gratis overnemen van het nieuws kan zonder toestemming vooraf. Maar noem ons wanneer U onze informatie substantieel gebruikt. Kies a.u.b. uit een van de twee omschrijvingen:
bron: www.voelspriet.nl  of zie ook: http://www.voelspriet.nl/nieuws.htm  


TIPS

Heeft U zelf tips over Nederlandse of buitenlandse zoekmachines? Stuur een tip.


KENT U ONZE NIEUWSBRIEF?

JA ik meld me aan voor de tweewekelijkse nieuwsbrief met daarin zoeknieuws, zoektips en zoekvragen met antwoorden. Start uw e-mailsoftware niet? Gebruik dan een formulier om U aan te melden en vermeld "Stuur mij de nieuwsbrief"