Google's wisselende indexgrootte
Bij het onderzoek van Maurice de Kunder naar de grootte van het World naar Wide Web, is ook een schatting gemaakt van de grootte van Google's index op 25 tot 45 miljard webpagina's. Met de vermelding dat de grootte per dag verschillend is. Hier mijn poging om dat getal wat nauwkeuriger te bepalen.
Na wat zoeken en proberen kwam ik erachter dat je met het vraagteken in een zoekopdracht woorden met een willekeurig karakter kunt aanvullen. Helaas geeft een zoekopdracht met alleen een vraagteken geen resultaat, maar met een beperking tot een domein werkt het wel. Bijvoorbeeld om te zoeken naar alles van .com domeinen gebruik je de zoekopdracht ? site:.com
.
Toen heb ik een programmaatje geschreven dat zo'n zoekopdracht uitvoert voor elk bestaand top-level domein en het aantal hits uit de pagina filtert. Als je dan de resultaten van al deze zoekopdrachten optelt kom je nu uit op een totaal van 35.430.687.760 pagina's, midden in het geschatte bereik van 25 - 45 miljard.
Overigens was het resultaat gisteren 32,8 miljard dus ook hier geldt dat in het verleden behaalde resultaten geen garantie bieden voor de toekomst. Dit wisselende resultaat zag ik al eerder toen ik een periode bijhield hoeveel hits een zoekopdracht voor 'fileventiel' opleverde