motoare de cautare si capacitatile lor

Recent faceam niste teste sa imi dau seama la ce costuri poate ajunge deschiderea unui nou motor de cautare. Am facut un scriptulet destul de simplu de crawl si o baza de date destul de complexa. Am indexat 500 de pagini in cateva minute si am ajuns la o baza de 20 MB. Dupa niste calcule simple am ajuns la concluzia, bineinteles nu neaparat corecta, ca ti-ar trebui cel putin 1000 TB pentru a indexa numarul de pagini indexate de cuil.com.

1000X250 euro = 250.000 de euro doar in hdd-uri. Aici nu sunt incluse masinile, banda si alte lucruri care sunt necesare. Oare cat spatiu foloseste google si cuil?

3 comentarii

  1. Draga domnule… google avea acum 1-2 ani in jur de 65.000 de servere, in prezent cred ca numarul lor s-a dublat.. mi se pare imposibil sa calculam cam cat spatiu foloseste Google :)

  2. Nu era ideia sa calculam ce spatiu foloseste Google, pe mine ma interesa in special cat folosea pentru motorul de cautare. Este adevarat ca google avea 65.000 de servere, dar unele erau pentru Gmail, altele Analytics, Youtube, Google Reader.
    Apoi ma gandesc la Cuil, care se pare ca au investit aproximativ 25 milioane de dolari in infrastructura. Cu adevarat ca sa incepi un motor de cautare iti trebuie o suma mare.

  3. Normal… sincer sa fiu, eu nu as mai incepe in prezent un motor de cautare pentru ca este o concurenta mare, foarte puternica.. practic indestructibila. Parerea mea…

Spune si tu parerea...