Historia Google, czyli jak powstała najpopularniejsza wyszukiwarka na świecie?
W dzisiejszym wpisie chciałbym przedstawić historię powstania wyszukiwarki Google. Warto wiedzieć, że Internet bardzo szybko zamienił się w informacyjny ocean, z którego trudno było wyłowić wartościowe treści. Potrzebne było narzędzie, które to umożliwi.
W 1993 r. Internet i strony www zbliżyły się do zwykłych ludzi za sprawą programu Mosaic, pierwszej graficznej przeglądarki umożliwiającej oglądanie elektronicznych dokumentów w sposób łatwy i przystępny oraz bezproblemowe przenoszenie się między nimi, czyli surfowanie.
Historia powstania katalogu Yahoo
Jerry Yang i David Filo, doktoranci ze Stanford University, zauważyli, że wędrówki po małym jeszcze świecie WWW będą łatwiejsze, gdy stworzy się katalog witryn, które warto obejrzeć. Napisali więc odpowiednie oprogramowanie, początkowo na własny użytek, żeby nie zapominać najciekawszych miejsc, jakie odwiedzili w sieci. Swój produkt opublikowali w 1994 r. w Internecie.
Bez żadnej kampanii promocyjnej, po kilkudziesięciu dniach, z katalogu Yanga i Filo zaczęli korzystać internauci z całego świata, a liczba odwiedzających podwajała się co miesiąc. W 1995 r. nie było już wątpliwości, że „domowy” pomysł dwóch znudzonych studentów okazał się receptą na poważny biznes.
W efekcie powstał Yahoo – pierwszy portal internetowy, do dziś największy na świecie.
Informacyjna powódź
Zasoby Internetu szybko się powiększały. W 1995 r. było już 10 mln witryn, a tempo ich przyrostu wynosiło wówczas 2000 proc rocznie. To o wiele szybciej niż zdolność jakiegokolwiek zespołu redakcyjnego do porządkowania rozlewającego się oceanu informacji.
Potrzebne były nowe rozwiązania.
Zbliżała się wielka zmiana w sposobie korzystania z sieci, którą najlepiej opisuje John Battelle w książce „Szukaj”. Jak Google i konkurencja wywołali biznesową i kulturową rewolucję? Przytaczając słowa Filo: „Internauci przechodzili z etapu eksploracji (Co tam jest?) do etapu oczekiwań (Chcę znaleźć coś, co na pewno tam jest)”. Narzędziem, które miało umożliwić to przejście, stała się wyszukiwarka.
Co to jest wyszukiwarka internetowa?
Wyszukiwarka internetowa, czyli oprogramowanie umożliwiające znalezienie informacji w dużym zbiorze danych, była w połowie lat 90-tych rozwiązaniem dobrze znanym. Takie funkcje oferują wszystkie bazy danych (np. e-mailowa książka adresowa).
Również w Internecie pierwsze wyszukiwarki pojawiły się jeszcze przed powstaniem WWW i miały za zadanie ułatwić naukowcom docieranie do różnych dokumentów. Programy takie jak Archie i Veronica, popularne na początku lat 90-tych, ułatwiały przeszukiwanie na podstawie tytułów dokumentów. Nie musiały borykać się z problemem informacyjnej powodzi, która zalała sieć kilka lat później.
Odpowiedzią na ten problem był wynalazek programów robotów (zwanych też pająkami), które poruszają się po internetowej pajęczynie w poszukiwaniu nowych witryn. Z odkrytych przez pająka witryn tworzony jest indeks, czyli baza danych, w której internauta może poszukiwać informacji.
Szybko wyszło na jaw, że pająki rzeczywiście ułatwiają pogoń za rosnącą ilością stron WWW. Powstał nowy problem – liczby odpowiedzi na zadane pytanie.
Jak znaleźć właściwą odpowiedź na pytanie w internecie?
W małej bazie danych odpowiedzi jest niewiele i można łatwo sprawdzić, o którą informację nam chodziło. Co zrobić, gdy indeks zawiera miliony dokumentów z miliardami wyrazów? Na najprostsze pytanie wyszukiwarka tworzy listę zawierającą tysiące odpowiedzi, w których nie sposób odnaleźć najwartościowszą.
Wiele zespołów na uczelniach i w ośrodkach badawczych firm podjęło się stworzenia wyszukiwarki doskonałej. Czyli takiej, która na pytanie internauty tworzyłaby listę odpowiedzi uporządkowaną pod względem adekwatności poszukiwanej informacji. W rezultacie powstały takie rozwiązania jak Lycos, Excite, Inktomi czy AltaVista. Czy rzeczywiście rozwiązywały problem?
Smog informacyjny
W grudniu 1998 r. prof. Ryszard Tadeusiewicz, znakomity polski informatyk, sformułował koncepcję „smogu informacyjnego”, duszącego nadmiar danych, który stwarza zagrożenie dla sieciowej cywilizacji: „Na każde zapytanie skierowane do systemów wyszukiwania otrzymuje się – obok kilku sensownych i użytecznych odpowiedzi – kilkadziesiąt lub kilkaset wskazań nieadekwatnych, nonsensownych albo (w najgorszym przypadku) celowo nieprawdziwych i mylących”.
Stanfordzki patent – powstanie wyszukiwarki Google
W tym samym 1998 r. światło dzienne ujrzała nowa wyszukiwarka, owoc kilkuletnich prac badawczych dwóch doktorantów ze Stanford University. Larry Page i Sergey Brin, mający naukowców w rodzinie, zainspirowali się sposobem, w jaki uczeni rozwiązują kwestię oceny jakości publikacji badawczych.
O randze artykułu decyduje tytuł czasopisma oraz liczba cytowań. Akademik, gdy ma do wyboru sto publikacji na interesujący go temat, najpierw czyta te z najlepszych tytułów i na dodatek najczęściej cytowane. Czy podobnej metody nie można zastosować do stron WWW?
Idea Page’a i Brina jest dosyć prosta. Podczas indeksowania witryn sprawdzana jest liczba odnośników (linków) z innych witryn prowadzących do poszczególnych stron. Jednocześnie analizowany jest też ciężar gatunkowy tych odnośników.
W metodzie tej mierzone jest społeczne uznanie dla poszczególnych witryn, którego najlepszym miernikiem są odpowiedniki cytowań w nauce, czyli właśnie odnośniki (linki). Witryna, która ma najwyższe notowania, w tym swoistym rankingu wysuwa się na pierwsze miejsce w wynikach wyszukiwania.
Algorytm wyszukiwarki Google jest dynamicznie rozwijany i aktualizowany. Do dziś przywiązuje dużą uwagę do wysokiej jakości linków pochodzących za stron tematycznych, blogów, for internetowych, czy domen rządowych.
Idea powstania wyszukiwarki Google powinna być przydatna dla wszystkich właścicieli stron i specjalistów zajmujących się SEO i pozycjonowaniem stron www.
Google, bo tak Page i Brin nazwali swoją wyszukiwarkę, błyskawicznie zdobyła uznanie, choć początkowo jej autorzy w ogóle się o to nie starali.
Popularność wyszukiwarki Google
Każdy, kto raz skorzystał z Google, odkrywał, że znalazł wyjście z oparów informacyjnego smogu. Rozpoczęła się jedna z najbardziej fascynujących historii nie tylko w dziejach Internetu, ale kapitalizmu w ogóle. Utworzona przez dwóch studentów wyszukiwarka szybko zdominowała rynek i dziś obsługuje połowę poszukiwań (ciągle rośnie), jakie prowadzą internauci w sieci.
By sprostać potrzebom, Google korzysta z olbrzymiej infrastruktury informatycznej składającej się z setek tysięcy komputerów (zaplecze techniczne Google to w tej chwili najprawdopodobniej największy system informatyczny na świecie). Firma przeżyła najpierw załamanie rynku nowych technologii 2000-2002 i w 2004 r. weszła przebojem na giełdę, zapowiadając nową hossę. Dziś wartość giełdowa Google oscyluje wokół 165 mld dol.
Niebezpieczna utopia? Google News
Ambicje twórców Google nie kończą się na stronach WWW, ich celem jest udostępnienie w sieci wszelkiej możliwej informacji. Stąd liczne kolejne usługi, które nie zawsze spotykają się z życzliwą reakcją. Gdy więc Google stwierdził, że stworzy Google News, serwis zbierający informacje z internetowych wydań gazet, część wydawców prasy zaprotestowała. Uznali oni bowiem, że wyszukiwarka bezprawnie pasożytuje na treści wytwarzanej za ciężkie pieniądze i wielkim wysiłkiem przez redakcje po to, by sprzedawać przy okazji reklamy.
Sąd przyznał belgijskim wydawcom rację, nakazując usunięcie z serwisu Google News treści należących do tych redakcji, które sobie tego nie życzą i zapłacenie odszkodowań. Podobną reakcję wydawców książek wywołał projekt GooglePrint. W ramach porozumienia z największymi amerykańskimi bibliotekami Google chciał zeskanować miliony książek (docelowo wszystkie dostępne) i umożliwić ich przeszukiwanie.
Jeśli interesujące nas treści znajduje się w książce, na którą wygasły prawa autorskie, można by ją legalnie skopiować. Gdy te prawa ciągle obowiązują, można by przynajmniej poznać fragment i szczegóły bibliograficzne. Wielu wydawców się nie zgodziło, widząc w projekcie Google zagrożenie dla własnych interesów.
Google właścicielem YouTube
Google w 2006 roku kupił najpopularniejszy internetowy serwis wideo YouTube. Rozpoczęła się batalia prawna z producentami filmów, którzy oskarżają YouTube (a więc i Google) o piractwo i oczekują odszkodowań.
Kontrowersje wzbudza także „polityka międzynarodowa” firmy, zwłaszcza wobec tak obiecujących rynków jak chiński. W zamian za możliwość świadczenia usług w Chinach Google zgodził się na cenzurowanie wyników wyszukiwania, tak by chińscy internauci nie trafili na treści zakazane (np. witryny o demokracji lub prawach człowieka).
Czy twórcy Google zdołają zrealizować utopię totalnego zbioru informacji z łatwym do nich dostępem dla każdego? Jaka będzie cena realizacji takiego projektu? Przedsmakiem zagrożeń była wielka wpadka serwisu AOL, który latem 2006 r. upublicznił informacje dotyczące m.in. pytań, jakie wpisywały do wyszukiwarki setki tysięcy użytkowników. Przy odrobinie wysiłku można było zidentyfikować pytających. A internauci pytali „swój serwis” nawet o to, jak zabić żonę.
Sposób zbierania danych i ich późniejszego wykorzystania zależy od wewnętrznej polityki wyszukiwarek (i szerzej, operatorów Internetu) oraz od regulacji prawnych.
Google wsławił się, odmawiając udostępnienia informacji ze swojej wyszukiwarki departamentowi sprawiedliwości USA, który przygotowywał argumenty za ustawą mającą wprowadzić cenzurę obyczajową w sieci.