В это уже сложно поверить, но раньше люди не могли гуглить по вполне понятной причине — Google ещё не было. Рассказываем, как появились поисковые системы, что значит песня группы «Сплин» и при чём тут сериал «Ривердэйл».
Представьте себе, что вы переместились назад во времени, попали в девяностые и вам срочно нужно найти что-то очень важное в интернете. Сможете ли вы это сделать? Зависит от года, в котором вы оказались.
1990
В начале девяностых у пользователей интернета ещё не было привычки задавать вопросы поисковым системам. Ссылки на полезные сайты буквально передавали из рук в руки: ими делились со знакомыми, сохраняли их в отдельных текстовых файлах.
Но в 1990 году уже появилась первая в мире компьютерная программа для поиска в интернете. Её зовут Арчи (Archie), но это не столько имя, сколько сокращение от слова archive («архив»).
Создатели Арчи — Алан Эмтег, Билл Хилан и Питер Дойч, студенты, изучавшие информатику в университете Макгилла в Монреале (Канада). Сами того не зная, они положили начало многомиллиардной индустрии. Сам Эмтег вспоминал об этом так:
Я написал кусок кода, который заложил основу для многомиллиардной индустрии. В то время интернет не был бизнесом, и мы не стали патентовать Archie. На этом можно было заработать, но я не стал так делать, и совершенно об этом не жалею.
Арчи был ещё не поисковой системой, а просто программой, которая скачивает списки файлов со всех доступных серверов и строит базу данных с поиском по именам этих файлов. Эта программа не умела индексировать содержимое файлов, но для 1990 года это не было страшно. Объём данных пока был настолько мал, что всё можно было найти и вручную.
1991-1992
В 1991 году Марк Маккэхил из университета Миннесоты создал новый сетевой протокол — Gopher. Сетевые протоколы — наборы правил и действий, позволяющие устройствам в сети обмениваться информацией. Протокол Gopher позволял быстро искать информацию, потому что состоял из вложенных друг в друга каталогов — как папки в компьютере.
Вскоре на его базе появились две новые поисковые программы — Вероника (Veronica — Very Easy Rodent-Oriented Net-wide Index to Computerized Archives) и Джагхед (Jughead — Jonzy’s Universal Gopher Hierarchy Excavation And Display). Раз уж первую программу назвали Арчи, этим двум дали имена в честь персонажей из одноимённых комиксов. Кстати, именно на этих комиксах основан современный сериал «Ривердэйл».
Вероника позволяла выполнять поиск по ключевым словам почти всех заголовков в списках Gopher. А Джагхед извлекал информацию о меню от определённых Gopher-серверов. Но ни одной полноценной системы для поиска в вебе пока так и не появилось.
1993
В начале 1990-х годов появились целые сайты-каталоги для хранения ссылок — рубрикаторы на них заполнялись вручную. В их числе, например, Yahoo! и Virtual Library (VLib), который вёл на сервере CERN изобретатель современного интернета Тим Бернерс-Ли.
В 1993 году Оскар Нирштрасс из Женевского университета написал cценарии на языке программирования Perl, которые копировали эти страницы и переписывали в стандартный формат. На их основе он и создал первую примитивную поисковую систему W3catalog.
Эта система ещё не умела сканировать все сайты подряд, она использовала составленные вручную списки веб-ресурсов.
В том же году появился первый поисковый робот, написанный на языке Perl, — World Wide Web Wanderer. Этот бот от Мэтью Грэя из Массачусетского технологического института создавал Wandex — первую систему с поиском прямо по веб-сайтам (в интернете их тогда было чуть больше 600).
В 1993 году появилась и вторая поисковая система — Aliweb. Она не использовала поискового робота, а вместо этого ждала уведомлений от администраторов веб-сайтов о наличии на их сайтах индексного файла в определённом формате.
1994-1996
Первая полнотекстовая поисковая система, индексирующая ресурсы при помощи робота, — WebCrawler (1994 год). Он первым в мире позволил искать по любым словам, расположенным на любых сайтах. Кстати, WebCrawler работает до сих пор.
Этот поисковик стал весьма популярным, а вскоре по его подобию были созданы и другие новые системы. Поначалу они конкурировали с сайтами-каталогами вроде Yahoo!, но вскоре всем стало ясно: поиск по текстам победил. Большинство каталогов объединилось с поисковыми роботами и тоже стало поисковыми системами.
Одним из самых известных поисковиков стала появившаяся в 1995 году AltaVista («взгляд сверху», «другая точка зрения»). До неё системы не работали с естественным языком: запрос надо было формулировать так, чтобы его «понял робот». А тут достаточно было напечатать любую фразу или вопрос, чтобы получить ответ.
В одноимённой песне группы «Сплин» 1999 года Александр Васильев обыграл и название поисковика, и изначальный смысл слова «альтависта».
На глубине прорвётся сквозь сеть твоя Альтависта. И ты сыграешь азбуку Морзе, симфонию Глюка на клавиатуре. Так, что навсегда уходящее солнце замрёт в этом жарком июле.
А в 1996 году появилась российская поисковая система «Рамблер» (rambler — странник, бродяга). В России она была весьма популярна вплоть до 2011 года, а потом превратилась в медиапортал персонализированных новостей.
1997
Возможно, вы не знали, но «Яндекс» появился на свет раньше, чем Google. Система была анонсирована 23 сентября 1997 года , хотя разработки велись ещё до этого. Название поисковика можно расшифровать двумя способами: yet another indexer («ещё один индексатор») или как «Языковой Индекс».
В 1990-е годы «Яндекс» действительно был «ещё одним поисковиком», ведь в России и в мире уже было множество подобных систем. Но к 2001 году он обогнал «Рамблер» в рунете, научился понимать вопросы на естественном языке, распознавать ошибки и опечатки и начал свой путь к настоящему триумфу.
1998
Если машина времени перенесла вас в 1998 год, вам повезло, и вы сможете гуглить по-настоящему. Ещё в 1996 году студенты Стэнфорда Ларри Пейдж и Сергей Брин начали работать над поисковой системой BackRub, а потом на её основе создали Google.
Домен Google.com был зарегистрирован ещё в сентябре 1997 года, но сама корпорация основана 2 сентября 1998-го — и теперь Google отмечает не один день рождения, а два. Само слово «гугл» — это искажённое число гугол — десять в сотой степени.
Благодаря лучшим алгоритмам Google и «Яндекс» стали международным и региональным лидерами. Создатели же первых поисковиков либо бросили это занятие, либо перешли на работу в крупные интернет-компании, выкупившие их системы целиком.
Сейчас Google — первая по популярности в мире система, которая обрабатывает больше 41 миллиарда запросов в месяц и индексирует больше 25 миллиардов веб-страниц.
А «Яндекс» называют национальным достоянием — и это неудивительно. Почти нигде в мире нет такого, чтобы местная поисковая система была не менее популярна, чем американская (другие исключения — Китай и Южная Корея). К тому же, Россия — единственная в мире страна, где без помощи США было создано больше одной успешной поисковой технологии.
Впрочем, некоторые пользователи интернета отказываются от поиска в Google и «Яндекс» из-за так называемого пузыря фильтров. Эти системы угадывают, что пользователь хотел бы увидеть, основываясь на его прошлых действиях в системе. В результате человек каждый раз получает выдачу, которая соответствует его интересам, перестаёт видеть информацию, которая противоречит его взглядам и остаётся в изоляции в собственном «информационном пузыре».
На волне борьбы с пузырём фильтров популярность потихоньку набирают другие системы, отказавшиеся от слежки и подтасовки результатов выдачи. Например, созданная в 2008 году DuckDuckGo позиционирует себя в качестве поисковика, который сохраняет конфиденциальность и показывает всё по запросу пользователя.
Вопросы кибербезопасности и ухода от слежки в последнее время волнуют многих людей. Так, владельцам айфонов стоит пристально изучить свои настройки, чтобы удостовериться, что их разговоры с Siri не прослушают другие люди.
А тем, у кого смартфон на Android, нужно беспокоиться о вездесущем Google. Компания получает данные о ваших перемещениях, даже если их отслеживание отключено. И проверить это можно в своём личном гугл-аккаунте.