Как и что искать в Сети
Многие люди, знакомые с Интернетом больше понаслышке, считают, что в Сети можно найти любую информацию. Это действительно так в том смысле, что там можно натолкнуться на самые неожиданные по форме и содержанию ресурсы.
С другой стороны, не надо думать, что сегодняшний Интернет заменяет традиционную библиотеку - он лишь прекрасно дополняет ее. В Сети в электронном виде присутствует достаточно ограниченное количество книг и периодических изданий, не все из которых находятся в открытом доступе. Переводу в электронную форму фондов крупных библиотек и их появлению в Интернете отчасти препятствуют проблемы, связанные с авторским правом. Однако главная трудность заключается в отсутствии финансовых и технических возможностей для проведения таких масштабных мероприятий.
Впрочем, многие библиотеки мира, в том числе такие крупные, как (), открыли доступ через Интернет к своим каталогам. Это не представляло особой сложности, так как компьютеризированы они уже достаточно давно.
Интернет как депозитарий информации интересен в первую очередь оригинальными материалами, которые накопились на его просторах за десятки лет существования. Естественно, что последнее десятилетие, отмеченное огромным ростом числа пользователей Сети, также характеризуется особенно интенсивным ростом количества и объема информационных ресурсов.
Несмотря на то, что общая информационная ценность Интернета очень велика, само информационное пространство неоднородно в качественном отношении, поскольку ресурсы часто создаются на скорую руку. Если при подготовке бумажной публикации ее текст обычно прочитывается несколькими рецензентами и в него вносятся коррективы, то в Сети этот этап издательского процесса обычно отсутствует. Так что в общем случае к сведениям, почерпнутым из Интернета, следует относиться с несколько большей осторожностью, чем к информации, найденной в печатной публикации. Хотя, несомненно, в Сети существуют и в высшей степени авторитетные источники информации.
Современная Сеть действительно в состоянии предложить своему пользователю массу информации самого разного профиля. Здесь можно познакомиться с новостями, интересно провести время, получить доступ к разнообразной справочной, энциклопедической и учебной информации. Интернет можно эффективно использовать для решения самых разных задач на работе и дома.
Самая главная проблема, возникающая при работе с Сетью, - быстро найти нужную информацию и разобраться в ней, оценить информационную ценность того или иного ресурса для своих целей.
Путь к огромному информационному багажу человечества, хранящемуся в библиотеках, фонотеках, фильмотеках, лежит через карточки каталогов. В Интернете существуют аналогичные механизмы для нахождения требуемой информации. Речь идет о поисковых серверах, служащих отправной точкой для пользователей Сети. С содержательной точки зрения о них можно говорить как о специальной службе Интернета, хотя они используют механизмы Всемирной Паутины и с технической точки зрения не выходят за ее рамки.
Поисковые сервера достаточно многочисленны и разнообразны. Принято различать поисковые индексы и каталоги. Сервера-индексы работают следующим образом: регулярно прочитывают содержание большинства веб-страниц Сети ("индексируют" их), и помещают их полностью или частично в общую базу данных. Пользователи поискового сервера имеют возможность осуществлять полнотекстовый поиск по этой базе данных, используя ключевые слова, относящиеся к интересующей их теме. Выдача результатов поиска обычно состоит из выдержек рекомендуемых вниманию пользователя страниц и их адресов (URL), оформленных в виде гиперссылок. Работать с поисковыми серверами этого типа удобно, когда хорошо представляешь себе, что именно хочешь найти.
Каталоги выросли из списков интересных ссылок, закладок (bookmarks). По сути дела они представляют собой многоуровневую смысловую классификацию ссылок, построенную по принципу "от общего к частному". Иногда ссылки сопровождаются кратким описанием ресурса. Как правило, возможен поиск в названиях рубрик (категориях) и описаниях ресурсов по ключевым словам. Каталогами пользуются тогда, когда не вполне четко знают, что именно ищут. Переходя от самых общих категорий к более частным, можно определить, с каким именно ресурсом Сети следует ознакомиться. Поисковые каталоги уместно сравнивать с тематическими библиотечными каталогами, словарями-тезаурусами или биологическими классификациями животных и растений. Ведение поисковых каталогов частично автоматизировано, но до сих пор классификация ресурсов осуществляется главным образом вручную.
Поисковые каталоги бывают общего назначения и специализированные. Поисковые каталоги общего назначения включают в себя ресурсы самого разного профиля. Специализированные каталоги объединяют только ресурсы, посвященные определенной тематике. Им часто удается достичь лучшего охвата ресурсов из своей области и построить более адекватную рубрикацию.
История поисковых служб начинается в середине 90-х годов. В 1994 году два аспиранта Стэндфордского Университета, Дэвид Фило и Джерри Янг, начали работу над созданием каталога (; англ. "yahoo" - "йеху" из "Путешествий Гулливера" Джонатана Свифта). Они преследовали простую цель: организовать собственные ссылки. Чтобы сделать это эффективным образом, им пришлось построить специальную систему с использованием базы данных. Она могла одновременно выдерживать обращения тысяч пользователей. И эти обращения не замедлили последовать. В начале 1995 года Марк Андрессен, один из сооснователей корпорации Netscape Communications, предложил создателям уже завоевавшего огромную популярность Yahoo перенести систему с кампуса Стэндфордского Университета на сервера Netscape. Огромная нагрузка с университетской сети была снята, а Yahoo стал коммерческим проектом. Сегодня его создатели - мультимиллионеры; над ведением каталога трудятся тысячи специалистов в самых разных областях знания.
Один из первых индексирующих поисковых серверов, ("вид с высоты") корпорации Digital (теперь Compaq), появился в 1995 году. Нескольким служащим корпорации-производителя суперкомпьютеров пришла в голову мысль использовать новейшие сервера для считывания содержимого Всемирной Паутины в базу данных и осуществления поиска по ней. Сервер , расположенный по адресу , - один из крупнейших поисковых серверов сегодняшней Сети.
В последнее время поисковые каталоги общего назначения и индексирующие поисковые сервера интенсивно интегрируются. уже не только каталог, но и поисковый сервер. , как и многие другие поисковые сервера, исходно предлагавшие исключительно поиск по базе данных, сегодня включает в выдачу результатов поискового запроса еще и список рубрик, соответствующих теме запроса.
Поисковые технологии не стоят на месте. Традиционные индексирующие сервера искали в базе данных документы, содержащие ключевые слова из поискового запроса. При таком подходе очень сложно оценить значение и качество ресурса, выдаваемого пользователю. Альтернативный подход - искать такие веб-страницы, на которые ссылаются другие ресурсы по данной тематике. Чем больше ссылок на страницу существует в Сети - тем больше шансов, что вы ее найдете. Такой своеобразный мета-поиск осуществляет поисковый сервер (), появившийся совсем недавно, но уже отлично себя зарекомендовавший.
Кроме поисковых серверов, заносящих в свои базы веб-страницы по всей Сети, есть поисковые сервера, ориентированные более узко в географическом и языковом отношении. Так, существует много русских поисковых серверов. Их краткий список вы найдете в следующем разделе.