ВВЕДЕНИЕ
1 ПОИСК ИНФОРМАЦИИ В СЕТИ ИНТЕРНЕТ
2 СИСТЕМЫ ПОИСКА ИНФОРМАЦИИ В ИНТЕРНЕТЕ
2.1 Yandex
2.2 Google
2.3 Рамблер
ЗАКЛЮЧЕНИЕ
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ
ВВЕДЕНИЕ
Глобальная сеть Интернет – это информационное пространство, которое позволяет отыскать практически любую нужную пользователю информацию. Это огромная всемирная сеть, которая содержит в себе потоки более мелких сетей. Любой человек, у которого есть персональный компьютер и соответствующие программы может подключиться к сети, с целью использования её возможностей для самых различных целей – чтения научных работ, проведения досуга, отправки электронной почты, обучения и т.д. На сегодняшний день глобальная сеть становится важным социальным и политическим фактором современного информационного общества. В результате развития Интернет-технологий был создан новый огромный источник информации, доступ к которому является не только достаточно дешевым, но и довольно скоростным.
Поиск информации в компьютерных сетях становится похож на искусство и требует некоторых умений, которые современный человек должен освоить. Для того, чтобы не потеряться в большом объеме информации необходимо уметь не только её искать, но и уметь находить.
1 ПОИСК ИНФОРМАЦИИ В СЕТИ ИНТЕРНЕТ
Перед началом поиска необходимо четко сформулировать задачу поиска. Пока она не будет четко сформирована разговор об успешном поиске, а тем более его оптимизации, не стоит заводить. Информации в сети Интернет настолько много, что здесь уместна фраза «время - деньги». Сокращение времени на поиск информации позволяет быстрее принять решение, которое позволит заработать.
Однако описать точно эффективную стратегию поиска информации в сети Интернет очень сложно. Однако можно выделить некоторые факторы, которые позволяют затрачивать меньше времени на поиск информации. К примеру, пользователю нужно узнать ареал обитания трёхлапого ленивца. Вряд ли он пойдет в библиотечный алфавитный каталог. Есть вероятность, что пользователь конечно найдет необходимую литературу при помощи систематического каталога, но эта вероятность достаточно мала, чтобы всерьез надеяться на такой способ поиска информации. В поисковых сервисах общего назначения достаточно просто растеряться среди тысяч ссылок, которые выдаст поисковая система на простой запрос.
Рассмотренный пример демонстрирует еще один компонент стратегии: необходимо читать найденные документы для поиска наиболее подходящих терминов и связей между ними. Может быть такая ситуация, когда пользователь мыслит совершенно не в той терминологии, которую используют авторы искомых документов (например, в силу культурных различий!). Еще одним элементом стратегии поиска можно назвать использование нескольких поисковых сервисов. При регулярном поиске информации по определенной теме необходимо отметить те поисковые системы, которые наиболее эффективны для поиска такого типа информации.
По принципу использования и организации инструменты поиска делятся на каталоги и поисковые сервисы.
Каталоги – это справочники, которые содержат списки веб-адресов, которые сгруппированы по некоторым признакам. Обычно они группируются по определенной тематике, где каждая тема содержит несколько подтем. Особенностью таких средств поиска информации является то, что формирование базы данных, структуры и их непрерывное обновление производится вручную коллективом программистов и редакторов, а сам процесс поиска информации предполагает непосредственное участие пользователя, который сам переходит по ссылкам. Основным достоинством поисковых каталогов является то, что информация, накапливаемая в них, тщательно сортируется, отбирается, делится на отдельные категории.
Все поисковые каталоги спроектированы по единому принципу. Страницы каталогов содержат тематические классификаторы. На главной странице располагается каталог самого высокого уровня. Под каждым разделом каталога могут содержаться подкатегории. Путем щелчка мышью по одной из ссылок открывается страница, содержащая тематические категории более низкого уровня, которые тоже могут разбиваться на подкатегории. Все подкатегории и категории выделяются соответствующим образом.
Каталоги основаны на иерархическом принципе и созданы в виде тематического дерева, у которого корнем служит главная страница каталога, которая содержит некоторое количество тематических ветвей. Навигация по такому дереву осуществляется путем щелчков по именам страниц. У большинства каталогов страницы содержат спецэлементы – индексы, содержащие ссылки на узлы, которые относятся к определенной теме. Если перейти по одной из таких ссылок, то появится окно, демонстрирующее организацию текущей ветви тематического дерева. Это делает просмотр тематических подкатегорий и категорий более быстрым и удобным.
2 СИСТЕМЫ ПОИСКА ИНФОРМАЦИИ В ИНТЕРНЕТЕ
Поисковая система — веб-сайт в сети Интернет, который предоставляет инструменты поиска информации в Интернете. Большая часть поисковых систем ищут информацию на веб-страницах всемирной сети, однако существуют и такие системы, которые способны искать товары в интернет-магазинах, данные на FTP-серверах. По принципу действия системы поиска информации разделяются на два типа: поисковые индексы и поисковые каталоги. Поисковые каталоги созданы для поиска информации по определенной тематике. Информация в таких системах структурирована по определенной тематике. Если необходимо найти некоторые данные по определенной тематике, нетрудно найти список веб-страниц, которые к ней относятся.
Поисковые индексы функционируют по принципу алфавитных указателей. Пользователь задает ключевое слово или группу слов, которые характеризуют его искомую информацию, в результате чего получает список веб-страниц, содержащих искомые термины.
Первой поисковой системой для сети Интернет была система «Wandex», которая на сегодняшний день уже не существует и разработанная Мэтью Грэйем из MTI в 1993 году.
Поисковые индексы в автоматическом режиме с помощью специальных программ (веб-пауков), сканируют веб-страницы и индексируют их.
Поисковый робот — программа, которая является компонентом поисковой системы и которая предназначена для сканирования и анализа страниц сети Интернет с целью занесения данных о них в базу поисковой системы. По принципу своей работы робот в большей степени напоминает обычный браузер - он сканирует содержимое веб-страницы, отправляет его на сервер поисковой системы, которой он принадлежит и двигается дальше по ссылкам на другие веб-страницы.
В ответ на поисковый запрос поисковый сервер формирует список гиперссылок, которые ведут на веб-страницы, содержащих нужную информацию. Величина списка выданных ссылок может быть разной, в зависимости от поискового запроса.
2.1 Yandex
Яндекс — это русская система поиска информации в сети Интернет. Веб-сайт компании, был открыт 23 сентября 1997 года. Штаб-квартира компании расположена в Москве. У компании также имеются офисы в Екатеринбурге, Одессе, Санкт-Петербурге и Киеве.
Название компании «Яндекс» (которое состоит из буквы «Я» и части слова index; обыгран тот факт, что русское местоимение «Я» соответствует английскому «I») придумал Илья Сегалович, сооснователь компании, на сегодняшний день занимающий позицию технического директора Яндекса.
Поиск при помощи поисковой системы Яндекса позволяет искать информацию по Рунету документацию на белорусском, русском, английском, румынском, украинском, немецком и французском языках с учётом морфологии английского и русского. Отличительная черта Яндекса — возможность точной настройки поискового запроса. Это реализовано за счёт гибкого языка запросов.
Стандартными настройками Яндекса установлен вывод по 10 ссылок на страницу выдачи результатов. В настройках можно изменить размер страницы до 20, 30 или 50 документов.
Периодически алгоритмы Яндекса, которые отвечают за релевантность выдачи, меняются, что в результате приводит к некоторым изменениям в результатах поиска. Эти изменения направлены против спама, который приводит к нерелевантным результатам по определенным запросам.
Заключение
В заключении необходимо определить базовый алгоритм поиска:
1. Прежде всего необходимо определить, к какому разделу относится нужная информация.
2. Определить, какой именно поисковой сервис лучше использовать. Необходимо учитывать его специфику.
3. Выявить основные слова (или словосочетания), характеризующие искомую информацию. Попробовать выявить ключевые слова.
4. Задавая отдельные фразы и слова, стоит учитывать язык поисковых запросов, логические связки искомых слов, операторы поиска и т.п. элементы, делающие поиск значительно эффективнее.
5. Если пользователю известна точная фраза из искомых материалов, необходимо использовать её как цитату.
6. После проведения предварительного поиска, если в результате поиска получено большое количество документов, стоит воспользоваться элементом уточнения: "Искать в избранном". При этом поисковой запрос следует обязательно уточнить.
7. Необходимо грамотно располагать материал и проводить его сортировку по удобным признакам. Это довольно серьезно ускорит последующий анализ материала.
8. Также стоит фиксировать все интересные найденные веб-адреса документов в сети Интернет. Затем выбрать среди них нужные для выполнения определенной работы.