Найти человека

Поисковая система www.where-you.com/ — это компьютерная система, предуготовленная для поиска информации. Одно из особенно знаменитых использований поисковых систем — веб-сервисы для поиска текстовой либо графической информации во Глобальной паутине. Существуют также системы, способные искать файлы на FTP-серверах, товары в интернет-магазинах, информацию в группах новостей Usenet.

Для поиска информации с поддержкой поисковой системы пользователь формулирует поисковый запрос. Работа поисковой системы заключается в том, дабы по запросу пользователя обнаружить документы, содержащие либо указанные ключевые слова, либо слова, как-либо связанные с ключевыми словами. При этом поисковая система генерирует страницу итогов поиска. Такая поисковая выдача может содержать разные типы итогов, скажем: веб-страницы, изображения, аудиофайлы. Некоторые поисковые системы также извлекают информацию из подходящих баз данных и каталогов источников в Интернете.

Поисковая система тем отменнее, чем огромнее документов, релевантных запросу пользователя, она будет возвращать. Итоги поиска могут становиться менее релевантными из-за особенностей алгорифмов либо в итоге человеческого фактора. По состоянию на 2015 год самой знаменитой поисковой системой в мире является Google, впрочем есть страны, где пользователи отдали предпочтение иным поисковикам.

По способам поиска и сервиса разделяют четыре типа поисковых систем: системы, использующие поисковых роботов, системы, управляемые человеком, гибридные системы и мета-системы. В архитектуру поисковой системы традиционно входят:

поисковый робот, собирающий информацию с сайтов сети Интернет либо из других документов,
индексатор, обеспечивающий стремительный поиск по собранной информации, и
поисковик — графический интерфейс для работы пользователя.

Основные составляющие поисковой системы: поисковый робот, индексатор, поисковик.

Как правило, системы работают поэтапно. Вначале поисковый робот получает контент, после этого индексатор генерирует доступный для поиска индекс, и наконец, поисковик обеспечивает функциональность для поиска индексируемых данных. Дабы обновить поисковую систему, данный цикл индексации выполняется вторично.

Поисковые системы работают, храня информацию о многих веб-страницах, которые они получают из HTML страниц. Поисковый робот либо «краулер» (англ. Crawler) — программа, которая механически проходит по каждому ссылкам, обнаруженным на странице, и выделяет их. Краулер, базируясь на ссылках либо исходя из предварительно заданного списка адресов, осуществляет поиск новых документов, ещё не знаменитых поисковой системе. Обладатель сайта может исключить определённые страницы при помощи robots.txt, применяя тот, что дозволено запретить индексацию файлов, страниц либо каталогов сайта.

Поисковая система анализирует оглавление всей страницы для последующего индексирования. Слова могут быть извлечены из заголовков, текста страницы либо особых полей — метатегов. Индексатор — это модуль, тот, что анализирует страницу, заранее разбив её на части, применяя личные лексические и морфологические алгорифмы. Все элементы веб-страницы вычленяются и анализируются отдельно. Данные о веб-страницах хранятся в индексной базе данных для применения в последующих запросах. Индекс разрешает стремительно находить информацию по запросу пользователя. Ряд поисковых систем, сходственных Google, хранят начальную страницу целиком либо её часть, так называемый кэш, а также разную информацию о веб-странице. Другие системы, сходственные системе AltaVista, хранят всякое слово всей обнаруженной страницы. Применение кэша помогает ускорить извлечение информации с теснее посещённых страниц. Кэшированные страницы неизменно содержат тот текст, тот, что пользователь задал в поисковом запросе. Это может быть благотворно в том случае, когда веб-страница обновилась, то есть теснее не содержит текст запроса пользователя, а страница в кэше ещё ветхая. Эта обстановка связана с потерей ссылок (англ. linkrot) и дружелюбным по отношению к пользователю (юзабилити) подходом Google. Это полагает выдачу из кэша коротких фрагментов текста, содержащих текст запроса. Действует тезис наименьшего изумления, пользователь традиционно ждет увидеть желанные слова в текстах полученных страниц (User expectations). Помимо того, что применение кэшированных страниц ускоряет поиск, страницы в кэше могут содержать такую информацию, которая теснее нигде больше не доступна.

Поисковик работает с выходными файлами, полученными от индексатора. Поисковик принимает пользовательские запросы, обрабатывает их при помощи индекса и возвращает итоги поиска.

Когда пользователь вводит запрос в поисковую систему (традиционно при помощи ключевых слов), система проверяет свой индекс и выдаёт список особенно подходящих веб-страниц (отсортированный по какому-либо критерию), традиционно с короткой аннотацией, содержащей заголовок документа и изредка части текста. Поисковый индекс строится по особой методике на основе информации, извлечённой из веб-страниц.

Поиск
Advertisement
Партнеры:


Рубрики
Created by Architect PhD @ 2015-2018