Какие есть способы компьютерного поиска информации. Способы поиска информации в сети

Поиск информации – одна из задач, которую приходится решать каждому пользователю интернета.

Приступая к поиску данных в интернете, стоит определить цель поиска . Полезно ответить для себя на следующие вопросы:

  • известны ли вам адреса ресурсов сети, с которых можно начать поиск?
  • что вы уже знаете о проблеме, информацию о которой ищете?
  • с каких ключевых слов стоит начать поиск?
  • сколько времени вы готовы потратить на поиск нужных данных?
От того, как именно поставлена задача, во многом зависит и стратегия поисковой деятельности, и выбор соответствующих поисковых средств.

Существуют три основных способа поиска информации в интернете:

Способ 1: Указание адреса страницы
Это самый быстрый способ поиска, но его можно использовать только в том случае, если точно известен адрес документа или сайта, где расположен документ.

Способ 2: Передвижение по гиперссылкам
Это наименее удобный способ, так как с его помощью можно искать документы, только близкие по смыслу текущему документу. Но этот способ очень простой и подходит для начинающего пользователя.

Способ 3: Обращение к поисковой системе
На помощь приходят специальные поисковые системы (их еще называют поисковыми машинами).
Результатом выполнения запроса является перечень ссылок на Web-страницы, рядом с которыми присутствуют заданные текстовые фрагменты. Наиболее популярные поисковые серверы: Яндекс (yandex.ru), Гугл (google.ru) и Рамблер (rambler.ru).Языки запросов различных поисковиков несколько отличаются друг от друга.
Поисковая система Яндекс

  • Ч тобы найти информацию с помощью поисковой системы Яндекс, откроем главную страницу . Строка для ввода поискового запроса расположена в верхней части страницы, в области, выделенной желтым фоном.
Укажем в ней необходимые ключевые слова и нажмем на клавиатуре клавишу или щелкнем мышью на кнопке «Найти», размещенной возле строки поиска.
Получив такую команду, Яндекс просмотрит всю свою базу данных и попытается найти в ней веб-страницы, где встречается введенное нами слово или словосочетание. При этом нужно заранее учитывать, что чем обширнее наш запрос, тем меньшее количество веб-страниц будет ему соответствовать.
  • П о умолчанию на одной странице Яндекс отображает только 10 таких ссылок, поэтому для ознакомления с полными результатами поиска необходимо будет листать страницы с помощью цифр-ссылок.
  • К аждый обнаруженный ресурс в результатах поиска представлен названием веб-страницы и текстом ссылки. Кроме того, в большинстве случаев поисковая система демонстрирует небольшой фрагмент текста, содержащегося на той или иной найденной веб-странице, в котором обнаружено совпадение с текстом вашего запроса. При этом слова, которые мы ввели для поиска, в этих фрагментах будут выделены полужирным начертанием.
  • В низу страницы с результатами поиска, есть строка «в других поисковых системах» . Рядом с этими словами имеются ссылки на несколько других популярных поисковых систем. Поэтому, если мы не нашли с помощью Яндекса нужной нам информации, можно воспользоваться другими поисковыми системами, перейдя по ссылке.

Поиск информации в Яндексе можно осуществлять

в простом и расширенном поисковом режиме .

  • Простой поиск
Поиск по одному или нескольким ключевым словам, введенным в строку запроса.
Перед тем как начинать вводить в строку поиска поисковой системы запрос, тщательно его сформулируйте .
Чем более четкой будет выбранная формулировка, тем меньше ненужных вам сайтов предложит в результатах поиска поисковая система.
  • Расширенный поиск
Все популярные поисковые системы располагают специальными возможностями для расширенного поиска ресурсов.

Чтобы попасть на веб-страницу, предоставляющую такие возможности, необходимо воспользоваться ссылкой с названием типа «Расширенный поиск» .

Перейдя по этой ссылке, мы увидим большую поисковую форму, в которой можно указать множество параметров.
Поисковая система Яндекс позволяет, например, настраивать параметры поиска слов в зависимости от их расположения (рядом, в одном предложении, на одной странице) и формы.
Кроме того, она может искать веб-страницы по их языку (русский, украинский, белорусский и т.д.), по дате последнего изменения и даже по формату файла веб-страницы.
Наконец, с помощью Яндекса информацию можно искать на каком-то конкретном сайте. Это бывает полезно в том случае, если на нужном вам сайте нет встроенной поисковой системы.

Для каждой поисковой системы существуют свои языки запросов. Мы познакомимся с логическим языком запросов для Яндекса, который позволяет в режиме обычного поиска вводить в строку поиска дополнительные служебные команды, уточняющие ваши требования. Рассмотрим некоторые такие команды.
  • Используйте знаки "+" и "-".
Чтобы исключить документы, где встречается определенное слово, поставьте перед ним знак минуса (-). И наоборот, чтобы определенное слово обязательно присутствовало в документе, поставьте перед ним плюс (+). Обратите внимание, что слово и знак плюс-минус должны быть написаны слитно.
Например, если вы хотите узнать про аквариумных рыбок, но без продажи и разведения, то набираем в поисковой строке:
«аквариумные рыбки -разведение -продажа».
  • Поиск точного соответствия - знак "!".
Искать по точной словоформе . Вы можете дать команду Яндексу не учитывать формы слов из запроса при поиске.
Например, запрос!иванов найдет только страницы с упоминанием этой фамилии, а не города "Иваново".
  • Поиск точной фразы – кавычки.
Помещать поисковый запрос в кавычки (например, «кто виноват и что делать») нужно только в том случае, если мы хотим найти фразу, на 100% совпадающую с текстом нашего запроса.
Кавычки заставляют поисковый механизм отбирать лишь документы, в которых слова из запроса стоят в точно таком же порядке, в котором мы указали их в поисковом запросе. Если же кавычек нет, то по запросу «кто виноват и что делать» поисковая система может предложить нам страницу, содержащую фразу «кто виноват - тому и делать, что скажут» или же «ну и кто виноват, что Петр Петрович не умеет делать пельмени». Формально при этом поисковая система справится со своей работой, ведь в указанных отрывках есть все слова из введенной фразы. А то, что они стоят совсем не в том порядке, в котором нам нужно, — это уже другой вопрос, которыйи уточняется использованием кавычек .
При работе с поисковыми системами рано или поздно мы встретим слово «релевантность» .
Релевантность — это степень соответствия найденных документов нашему запросу. Например, в Яндексе его можно обнаружить внизу каждой веб-страницы, содержащей результаты поиска, сразу под набором цифр-ссылок. Здесь оно используется в качестве параметра для функции «Отсортировано». Помимо параметра по релевантности, доступен также вариант по дате.
Если страницы в результатах поиска сортируются по релевантности, то это значит, что в самом начале указываются сайты с наибольшим уровнем соответствия вашему запросу, после них располагаются ресурсы с меньшим уровнем релевантности и т.д.
Детские поисковые системы
  • Чтобы обезопасить детей от ненужной информации, созданы специальные детские поисковые системы, которые индексируют не все сайты, а только сайты с детской или околодетской тематикой.
Для самых юных пользователей Интернета создана специальная поисковая система АгА, которая предназначена для поиска информации детских ресурсов. Она содержит много ресурсов по воспитанию и здоровью детей, поэтому ее можно рекомендовать не только детям, но и родителям. Очень удобно искать в этой поисковой системе, используя карту сайта.

АгА не только поисковый сервис. Здесь есть всеми любимые мультики, раскраски, просмотр диафильмов, помощь по разным школьным предметам и т.д.
Quintura для Детей – визуальный поиск по детским ресурсам, разработанный специально для детей и ориентирован на школьников младших и средних классов.

Для поиска используется интерактивное облако Quintura. Красочный и привлекательный интерфейс сервиса содержит несколько интерактивных картинок, кликая на которые, дети сразу могут выбрать интересную для себя тему, например: наука, музыка, динозавры или игры.

  • Началка - Детский поиск.

Найти нужную информацию в Интернете зачастую довольно трудно. Интернет развивается хаотично, в нем нет четко выделенной структуры. Никто не может гарантировать, что на одном домене будет только информация определенной тематики, а на другом - информация другой, но тоже четко определенной тематики. Например, на доменах.com можно найти не только коммерческую информацию, а, например, различную документацию по программным продуктам или даже анекдоты.

Если бы доменная структура была бы похожа на структуру каталога, например, в домене ru.comp.os.linux (как в системе новостей) была бы вся информация об операционной системе Linux на русском языке и какая-то организация-модератор следила, чтобы в других доменах не выкладывалась информация о Linux, то тогда поиск был бы значительно проще. Ведь мы бы знали, где искать. Открываешь браузер, вводишь ru.comp.os.linux и получаешь... миллионы различных ссылок на статьи, HOWTO-документы и прочую информацию, так или иначе связанную с Linux.

Эффективность поиска

    Эффективность поиска зависит от многих факторов:
  • От самой информации - по одной теме информации может быть много, по другой - мало. Иногда можно найти много информации по заданной теме, но коэффициент полезного действия этого поиска окажется близким к 0,0%, а можно найти всего 3-4 ссылки, и это будет как раз то, что нужно. Сюда же относится умение веб-мастера правильно подать информацию, чтобы ее могли найти сами поисковые машины Предположим, где-то очень далеко есть нужная вам информация, но поисковая машина о ней ничего не знает. Возможно, информация была только что опубликована или просто веб-мастер, опубликовавший информацию, даже и не подозревает о существовании поисковых машин. Вы-то ищите информацию с помощью поисковой машины. Если она не "знает" нужную вам информацию, то, следовательно, и вы о ней ничего не узнаете.
  • От поисковой машины - поисковых машин много и все они разные. Даже если они относятся к одному типу (о типах поисковых машин мы поговорим чуть позже), несомненно, у каждой из них будет свой алгоритм. Если вы не нашли информацию с помощью одной поисковой машины, попробуйте поискать ее с помощью другой. Не зацикливайтесь на одной поисковой машине, как бы она вам ни нравилась.
  • От умения использовать поисковую машину - от того, как вы умеете использовать поисковую машину, зависит очень многое. Если вы не знаете, как использовать поисковую машину, вряд ли поиск будет эффективным.

Как правильно искать информацию

Поскольку чаще всего вы не выбираете нужный вам сайт из каталога поисковой машины, а вводите определенное ключевое слово (или несколько ключевых слов), то вам нужно максимально конкретно задать это самое ключевое слово. Чем точнее вы определите предмет поиска, тем точнее будет результат. Поисковая машина ведь не может угадать ваши мысли, нужно четко указать ей, что вы ищите.

У каждой поисковой машины есть свой синтаксис, который необходимо знать. В этой главе будет описан синтаксис поисковых машин Google, Yandex и Rambler. Если вы хотите использовать другую поисковую машину, то ее синтаксис вы сможете узнать на ее же сайте (обычно он подробно описан).

Поисковые машины

А теперь поговорим о самих поисковых машинах.

На территории бывшего СНГ наиболее популярными являются следующие поисковые машины, по данным SpyLog (Openstat) :

  • 1. Яндекс (www.yandex.ru );
  • 2. Google (www.google.com );
  • 3. Поиск@Mail.ru (go.mail.ru );
  • 3. Рамблер (www.rambler.ru );
  • 5. Yahoo! (www.yahoo.com );
  • 6. AltaVista (www.altavista.com );
  • 7. Bing (www.bing.com ).

Поисковые машины указаны в порядке "убывания популярности". Как видите, самой популярной у нас является поисковая машина Яндекс.

Типы поисковых машин

    Существуют два основных типа поисковых машин:
  • индексные - Google, AltaVista, Rambler, HotBot, Яндекс и др.;
  • классификационные (каталоговые) - Rambler, Yahoo! и др.

Не удивляйтесь, что поисковая машина Rambler указана дважды - она одновременно являлася и индексной, и классификационной. К этому мы еще вернемся, а пока поговорим об отличиях этих двух систем.

Как работает индексная поисковая машина? Поисковая машина запускает специальную программу, которая просматривает содержимое веб-серверов, индексируя информацию: она заносит в свою базу данных ключевые слова той или иной веб-страницы, некоторую информацию из веб-страницы.

Краткая история Google

Начнем с названия. Google - это немного видоизмененный вариант слова googol (не зря ее часто называют "гуглом"). В свою очередь это слово было введено Милтоном Сиротой, племянником известного математика Эдварда Каснера, а потом было популяризировано в книге Каснера и Ньюмана "Математика и воображение". Слово "googol" отображает число одной единицей и 100 нулями. Название "Google" отображает попытку организовать огромное количество информации в Сети.

Итак, начнем с самого начала. Будущие разработчики Google Сергей Брин (Sergey Brin) и Лэрри Пейдж (Larry Page) познакомились в 1999 году в Станфордском университете. Тогда Лэрри было 24 года, а Сергею - 23. Лэрри в то время был студентом Мичиганского университета и на несколько дней приехал в Станфорд. Сергей был в группе студентов, которая должна была ознакомить гостей с университетом. С первой встречи Сергей и Лэрри, мягко говоря, недолюбливали друг друга - они спорили относительно всего, о чем можно было спорить. Хотя в итоге это и оказалось положительным моментом, поскольку их разные мнения привели к созданию алгоритма для решения одной из самых актуальных компьютерных задач: поиск нужной информации среди огромного массива данных. С января 1996 года Лэрри и Сергей начинают работу над поисковой машиной BackRub, которая должна была анализировать "обратные" ссылки, указывающие на данный веб-сайт. Работы над этим сервером велись в постоянной нехватке средств - ведь в то время Сергей и Лэрри были аспирантами университета - сами понимаете, что средств у аспирантов не очень много. Кстати, Лэрри впервые принимал участие в столь серьезном проекте, а до этого он занимался всякими "несерьезными", даже порой анекдотическими проектами, например, он построил работающий принтер из конструктора Lego.

Базовый синтаксис Google

Интерфейс Google поражает своей простотой: поле для ввода и две кнопки. Как говорится, все гениальное просто.

Специальный (расширенный) синтаксис Google

В дополнение к логическим операторам Google предоставляет вам модификаторы поиска, перечисленные в таблице. Модификаторы поиска называются специальным синтаксисом Google. Отнеситесь к этой таблице со всей серьезностью: попробовав однажды поискать что-нибудь с использованием модификаторов, вы уже не откажетесь от них.

Правильное использование модификатора inurl

Модификатор inurl используется для поиска по указанному URL. И отличие от модификатора site, который позволяет искать информацию только на одном сайте или домене, модификатор inurl позволяет искать информацию в подкаталогах сайта, например:

inurl: сайтskype-zvonim-besplatno

Модификатор inurl позволяет использовать символ * для указания домена, например:
inurl: "*.redhat.com"

Эффективнее всего использовать inurl в паре с site. Следующий запрос будет искать информацию в домене gidmir.ru, на всех его поддоменах, кроме www:
site: gidmir.ru inurl: "*.gidmir" -inurl: "www.gidmir.ru"

Смешанный синтаксис Google

Google позволяет использовать смешанный синтаксис, т.е. такой синтаксис, в запросе которого используются несколько специальных модификаторов поиска. Это позволяет достичь наилучшего результата.

Вот самый просто пример смешанного синтаксиса:
site: ru inurl: disc

В данном случае поиск будет произведен на сайтах домена, a URL должен содержать слово disc.

Вот еще один пример:
site: ru -inurl: оrg.ua

Поиск будет произведен на сайтах домена ru, но в результатах поиска будут отсутствовать страницы, расположенные на org.ua.

Как преодолеть ограничение на количество ключевых слов

Для большинства рядовых пользователей Google лимит в 10 ключевых не заметен. Но любители длинных запросов, наверное, заметили, что Google принимает во внимание только первые 10 ключевых слов, а все остальные просто игнорируются.

Зачем нужно искать длинные фразы? В большинстве случаев - это отрывки произведений. Предположим, что мы ищем произведение "Мастер и Маргарита". Нужно отметить, что ключевая фраза должна выглядеть как "Мастер Маргарита", поскольку слова и, или, and, of, or, I, a, the и некоторые другие игнорируются поисковой машиной. Если вы хотите принудительно включить одно из этих слов в поиск, поставьте перед этим словом знак "+", например +the.

Преодолеть лимит в 10 слов позволяет правильное построение запроса. Следующие рекомендации помогут вам не только сократить длину запроса, но и повысить эффективность поиска в целом.

Расширенный поиск Google

Набираем в строке ввода браузера адрес - www.google.ru/advanced_search и переходим на расширенный поиск Google.

С помощью расширенного поиска можно искать информацию почти также гибко, как и с помощью модификаторов поиска. Почему "почти"? Интерфейс расширенного поиска предоставляет доступ далеко не ко всем модификаторам поиска.

Установка свойств поиска в Google

Мне не хочется забивать вам голову техническими подробностями, поэтому я кратко скажу, что такое Cookies и нет, не с чем их едят, а как с ними нужно работать.

Представим, что перед нами поставлена такая задача: нужно написать индивидуальный отчет посещения для каждого клиента сайта нашей компании. То есть, чтобы пользователь не видел общее количество посещений, знал, сколько раз именно он был на нашем сайте. Для каждого IP-адреса нужно вести учет в одной таблице, которая, скорее всего, будет большой, а из этого следует, что мы нерационально используем процессорное время и дисковое пространство. Гораздо правильнее с нашей стороны будет использовать это пространство с большей пользой.

Мы устанавливаем Cookies - переменную, которая будет храниться на диске у пользователя. Эта переменная и будет хранить информацию о посещениях. Выгода очевидна. Во-первых, нам не нужна никакая таблица, во-вторых, мы упрощаем работу нашей программы.

Результат поиска Google

Результат поиска Google - это не просто набор ссылок, соответствующих указанным условиям поиска. Это нечто большее, заслуживающее отдельного рассмотрения. Введите слово "rusopen" и щелкните на кнопке Поиск в Google.

В верхней части мы видим общее количество результатов (883 000 000) и общее время, которое занял поиск, а именно 0,34 секунды.

    В большинстве случаев результат представляется в виде:
  • название страницы;
  • описание страницы;
  • URL страницы;
  • размер страницы;
  • дата последнего индексирования страницы;

Поиск картинок с Google

Служба Google Images позволяет найти различные изображения в Интернете. Хотя сами изображения индексировать нельзя, индексируются страницы, содержащие эти изображения. Введите описание изображения и получите много, очень много ссылок, а также сами изображения, представленные в виде галереи.

    Для более эффективного поиска картинок нужно использовать следующие модификаторы поиска:
  • intitle: - поиск в заголовке страницы;
  • filetype: - позволяет указать тип картинки, можно указывать следующие типы: JPEG and GIF, not BMP, PNG, изображения других типов не индексируются;
  • inurl: - поиск по указанному URL, например inurl: www.gidmir.ru ;
  • site: поиск на указанном домене или сайте, например, site: com.

Службы Google

Google - это мощнейшая поисковая система, охватывающая более 3 миллиардов страниц. Кроме обычных веб-страниц, Google индексирует файлы в форматах Word, Excel, PowerPoint, PDF и RTF. Также Google можно использовать для поиска картинок и номеров телефонов: для этого предназначены, соответственно, служба Google Images и Phonebook. В этой статье мы поговорим о специальных службах Google.

Почта Google

Попробуйте использовать почту от Google. Нужно отметить, что это не совсем обычная веб-почта.

    Среди особенностей Gmail нужно выделить следующие:
  • огромный размер почтового ящика - более 7 Гбайт;
  • вместо удаления писем их можно архивировать - тогда и места вам хватит надолго, и сможете восстановить письма, которые были получены или отправлены вами несколько лет назад;
  • возможность поиска по почтовому ящику с эффективностью Google;
  • удобная организация писем и ответов на них: все письма и ответы составляют одну цепочку, которую легко отслеживать;
  • хорошая защита от спама;
  • запоминающийся адрес ваше_имя@gmail.com;
  • удобный интерфейс.

Поисковая машина Рамблер (Rambler)

История Рамблера

Все началось в далеком 1991 году в городе Пущино Московской области. В том далеком году собралась группа единомышленников, среди которых были Дмитрий Крюков, Сергей Лысаков, Виктор Воронков, Владимир Самойлов, Юрий Ершов. Общим интересом этой группы стал Интернет. Наверное, в 1991 году ни один из будущих разработчиков Рамблера и не предполагал, что они станут создателями одной из самых крупных и известных поисковых машин Рунета. Ведь до этого все они обслуживали радиотехнические приборы в Институте биохимии и физиологии микроорганизмов РАН. В 1992 году была создана компания "Стек" во главе с Сергеем Лысаковым. Профиль компании - локальные сети и Интернет. По сути, компания "Стек" была интернет-провайдером. Фирма создала внутригородскую сеть, затем подключила Пущино к Москве, а уже через нее - к Интернету. Кстати, это был первый IP-канал, выходящий за пределы Москвы. И это в 1992 году! Сейчас проложить канал довольно проблематично - всегда найдется масса нюансов, а тогда кабели приходилось прокладывать самостоятельно, вручную, под землей, причем все это делалось зимой.

Как работал Рамблер

Интернет постоянно развивается: число сайтов и их размеры увеличиваются с каждым днем. Ведь только представьте: большие сайты обновляются каждый день, даже если объем обновлений составляет 1024 байт (1 Кбайт), то если предположить, что таких сайтов 10 000, каждый день поисковой машине приходится обрабатывать (индексировать) 10 000 Кбайт (грубо говоря, 10 Мбайт) информации. Число 10 000 взято "с потолка" - примера ради. Оно может быть выше или ниже - ведь даже крупные сайты обновляются не каждый день. Размер обновления также надуман. Представьте информационно-аналитический сайт, на котором практически каждый день публикуются новые статьи или перепечатываются материалы с других сайтов. В этом случае размер обновлений будет далеко не 1 Кбайт, а как минимум 10. Добавьте ко всему этому еще новости и другую информацию и выходит, что при количестве обновленных сайтов 10 000 поисковая машина должна проиндексировать 120 Мбайт текста. И при всем этом поисковик должен не только точно отобразить результаты поиска, но еще и сделать это как можно быстрее, чтобы пользователю было удобно с ним работать. Кому захочется ждать результатов поиска 10 минут? Это я, конечно, утрирую, но лично я бы не ждал результатов поиска более 30 секунд (с момента щелчка по кнопке Найти до появления первых десяти результатов). Выходит, разработчикам поисковой машины приходится постоянно поддерживать на должном уровне не только "железо", которое должно быть в состоянии обрабатывать постоянно растущие объемы информации, но и "математику" одним железом не возьмешь. Нужно постоянно совершенствовать алгоритмы поиска, чтобы при увеличении объемов поисковой базы, время поиска не увеличивалось (имеется в виду существенное увеличение времени - для пользователя нет разницы, сколько будет выполняться поиск 2,5 секунды или 2,0555 секунды, поскольку он не в состоянии оценить это время).

Синтаксис Рамблера

Запрос к Рамблеру мог состоять из одного или нескольких слов, причем запрос мог содержать знаки препинания. Разработчики Рамблера сконструировали свою поисковую машину для максимального удобства пользователя. Рамблер мог использовать даже неопытный пользователь, который совсем не знаком с языком запросов. Все, что ему нужно было сделать, - это ввести запрос, состоящий из нескольких слов (например, какую-то фразу) и без знаков препинания - Рамблер сам находил нужные документы, причем делал это максимально эффективно. Конечно, если правильно использовать язык запросов, эффективность значительно увеличивалася, но даже при полном незнании языка запросов эффективность поиска была на высоком уровне. Как уже отмечалось, знание языка запросов - в ваших же интересах, вы просто сможете найти нужную вам информацию значительно быстрее.

Поисковая машина Яндекс (Яndex)

Историческая справка

В далеком 1990 году в компании «Аркадия», которую возглавляли Аркадий Борковский и Аркадий Волож, началась разработка поискового программного обеспечения. Спустя шесть лет появился сайт «Яндекс». Но что же произошло за эти шесть лет?

За два года были созданы две информационно-поисковые системы - «Международная Классификация Изобретений» и «Классификатор Товаров и Услуг». Обе системы работали под DOS и позволяли производить поиск слова из заданного словаря с использованием логических операторов.

В 1993 году компания «Аркадия» стала подразделением CompTek. За 1993-1994 годы значительно усовершенствовались технологии поиска, например, словарь, обеспечивающий поиск с учетом морфологии русского языка, занимал всего 300 Кбайт, а это значит, что он свободно помещался в оперативную память, и работа с ним происходила очень быстро. На основе этой новой технологии в 1994 году был создан «Библейский компьютерный справочник» - информационно-поисковая система, работающая с переводами Ветхого и Нового Заветов.

Как Яндекс интерпретирует слова

Как поисковая система будет интерпретировать введенное вами слово?

    Сейчас мы об этом и поговорим:
  • Правило 1. Оказывается, система интерпретирует его согласно правилам русского языка. Пример: если вы ввели слово "машина", то также получите результаты, содержащие слова "машины", "машину" и т.д. Аналогично и с глаголами - по запросу "идти" получите документы, содержащие слова "идти", "идет", "шел", "шла" и т.д. Как видите, поисковая система более интеллектуальная, чем вы думали - это не просто средство для поиска определенного слова в базе данных.
  • Правило 2. Особое внимание уделяется словам, написанным с большой буквы. Если слово написано с большой буквы и не является первым в предложении, то будут найдены только слова с большой буквы. Иначе - будут найдены слова, написанные как с большой, так и с маленькой буквы. Пример: по запросу "Такса А." будут найдены документы, содержащие как "такса" (плата), так и "Такса" (фамилия), поскольку слово "Такса" хоть и написано с большой буквы, но оно стоит первым в предложении. А вот по запросу "А. Такса" будут найдены документы, содержащие только слово "Такса", написанное с большой буквы.

Основной синтаксис Яндекса

По умолчанию Яндекс использует логический оператор И. Это означает, что если вы ввели запрос "телевизор Samsung", то в результатах получите документы, в которых в одном предложении будут встречаться слова "телевизор" и "Samsung". Если вы хотите указать оператор И явно, то используйте символ амперсанда &. Другими словами, запрос "телевизор Samsung" аналогичен запросу "телевизор & Samsung". Можно также использовать запрос "телевизор + Samsung".

Если вам нужен обратный эффект, т.е. вы хотите получить документы, в которых есть отдельно слово "телевизор" и отдельно слово "Samsung", то вам нужно использовать оператор ИЛИ (|), например: "телевизор | Samsung".

Знак тильда (~) позволят найти документы, в которых есть первое слово, но нет второго. Например, по запросу "телевизор ~ Горизонт" будут найдены документы, в которых есть слово "телевизор", но рядом с ним (в одном предложении) нет слова "Горизонт". А что, если нам нужно найти документы, в которых вообще нет слова "Горизонт", но есть слово "телевизор". Чтобы перейти с уровня предложения на уровень документа, дважды укажите нужный оператор, например: && или ~~. В нашем случае подойдет запрос "телевизор ~~ Горизонт".

Очень часто нужно найти точную фразу, например, "президент России", в которой слово "России" строго следует сразу после слова "президент". В этом случае искомую фразу нужно заключить в кавычки.

Поиск с учетом расстояния в Яндексе

Все слова в тексте документа Яндекс нумерует по порядку. Расстояние между соседними словами равно 1 (а не 0!), а расстояние межу словами в обратном порядке равно -1. То же самое относится и к предложениям.

Для указания расстояния между словами ставится знак /, за которым сразу стоит число, значит, это расстояние между словами. Например, по запросу "разработчик /2 программ" будут найдены документы, в которых содержатся слова "разработчик" и "программ", причем расстояние между словами должно быть не более двух слов и все эти слова должны быть в одном предложении. В данном случае будут найдены документы, содержащие "разработчик прикладных программ", "разработчик системных программ" и т.д.

Если нам точно известны расстояние и порядок слов, то можно воспользоваться синтаксисом /+n. Например, запрос "красная /+1 шапочка" приведет к результату, в котором слово "шапочка" следует сразу за словом "красная". К такому же результату привел бы запрос "красная шапочка".

Использование скобок при поиске в Яндекс

Скобки используются для представления в запросе целого выражения. Например, по запросу "(история | технологии | программы)/+1 Linux" будут найдены документы, содержащие одну из фраз "история Linux", "технологии Linux", "программы Linux".

Зоны

Зона - это место поиска нужной вам информации. Вы можете задать зону, в которой вы хотите выполнить поиск - заголовках (зона Title), ссылках (anchors) или адресе (Address). Можно также использовать зону all - поиск по всему документу.

Синтаксис: $имя_зоны запрос.

Например: запрос $title "Microsoft" найдет все документы, в заголовках которых встречается точная фраза "Microsoft".

Дополнительные возможности поиска Яндекс

Поисковая машина Google позволяла ограничить место поиска определенным списком серверов или же, наоборот, исключить некоторые серверы из списка поиска. Точно такие же возможности есть и в поисковой машине Яндекс. Вы также можете искать документы, в которых есть ссылки на определенные URL или картинки. При задании маски файла (например, картинки) можно использовать символ *, означающий все символы, например: ”audi-*”.

Синтаксис следующий: #имя_элемента=”значение”.

    Элементом может быть:
  • url - определенный сайт;
  • link - ссылка;
  • image - картинка;
  • keywords - ключевые слова (*);
  • abstract - аннотация (*);
  • hint - подпись к картинке (*).

Можно выделить следующие основные методы поиска информации в Интернете, которые, в зависимости от целей и задач ищущего, используются по отдельности или в комбинации друг с другом:

1. Непосредственный поиск с использованием гипертекстовых ссылок

Поскольку все сайты в пространстве WWW фактически оказываются связанными между собой, поиск информации может быть произведен путем последовательного просмотра связанных страниц с помощью браузера.
Хотя этот полностью ручной метод поиска выглядит полным анахронизмом в Сети, содержащей более 60 млн. узлов, "ручной" просмотр Web-страниц часто оказывается единственно возможным на заключительных этапах информационного поиска, когда механическое "копание" уступает место более глубокому анализу.
Использование каталогов, классифицированных и тематических списков и всевозможных небольших справочников также относится к этому виду поиска.

2. Использование поисковых машин

Сегодня этот метод является одним из основных и фактически единственным при проведении предварительного поиска. Результатом последнего может являться список ресурсов Cети, подлежащих детальному рассмотрению.
Как правило, применение поисковых машин основано на использовании ключевых слов, которые передаются поисковым серверам в качестве аргументов поиска: что искать.
Если делать все правильно, то формирование списка ключевых слов требует предварительной работы по составлению тезауруса.

3. Поиск с применением специальных средств

Этот полностью автоматизированный метод может оказаться весьма эффективным для проведения первичного поиска.
Одна из технологий этого метода основана на применении специализированных программ - спайдеров, которые в автоматическом режиме просматривают Web-страницы, отыскивая на них искомую информацию.
Фактически это автоматизированный вариант просмотра с помощью гипертекстовых ссылок, описанный выше (поисковые машины для построения своих индексных таблиц используют похожие методы).
Нет нужды говорить, что результаты автоматического поиска обязательно требуют последующей обработки.
Применение данного метода целесообразно, если использование поисковых машин не может дать необходимых результатов (например, в силу нестандартности запроса, который не может быть адекватно задан существующими средствами поисковых машин).
В ряде случаев этот метод может быть очень эффективен.
Выбор между использованием спайдера или поисковых серверов являет собой вариант классического выбора между применением универсальных или специализированных средств.

1.4 Анализ новых ресурсов

Поиск по новообразованным ресурсам может оказаться необходимым при проведении повторных циклов поиска, поиска наиболее свежей информации или для анализа тенденций развития объекта исследования в динамике.
Другой возможной причиной может явиться то, что большинство поисковых машин обновляет свои индексы со значительной задержкой, вызванной гигантскими объемами обрабатываемых данных, и эта задержка обычно тем больше, чем менее популярна интересующая тема.
Это соображение может оказаться весьма существенным при проведении поиска в узкоспециальной предметной области.

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Подобные документы

    Средства поиска информации в сети Интернет. Основные требования и методика поиска информации. Структура и характеристика поисковых сервисов. Глобальные поисковые машины WWW (World Wide Web). Планирование поиска и сбора информации в сети Интернет.

    реферат , добавлен 02.11.2010

    Характеристика методов поиска информации в Интернете, а именно - с использованием гипертекстовых ссылок, поисковых машин и специальных средств. Анализ новых интернет ресурсов. История возникновения и описание западных и русскоязычных поисковых систем.

    реферат , добавлен 12.05.2010

    Описание и классификация современных информационно–поисковых систем. Гипертекстовые документы. Обзор и рейтинги основных мировых поисковых систем. Разработка информационно–поисковой системы, демонстрирующей механизм поиска информации в сети Интернет.

    дипломная работа , добавлен 16.06.2015

    Анализ возможностей поисковых систем Яндекс и Google, их сравнение с точки зрения полезности. История создания поисковых систем, характеристика их интерфейса, поисковых инструментов и алгоритмов. Формирование вопроса и критерий к ответу на него.

    реферат , добавлен 07.05.2011

    Рассмотрение поисковых систем интернета как программно-аппаратного комплекса с веб-интерфейсом, предоставляющего возможность поиска информации. Виды поисковых систем: Archie, Wandex, Aliweb, WebCrawler, AltaVista, Yahoo!, Google, Яндекс, Bing и Rambler.

    реферат , добавлен 10.05.2013

    Структура и принципы построения сети Интернет, поиск и сохранение информации в ней. История появления и классификация информационно-поисковых систем. Принцип работы и характеристики поисковых систем Google, Yandex, Rambler, Yahoo. Поиск по адресам URL.

    курсовая работа , добавлен 29.03.2013

    Сущность и принцип работы глобальной сети Интернет. Поиск информации по параметрам в системе Google. Специализированные системы поиска информации: "КтоТам", "Tagoo", "Truveo", "Kinopoisk", "Улов-Умов". Целесообразное использование поисковых систем.

    презентация , добавлен 16.02.2015

    Хранение данных в сети Internet. Гипертекстовые документы, виды файлов. Графические файлы, их виды и особенности. Поисковые системы и правила поиска информации. Обзор поисковых систем сети Internet. Все о поисковых системах Yandex, Google, Rambler.

    курсовая работа , добавлен 26.03.2011

В глобальной сети Интернет можно найти информацию по любой интересующей теме. Но самое трудное в работе с сетью Интернет — найти нужную информацию. Т. к. Интернет не имеет четкой централизованной структуры, развивается хаотично, и в мире появляются все новые и новые серверы, вопросы поиска информации становятся очень актуальными.

Поисковые системы значительно облегчают работу в Интернет и помогают нам быстро найти нужную информацию в огромном массиве серверов Интернет. Во всемирной паутине Интернет находится несколько тысяч поисковых систем, среди которых есть как уже хорошо зарекомендовавшие себя, так и менее известные.

Наиболее популярные поисковые системы

  • Яндекс — средство полнотекстового поиска информации с учетом морфологии русского языка; поиск по сайтам, своему каталогу, новостям, товарам, географическим картам, словарям, блогам, картинкам, документам Microsoft Office и adobe acrobat PDF
    • Яндекс
  • Rambler (ОАО «Рамблер Интернет Холдинг») — поиск по сайтам с учетом морфологии русского и английского языков; имеет и каталоговую систему поиска.
    • Rambler Lite: поисковая система — краткий вариант страницы поиска
  • Поисковый сервис Спутник (ОАО "Ростелеком") — поиск по сайтам, госуслугам и др.; безопасный поиск
  • NIGMa — интеллектуальная поисковая система (МГУ им. М. В. Ломоносова и Stanford University) — поиск документов, картинок, книг, новостей через Google, Yahoo, MSN, Yandex, Rambler, altavista, Апорт; также система предоставляет уникальный поиск по химическим формулам и реакциям
  • Google — поиск по сайтам (есть возможность поиска по русскоязычным сайтам); поиск документов в форматах adobe acrobat PDF, Microsoft Office, PostScript, Corel WordPerfect, Lotus 1-2-3 и др.; поиск картинок, видео, новостей, поиск по картам; возможность поиска по русскоязычным и российским сайтам; есть система перевода текста на др. языки (49 языков)
  • Bing (Microsoft Corp.) — поиск по сайтам, изображений и видео; возможность поиска по русскоязычным и российским сайтам; есть система перевода текста на др. языки (22 языка)
  • Yahoo! (Yahoo) — поиск по сайтам, адресам E-Mail и др.

Каждая из поисковых систем имеет какие-то свои достоинства и недостатки, которые определяются принципом работы поисковой машины, удобством использования, ее оформлением, сложностью языка запросов, наличием различных расширенных функций (управление форматом и ранжированием выводимой информации, исправление орфографических ошибок и ошибочной раскладки клавиатуры при вводе ключевых слов, перевод страницы на др. языки т. д.), скоростью работы, и др. параметрами. Выбор поисковой системы для конкретного применения определяется целью поиска, характером искомой информации, желаемым форматом выводимых данных и шириной охвата отслеживаемых адресов серверов в мире Интернет.

Поиск по ключевым словам. Язык запросов поисковой системы

Поисковая система обычно имеет поле для ввода ключевых слов, по которым она находит документы, содержащие эти ключевые слова. Чем лучше (качественнее) составлен запрос к поисковой машине, тем меньше общее количество найденных документов, и больше из них документов, соответствующих тому, что Вам требуется. Если запрос очень простой или составлен неграмотно, то поисковая машина может Вам выдать несколько миллионов документов, которые Вам не просмотреть за всю жизнь.

Используя язык запроса, содержащий логические операции (логические операторы AND, OR, NOT, скобки и др.), префиксы обязательности присутствия ключевых слов в документе «+» и «-» (при,поиске по узкоспециализированным терминам — предпочтительней использовать), расположения ключевых слов в документе рядом или на определенном расстоянии и т. д.) и др. элементы, и большее количество связанных ими ключевых слов, можно значительно сузить область поиска и более качественно составить запрос к поисковому серверу. Следует учитывать, что разные поисковые системы могут иметь как различающиеся языки запросов, так и очень похожие.

Некоторые поисковые системы дополнительно имеют функцию расширенного поиска, позволяющую пользователю более точно описать то, что ему конкретно нужно и без знания языка запроса. Функцию расширенного поиска имеют, например, поисковые системы Яндекс и Google .

Основные типы поисковых систем. Какой поисковой системой воспользоваться

Существует 2 основных типа поисковых систем Интернет: индексные и классификационные (каталоговые). Индексные поисковые системы (например, Яндекс , Rambler , Спутник , Google , Bing и др.), работая в автоматическом режиме обновления своей информации, просматривают в Интернет содержимое серверов, индексируя информацию, содержащуюся в них и внося информацию о расположении слов на страницах сайтов в свои базы данных. Каталоговые системы поиска (например, Rambler , Yahoo! и др.) содержат тематически структурированный каталог серверов, и чаще всего пополняются вручную. Обычно на WWW-странице классификационной поисковой системы содержится и поле для ввода ключевых слов для поиска в собственной базе данных. В каталоговой системе поиска можно, начав с более крупной тематической рубрики, и постепенно спускаясь дальше по рубрикам, прийти к ссылке на нужный Вам сайт. В одних случаях бывает удобней воспользоваться первым типом поисковых систем, в других — вторым. Есть поисковые системы, сочетающие в себе оба принципа работы. В частности, многие индексные поисковые системы имеют и каталоговую систему поиска. Также поисковые машины могут использовать и какие-то другие принципы методы поиска.

Многие поисковые системы преобразовались в Интернет-порталы, объединяющие в себе большое количество ресурсов и сервисов. На страницах таких порталов можно прочитать новости, ознакомиться с программой телепередач, узнать о погоде, курсах валют, воспользоваться картографическим сервисом и мн. др.

Наиболее популярные российские поисковые системы имеют возможности поиска с учетом особенностей русского языка.

Для поиска одновременно в нескольких поисковых системах можно воспользоваться так называемыми поисковыми метамашинами, обращающимися сразу к нескольким поисковым средствам, например, NIGMa .

Существуют также поисковые системы, специализирующиеся по поиску по одной какой-либо теме (например, по информационным технологиям, по музыке, по ресурсам, посвященные природе и т. д.)