Навигация
Главная
Поиск
Форум
FAQ's
Ссылки
Карта сайта
Чат программистов

Статьи
-Delphi
-C/C++
-Turbo Pascal
-Assembler
-Java/JS
-PHP
-Perl
-DHTML
-Prolog
-GPSS
-Сайтостроительство
-CMS: PHP Fusion
-Инвестирование

Файлы
-Для программистов
-Компонеты для Delphi
-Исходники на Delphi
-Исходники на C/C++
-Книги по Delphi
-Книги по С/С++
-Книги по JAVA/JS
-Книги по Basic/VB/.NET
-Книги по PHP/MySQL
-Книги по Assembler
-PHP Fusion MOD'ы
-by Kest
Professional Download System
Реклама
Услуги

Автоматическое добавление статей на сайты на Wordpress, Joomla, DLE
Заказать продвижение сайта
Программа для рисования блок-схем
Инженерный калькулятор онлайн
Таблица сложения онлайн
Популярные статьи
OpenGL и Delphi... 65535
Форум на вашем ... 65535
HACK F.A.Q 65535
Бип из системно... 65535
Гостевая книга ... 65535
Invision Power ... 65535
Содержание сайт... 65535
Организация зап... 65535
Вызов хранимых ... 65535
Программируемая... 65535
Эмулятор микроп... 65535
Подключение Mic... 65535
Создание потоко... 65535
Приложение «Про... 65535
Оператор выбора... 65535
Создание отчето... 65105
Модуль Forms 64887
Пример работы с... 63356
ТЕХНОЛОГИИ ДОСТ... 61584
Имитационное мо... 57448
Реклама
Сейчас на сайте
Гостей: 5
На сайте нет зарегистрированных пользователей

Пользователей: 13,081
новичок: Abdukarimov A
Новости
Реклама
Выполняем курсовые и лабораторные по разным языкам программирования
Подробнее - курсовые и лабораторные на заказ
Delphi, Turbo Pascal, Assembler, C, C++, C#, Visual Basic, Java, GPSS, Prolog, 3D MAX, Компас 3D
Заказать программу для Windows Mobile, Symbian

Обработка задач на ЭВМ на GPSS + Пояснительная записка
Моделирование работы перекрёстка по регулированию движения на GPSS + Поя...
Программа тестирования (тест) - вступительные экзамены (математика, физи...

Реклама



Подписывайся на YouTube канал о программировании, что бы не пропустить новые видео!

ПОДПИСЫВАЙСЯ на канал о программировании
Ограничение возможностей работы Гугла со словоформами редких слов видно на примере словосочетания «глоклая куздра»



ПРИМЕР
Запрос 1: [глоклая куздра]
Результат поиска: 1–10 примерно из 50 для глоклая куздра .
Запрос 2: [глоклую куздру]
Результат поиска: 1–3 из 3 для глоклую куздру .
Запрос 3: [глоклой куздре]
Результат поиска: 1–6 из 6 для глоклой куздре .


Просто для сравнения приведем результат Яндекса. По всем трем запросам о глоклой куздре Яндекс давал на момент написания книги одинаковый результат.
Результат поиска: страниц – 52, сайтов – не менее 22.
Мы рекомендуем в ответственных случаях вводить важные слова в разных словоформах вручную, чтобы избежать ошибок.
Ниже будут показаны случаи, когда даже по общеупотребительным словам Гугл словоформы обрабатывает не вполне корректно.


ПРИМЕР
Запрос 1: [журавль]
Результат поиска: 1–10 примерно из 656 000 для журавль .
В выдаче: ЖУРАВЛЬ СЕРЫЙ
ЖУРАВЛЬ СЕРЫЙ (Grus grus) это как раз тот самый журавль, чьи звонкие крики мы сльшим высоко в небе весной и осенью. Это крупная птица ростом около 125 см и… www.floranimal.ru/pages/animal/zh/1325.html – 22k.
Запрос 2: [журавль -журавль]
Результат: 1–10 из примерно 322 000 для журавль –журавль .
В выдаче: Гамзатов, Расул.
ЖУРАВЛИ Мне кажется порою, что солдаты, С кровавых не пришедшие полей… Сегодня, предвечернею порою, Я вижу, как в тумане журавли Летят своим… www.litera.ru/stixiya/authors/gamzatov/mne-kazhetsya-poroyu.html – 6k.


Улучшение запроса во время поиска. По мере того как вы проводите поиск, в найденных текстах обнаруживаются слова, которые вы упустили из виду, создавая запрос. В ряде случаев результаты станут точнее, если по этим словам проводить поиск дополнительно, составляя отдельные запросы. Подчеркнем особо – это должны быть именно отдельные запросы. Если же добавлять эти слова к уже имеющемуся запросу, то можно иногда излишне сузить диапазон результатов – ведь Гугл будет пытаться выдать документ, в котором содержатся все слова запроса.
Исключение слов из запроса. Логическое «НЕ». Как известно, при составлении запроса часто встречается информационный мусор. Чтобы его удалить, стандартно используются операторы исключения – логическое «НЕ». В Гугле такой оператор представлен знаком «минус» – идентичным оператору Яндекса «двойная тильда» (~~). Используя этот оператор, можно исключать из результатов поиска те страницы, которые содержат в тексте определенные слова.


ПРИМЕР
Запрос 1: [Журавль колодец]
Результат поиска:1–10 из примерно 91 200 для Журавль колодец .
Запрос 2: [ Журавль колодец -птица ]
Результат поиска: 1–10 из примерно 40 400 для Журавль колодец-птица . Запрос 3: [Журавль колодец -птица]
Результат 1–10 из примерно 508 000 для Журавль -колодец -птица .


Кстати, в этом запросе также проявилось, на наш взгляд, несовершенство поддержки морфологии русского языка Гуглом. Так, в момент написания книги в выдаче присутствовал текст, содержащий слово «птицы»: СЕМЕЙСТВО ЖУРАВЛИ.


ПРИМЕР
Семейство ЖУРАВЛИ (Gruidae). К семейству журавлиных относятся крупные длинноногие птицы с длинной шеей и прямым копьевидным клювом…
www.floranimal.ru/families/4295.html – 16k.
Запрос 3: [Журавль -колодец -птица -птицы]
Результат поиска: 1–10 примерно из 450 000 для Журавль -колодец -птица -птицы.
И в результатах по этому запросу документа со словом «птицы», приведенного выше, не оказалось.
Запрос 4: [Журавль -колодец -птица -птицы -журавли]
Результат поиска: 1–10 примерно из 432 000 для Журавль -колодец -птица -птицы -журавли.


Поиск точной фразы. Точная фраза на практике, как мы уже говорили, требуется либо при поиске текста определенного произведения, либо при поиске определенных продуктов или компаний, в которых название или часть описания представляет собой стабильно повторяющееся словосочетание.
Чтобы справиться с поиском точной фразы при помощи Гугла, требуется заключить запрос в двойные кавычки.


ПРИМЕР
Забавным, но показательным примером может быть задание из учебника русского языка для седьмого класса под редакцией Н. М. Шанского. На странице 45 приведено задание разделить текст на абзацы. Фрагмент взят из произведения М. Шолохова (название не указано):
«За Доном в лесу прижилась тихая, ласковая осень. С шелестом падали с тополей сухие листья. Кусты шиповника стояли, будто объятые пламенем, и красные ягоды в редкой листве их пылали, как огненные язычки».


Введем этот текст в кавычках в Гугл.


ПРИМЕР
Результат поиска: 1–3 из 3 для «За Доном в лесу прижилась тихая, ласковая осень. С шелестом падали с тополей сухие листья. Кусты шиповника стояли, будто объятые пламенем, и красные ягоды в редкой листве их пылали, как огненные язычки» . Как выяснилось, это отрывок из «Тихого Дона» (книги четвертой). А забавность примера в том, что у Шолохова этот текст оказался вообще не разбитым на абзацы.


Гугл воспринимает как знаки, связывающие слова в единую фразу, не только кавычки, но и дефис, слэш (косую черту), точку, знак равенства, апостроф.
Результат поиска: 1–10 из примерно 124 000 для мать-и-мачеха.
Результат поиска: 1–10 из примерно 124 000 для мать-и-мачеха.
Результат поиска: 1–10 из примерно 124 000 для мать-и-мачеха.
Результат поиска: 1–10 из примерно 124 000 для мать-и-мачеха.
Результат поиска: 1–10 из примерно 124 000 для мать-и-мачеха .
Во всех вышеприведенных случаях первым в выдаче стоит текст, фрагмент которого приведен ниже: « Мать-и-мачеха (Tussilago farfara) – одно из самых раноцветущих растений: зацветает в … Как лекарственное растение мать-и-мачеха применяется, прежде всего…»
При этом все три слова – «мать», «и», «мачеха» – рассматриваются как отдельные, но стоящие рядом и в этой последовательности.
Интересно, что по запросу [мать-и-мачеха] оказалось на 100 документов больше, чем по остальным, но если взять это слово в кавычки, то результат уравнивается.


ПРИМЕР
Запрос: [“мать-и-мачеха”]
Результат поиска: 1–10 примерно из 27 300 для “мать-и-мачеха” .
Чтобы прояснить этот казус, введем запрос такого вида: [мать-и-мачеха – “мать-и-мачеха”].
Результат поиска: 1–10 из примерно 35 для “мать-и-мачеха” . В выдаче: Санкт-Петербургская Федерация Настольного Футбола Матьимачеха . Королев Петр Трушков Кирилл. 2. Экспромт. Гриневич Василий… Мать-имачеха – игроки получают по 60 рейтинговых очков; Экспромт – игроки… www.kickerclub.spb.ru/tournaments/2005-09-03.html 17k


Количество слов в строке поиска. Во многих источниках встречается информация, что поисковая строка Гугла вмещает 10 слов или что Гугл проводит поиск только по 10 словам.
На момент написания книги Гугл учитывал в запросе 32 слова, а все последующие слова игнорировал. Это хорошо видно, если ввести запрос, содержащий числительные подряд. Например, числа с 1 до 35. В результатах как релевантные отображаются только первые 32 слова запроса: [+1 +2 +3 +4 +5 +6 +7 +8 +9 +10 +11 +12 +13 +14 +15 +16 +17 +18 +19 +20 +21 +22 +23 +24 +25 +26 +27 +28 +29 +30 +31 +32 +33 +34 +35].
Результат поиска: 1–10 из примерно 381 000 000 для +1 +2 +3 +4 +5 +6 +7 +8 +9 +10 +11 +12 +13 +14 +15 +16 +17 +18 +19 +20 +21 +22 +23 +24 +25 +26 +27 +28 +29 +30 +31 +32 +33 +34 +35. В выдаче: Тематический рубрикатор.
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52… www.amr.ru/topics/index.php?PAGEN_2=8 – 72k - .
В кэше подчеркнуты только 32 слова, и в тексте они также присутствуют.
Стемминг (а также wildcard ). Стемминг – возможность усечения слова до его корня. После этого усечения производится поиск релевантных вариантов слов, производных от него. Другими словами, стемминг позволяет искать все однокоренные слова. Техника поиска по маске (wildcard) представляет собой написание базового слова (или его части), после которых идет символ маски – «звездочка» (*), заменяющая собой любое возможное продолжение слова. Таким образом, если поисковая машина поддерживает поиск по маске, то ищутся все слова, которые одинаково начинаются. Эта техника особенно удобна, когда вам неизвестно точное написание конкретного слова либо когда вы хотите включить все возможные варианты слова в свой поиск.
Например, когда по запросу [тарт*] получают как «тарталетку», так и «тартар». Так вот, Гугл эти технологии не поддерживает (как и Яндекс). Зато он поддерживает вариант, когда вместо целого слова вводится звездочка.
Например, по запросу [красная * площадь] будет выдано: «Красная, Манежная площади», с подчеркиванием всех этих слов. В какой-то степени это похоже на поиск с расстоянием между словами, применяемый в Яндексе.
По запросу [красная * * площадь] будет выдано: «Рамблер-Фото > fanphoto >Красная и Манежная площади, Коломенское; Красная и Манежная площади; Воробьевы горы Кошки Цветы Зоопарк 2007 Еще метро Метро Поклонная гора Зоопарк 2006 ВДНХ Царицыно… foto.rambler.ru/users/fanphoto/11/ – 35k –».
По запросу [красная *** площадь] будет выдано: «Афиша: Новосибирск / Места / Магазины / Обувь Любым, Гагаринская, Заельцовская, Красный проспект, Маршала Покрышкина, Площадь Гарина-Михайловского, Площадь Ленина, Площадь Маркса, Речной вокзал… novosibirsk.afisha.ru/places/catalogue/?id=969066 – 31k».
Дополнительные операторы.
1. Оператор cache: – поисковая машина хранит версию текста, которая проиндексирована поисковым пауком, в специальном хранилище в формате, называемом кэшем. Кэшированную версию страницы можно извлечь, если оригинальная недоступна (например, не работает сервер, на котором она хранится). Кэшированная страница показывается в том виде, в котором она хранится в базе данных поисковой машины, и при показе пользователю сопровождается надписью наверху о том, что это страница из кэша. Там же содержится информация о времени создания кэшированной версии. На странице из кэша ключевые слова запроса для удобства пользователя подсвечены, причем каждое из них своим цветом.
Например: «Это сохраненная в кэше Google копия страницы http://ci-razvedka.com/ , записанная 20 май 2007 20:10:24 GMT».
Сохраненные в кэше Гугла страницы показываются в том виде, в каком они находились в момент добавления в нашу базу. Можно создать запрос, который сразу будет выдавать кэшированную версию страницы с определенным адресом. Например, запрос [cache:www.ci-razvedka.ru] будет сразу выдавать версию страницы www.ci-razvedka.ru из кэша, а не проверять ее нынешнее состояние.
ВНИМАНИЕ! Пробела между оператором cashe: и URL’ом запрашиваемой страницы быть не должно.
Если вы хотите, чтобы ключевые слова на кэшированной версии страницы были подчеркнуты, их надо через пробел указать после оператора cashe: и адреса страницы. Например: [cache:www.ci-razvedka.ru книга]
2. Оператор info: позволяет увидеть информацию, которая известна Гуглу о данной странице. Например, запрос [info:www.ru-ci.ru] дает следующий результат: Ющук Евгений Леонидович. Конкурентная разведка и Информационная…
Публикации по теме негативных пиар-технологий. Сайт Невидимый Интернет. Материалы по теме информационной войны, размещаемые на этом сайте… ru-ci.ru/».
Опубликовал Kest August 27 2009 13:45:51 · 0 Комментариев · 15356 Прочтений · Для печати

• Не нашли ответ на свой вопрос? Тогда задайте вопрос в комментариях или на форуме! •


Страница 1 из 2 1 2 >
Комментарии
Нет комментариев.
Добавить комментарий
Имя:



smiley smiley smiley smiley smiley smiley smiley smiley smiley
Запретить смайлики в комментариях

Введите проверочный код:* =
Рейтинги
Рейтинг доступен только для пользователей.

Пожалуйста, залогиньтесь или зарегистрируйтесь для голосования.

Нет данных для оценки.
Гость
Имя

Пароль



Вы не зарегистрированны?
Нажмите здесь для регистрации.

Забыли пароль?
Запросите новый здесь.
Поделиться ссылкой
Фолловь меня в Твиттере! • Смотрите канал о путешествияхКак приготовить мидии в тайланде?
Загрузки
Новые загрузки
iChat v.7.0 Final...
iComm v.6.1 - выв...
Visual Studio 200...
CodeGear RAD Stud...
Шаблон для новост...

Случайные загрузки
Indy in Depth Глу...
MicroGPSS Studen ...
Animation (Пример...
Converter AMR<->W...
PCX
Распознавание иде...
Интерактивный инт...
Пример создания W...
Иллюстрированный ...
Domen Name IP
Allsubmitter 4.7 ...
Удаление своего EXE
Strawberry Prolog...
Модифицированная ...
Учебник по создан...
Разработка Web-пр...
Введение в станда...
PrevInst
Философия C++. Пр...
JanButtonsV

Топ загрузок
Приложение Клие... 100466
Delphi 7 Enterp... 86653
Converter AMR<-... 20077
GPSS World Stud... 12670
Borland C++Buil... 11760
Borland Delphi ... 8560
Turbo Pascal fo... 7037
Visual Studio 2... 4998
Калькулятор [Ис... 4763
FreeSMS v1.3.1 3541
Случайные статьи
Сетевой экран Wind...
Средства отладки
Создание записей э...
Изоморфизм д.з.к. ...
Ввод-вывод символь...
Поиск максимальног...
Типы данных. Целоч...
Структура сообщени...
Лайтбоксы и вывеск...
Если у клиента либ...
Глобальные Multica...
SPLIT (РАСЩЕПИТЬ)
Поиск в упорядочен...
Расцепляйте модели...
Синхронизация данных
Краткие выводы по ...
Классификация устр...
Изменение направле...
Использование иден...
Шинная топология ЛВС
Topology Change и ...
3. Приведенный ниж...
Особенности модаль...
Когда наступает по...
Использование толь...
Статистика



Друзья сайта
Программы, игры


Полезно
В какую объединенную сеть входит классовая сеть? Суммирование маршрутов Занимают ли таблицы память маршрутизатора?