Навигация
Главная
Поиск
Форум
FAQ's
Ссылки
Карта сайта
Чат программистов

Статьи
-Delphi
-C/C++
-Turbo Pascal
-Assembler
-Java/JS
-PHP
-Perl
-DHTML
-Prolog
-GPSS
-Сайтостроительство
-CMS: PHP Fusion
-Инвестирование

Файлы
-Для программистов
-Компонеты для Delphi
-Исходники на Delphi
-Исходники на C/C++
-Книги по Delphi
-Книги по С/С++
-Книги по JAVA/JS
-Книги по Basic/VB/.NET
-Книги по PHP/MySQL
-Книги по Assembler
-PHP Fusion MOD'ы
-by Kest
Professional Download System
Реклама
Услуги

Автоматическое добавление статей на сайты на Wordpress, Joomla, DLE
Заказать продвижение сайта
Программа для рисования блок-схем
Инженерный калькулятор онлайн
Таблица сложения онлайн
Популярные статьи
OpenGL и Delphi... 65535
Форум на вашем ... 65535
HACK F.A.Q 65535
Бип из системно... 65535
Гостевая книга ... 65535
Invision Power ... 65535
Пример работы с... 65535
Содержание сайт... 65535
ТЕХНОЛОГИИ ДОСТ... 65535
Организация зап... 65535
Вызов хранимых ... 65535
Создание отчето... 65535
Программируемая... 65535
Эмулятор микроп... 65535
Подключение Mic... 65535
Создание потоко... 65535
Приложение «Про... 65535
Оператор выбора... 65535
Модуль Forms 65535
Имитационное мо... 61291
Реклама
Сейчас на сайте
Гостей: 8
На сайте нет зарегистрированных пользователей

Пользователей: 13,125
новичок: vikSv
Новости
Реклама
Выполняем курсовые и лабораторные по разным языкам программирования
Подробнее - курсовые и лабораторные на заказ
Delphi, Turbo Pascal, Assembler, C, C++, C#, Visual Basic, Java, GPSS, Prolog, 3D MAX, Компас 3D
Заказать программу для Windows Mobile, Symbian

Моделирование станции технического обслуживания на GPSS + Отчет
Диплом - база данных поставщиков на Delphi (MS Sql Server)+ Пояснительна...
Моделирование литейного цеха на GPSS + Пояснительная записка

Реклама



Подписывайся на YouTube канал о программировании, что бы не пропустить новые видео!

ПОДПИСЫВАЙСЯ на канал о программировании
Безопасный и удобный поиск
Главное, с чем сталкиваешься при написании
скрипта для поиска - то, что все кажется простым, но объем кода быстро
нарастает.



Обработка строки



 



Первым делом надо порезать ручками строку.



$ search = substr($ search, 0, 64);



64 символов пользователю будет достаточно для
поиска. Теперь каленым железом выжжем все "ненормальные" символы.



$ search = preg_replace("/[^(w)|(x7F-xFF)|(s)]/",
" ", $ search);



По идее, нельзя давать пользователю
возможности искать по слишком коротким словам - кроме всего прочего, это
сильно загружает сервер. Итак, разрешим искать только по словам, которые
длиннее двух букв (если ограничение больше, надо заменить "{1,2}" на
"{1, кол-во символов}").



$ good = trim(preg_replace("/s([^s]{1,2})s/",
" ", ereg_replace("[ ]+", "  "," $ search ")));



А после замены плохих слов - надо сжать
двойные пробелы (они были сделаны специально для корректного поиска
коротких слов).



$ good = ereg_eplace("[ ]+", " ", $ good);



Логика



 



Допустим, мы хотим
предоставить пользователю возможность выбирать логику поиска - искать
все слова или только одно из нескольких. Если вы хотите сделать как в




Яндексе
[2] [1] - два амперсанта
означают "И" (слово1&&слово2&&слово3) или как-то еще, то я не советчик.
Шаманство со строками на небольшом сайте imho не оправдывает
затраченного времени. Поэтому форму для поиска рисуем так:





Начало формы







Конец формы





А в поисковом скрипте лишний раз проверяем, что пользователь ввел:



if ($ logic!="AND" && $
logic!="OR")

  $ logic = "OR";



Как будет использоваться логика — ниже.



Релевантность 



Наверное, в том же



Яндексе
[2] [1] все видели ссылочку
"сортировать по релевантности". Это оно и есть. Сортировка результатов
по количеству совпадений слов.



Отчасти, кстати, такая сортировка снимает проблему обработки логики
поиска. Но с БД MySQL делать такую сортировку очень сложно. Надо сперва
выбрать, где есть все слова, потом записи, где разные слова (исключив
предыдущие). Если у вас постраничный вывод - то вообще дело труба!



Статистика поиска 



Неплохо будет сразу информировать
пользователя, сколько он нашел строк таблицы. Для этого делается
дополнительный запрос в базу
:



$ query = "SELECT id FROM table
WHERE field LIKE '%". str_replace(" ", "%' OR field LIKE '%", $ good).
"%'";



Для статистики по отдельным словам можно
сделать следующее
:



$ word = explode(" ", $search);

while (list($ k, $ v) = each($ word)) {

  if (strlen($ v)>2)

    $ stat[]="$ v:". mysql_num_rows(mysql_query("SELECT id FROM table
WHERE field LIKE '%$ v%'"));

  else

    $ stat[]="$ v: <font color=#cc0000>
короткое</font>";

  };

$ word_stats = "
Статистика слов:
". implode("", $ stat).
"<br>";

unset($ stat);



Постраничный вывод результатов



 



Ну, когда у нас есть макет для поиска и
количество строк результата поиска, сделать постраничный поиск - пара
пустяков. Проверяем переменную $ page (не меньше 0, не больше $
results_amount/$ rows_in_page).



В запрос, который подсчитывает количество строк (смотри выше), пишем
нужные нам поля и поля для сортировки. А потом дописываем



if ($ page==0)

  $ request .= "LIMIT $ rows_in_page";

else

  $ request .=
"LIMIT ". $ page*$
rows_in_page. ",". $ rows_in_page;



(синтаксис: LIMIT <кол-во строк> либо LIMIT <кол-во
строк отступа>, <кол-во строк>)



В результате выполнения подобного запроса мы получим именно те самые
строки, которые надо выводить на странице.



Для навигации можно либо рисовать ссылки на следующую и предыдущую
страницы, либо, что сложнее, делать панель навигации на несколько
страниц.



if ($ page>0)

  print ("<a href=search.php?search=". rawurlencode($ good). "&page=".
($ page-1). ">
предыдущая страница</a>");



if ($ page<$ results_amount/$ rows_in_page)

  print ("<a href=search.php?search=". rawurlencode($ good).

"&page=". ($ page+1). ">следующая страница</a>");



Подсветка



 



Чтобы подсвечивать светом или жирным шрифтом
искомые слова в тексте, надо сделать всего лишь следующее:





$ highlight = "(". str_replace(" ", "|", $ good). ")";



Пробелы (а они у нас между словами стоят
поодиночке, и нигде двойной пробел не встречается, к тому же с концов
строки мы их тоже вырезали) достаточно заменить на вертикальную черту -
разделитель вариантов в регулярных выражениях. "Плохие" слова мы не
подсвечиваем, потому что в базе их не ищем :).



В коде, который выводит текст пишем:





$ row["text"] = ereg_replace($ highlight, "<font
color=#cc0000>1</font>", $ row["text"]);



После написания выпуска я кинулся, было,
писать и себе "подсветку". Не тут-то было! У меня в тексте встречаются
теги HTML, поэтому пришлось много подумать... Получилась вот такая вещь
(строка со словами для подсветки есть):



$ text = eregi_replace(">([^<]*)$
words", ">1<font color=#cc0000>2</font>3<", $ text);



Приходится смотреть, нет в теге ли это слово.
Однако тут встает проблема ресурсоемкости такой замены (мой K6-266 над
текстом в 5 килобайт думал целых семь секунд). Печально.



Итог



 



Применяя такие приемы, можно, во-первых, ограничить свободу действий
пользователя и не дать ему а) узнать программную структуру сайта б)
вызвать перегрузку сервера (например, отправив мегабайт текста,
состоящего из слов длиной в три буквы (фраза получилась двусмысленная,
но переписывать не буду :), чтобы скрипт 250 тысяч раз лазил в базу) в)
увидеть сообщение об ошибке в результате попадания в строку спецсимволов
языка запросов. Во-вторых, некоторое удобство для пользователя -
постраничный вывод и подсветка.

Опубликовал Kest Октябрь 26 2008 15:47:09 · 0 Комментариев · 5905 Прочтений · Для печати

• Не нашли ответ на свой вопрос? Тогда задайте вопрос в комментариях или на форуме! •


Комментарии
Нет комментариев.
Добавить комментарий
Имя:



smiley smiley smiley smiley smiley smiley smiley smiley smiley
Запретить смайлики в комментариях

Введите проверочный код:* =
Рейтинги
Рейтинг доступен только для пользователей.

Пожалуйста, залогиньтесь или зарегистрируйтесь для голосования.

Нет данных для оценки.
Гость
Имя

Пароль



Вы не зарегистрированны?
Нажмите здесь для регистрации.

Забыли пароль?
Запросите новый здесь.
Поделиться ссылкой
Фолловь меня в Твиттере! • Смотрите канал о путешествияхКак приготовить мидии в тайланде?
Загрузки
Новые загрузки
iChat v.7.0 Final...
iComm v.6.1 - выв...
Visual Studio 200...
CodeGear RAD Stud...
Шаблон для новост...

Случайные загрузки
C++ Стандартная б...
Billenium Effects...
SearchAndReplace
Ильдар Хабибуллин...
Пример создания W...
Алгоритм трассиро...
Защита от спама ...
MicroGPSS Studen ...
HtmlLerz PRO
JanReplace
Delphix Sample [И...
C# 2005 и платфор...
Delphi 2005 для .NET
Аватары в комме...
Mass Photo Upload
SynEdit
Обучение Borland ...
Искусство програм...
Blib [Исходник на...
Zoom [Исходник на...

Топ загрузок
Приложение Клие... 100548
Delphi 7 Enterp... 92647
Converter AMR<-... 20109
GPSS World Stud... 15768
Borland C++Buil... 13295
Borland Delphi ... 9301
Turbo Pascal fo... 7124
Калькулятор [Ис... 5264
Visual Studio 2... 5042
FreeSMS v1.3.1 3564
Случайные статьи
Малая вирусная энц...
ПРАВИЛА
Символы, используе...
GSNW, членом групп...
Внешнее определени...
События - блокирую...
Структура сообщени...
Восстановление сис...
Шаблоны и... шаблоны
Проверка достоверн...
Сп 118.13330.2012
Storm Internationa...
ВИРУСЫ: общие свед...
Европейская рулетк...
Что произойдет, ес...
Systems Management...
«Говорящая» подска...
Снова интерфейс и ...
Форма Access - про...
Приведение к супер...
Попрактикуйтесь в ...
Устройства доступа...
Обратные сортировк...
Монетизация интерн...
Бесплатная раскрутка
Статистика



Друзья сайта
Программы, игры


Полезно
В какую объединенную сеть входит классовая сеть? Суммирование маршрутов Занимают ли таблицы память маршрутизатора?