Навигация
Главная
Поиск
Форум
FAQ's
Ссылки
Карта сайта
Чат программистов

Статьи
-Delphi
-C/C++
-Turbo Pascal
-Assembler
-Java/JS
-PHP
-Perl
-DHTML
-Prolog
-GPSS
-Сайтостроительство
-CMS: PHP Fusion
-Инвестирование

Файлы
-Для программистов
-Компонеты для Delphi
-Исходники на Delphi
-Исходники на C/C++
-Книги по Delphi
-Книги по С/С++
-Книги по JAVA/JS
-Книги по Basic/VB/.NET
-Книги по PHP/MySQL
-Книги по Assembler
-PHP Fusion MOD'ы
-by Kest
Professional Download System
Реклама
Услуги

Автоматическое добавление статей на сайты на Wordpress, Joomla, DLE
Заказать продвижение сайта
Программа для рисования блок-схем
Инженерный калькулятор онлайн
Таблица сложения онлайн
Популярные статьи
OpenGL и Delphi... 65535
Форум на вашем ... 65535
21 ошибка прогр... 65535
HACK F.A.Q 65535
Бип из системно... 65535
Гостевая книга ... 65535
Invision Power ... 65535
Пример работы с... 65535
Содержание сайт... 65535
ТЕХНОЛОГИИ ДОСТ... 65535
Организация зап... 65535
Вызов хранимых ... 65535
Создание отчето... 65535
Имитационное мо... 65535
Программируемая... 65535
Эмулятор микроп... 65535
Подключение Mic... 65535
Создание потоко... 65535
Приложение «Про... 65535
Оператор выбора... 65535
Реклама
Сейчас на сайте
Гостей: 18
На сайте нет зарегистрированных пользователей

Пользователей: 13,372
новичок: vausoz
Новости
Реклама
Выполняем курсовые и лабораторные по разным языкам программирования
Подробнее - курсовые и лабораторные на заказ
Delphi, Turbo Pascal, Assembler, C, C++, C#, Visual Basic, Java, GPSS, Prolog, 3D MAX, Компас 3D
Заказать программу для Windows Mobile, Symbian

Обратное размещение элементов ЭВС на Delphi + Пояснительная записка
Моделирование работы участка термической обработки шестерен на GPSS + По...
Моделирование ЭВМ на GPSS (три класса заданий) + Пояснительная записка

15.2. Фразы
Слова — основа любого документа. Множество важных задач можно решить поиском слов. Однако иногда приходится искать фразы наподобие «поиск подстроки» или «неявные структуры данных» в длинных строках (в собственных документах, файлах справки, web-страницах или вообще во всей сети).
Как бы вы стали искать в большом тексте «фразу из нескольких слов»? Если вы никогда не видели этого текста, вам пришлось бы начать с начала и просмотреть его целиком. В большинстве учебников по теории алгоритмов описываются различные подходы к решению задачи «поиска подстроки».
Предположим, что у вас есть возможность заранее подготовить текст перед тем, как осуществлять поиск. Можно сделать хэш-таблицу или дерево поиска для индексации всех слов документа и хранить в ней список всех вхождений всех слов документа. Такой обратный индекс позволит программе быстро найти в тексте любое слово. Фразы можно разделять на отдельные слова, но это сложно реализовать и такая программа может оказаться медленной. Однако в некоторых поисковых системах в Интернете для индексации web-страниц используется именно этот подход.
Теперь мы возьмем мощную структуру данных и используем ее в небольшой задаче. Нужно найти самую длинную повторяющуюся подстроку символов в большом текстовом файле. Например, самая длинная повторяющаяся подстрока в фразе «Ask not what your country can do for you, but what you can do for your country» — «can do for you», тогда как подстрока «your country» стоит на втором месте. Как бы вы написали программу, решающую эту задачу?
Здесь уместно вспомнить задачу об анаграммах из раздела 2.4 главы 2. Если входная строка хранится в массиве с [0..п-1], мы можем начать с последовательного сравнения всех возможных пар подстрок, написав что-нибудь подобное:
maxlen = -1
for i = [0, n) for j = (i , n)
if (thislen = comlen(&c[i]. &c[j])) > maxlen maxien = thislen maxi = i maxj = j
Функция comlen (листинг 15.7) возвращает длину одинаковой части двух строк (начиная с первых символов), передаваемых ей в качестве аргументов.
Листинг 15.7. Функция comlen — вычисление длины общей части двух строк
int comlen(char *р, char *q)
i = О
while *p && (*p++ == *q+ + ) i ++ return i
Поскольку этот алгоритм проверяет все возможные пары подстрок, он является квадратичным. Мы смогли бы ускорить его с помощью хэш-таблицы для поиска слов в фразах, но вместо этого мы попробуем новый подход.
Наша новая программа будет обрабатывать не более MAXN символов, хранящихся в массиве с:
#define MAXN 5000000 char с[MAXN], *а[MAXN],
Опубликовал vovan666 April 17 2013 00:04:43 · 0 Комментариев · 3114 Прочтений · Для печати

• Не нашли ответ на свой вопрос? Тогда задайте вопрос в комментариях или на форуме! •


Комментарии
Нет комментариев.
Добавить комментарий
Имя:



smiley smiley smiley smiley smiley smiley smiley smiley smiley
Запретить смайлики в комментариях

Введите проверочный код:* =
Рейтинги
Рейтинг доступен только для пользователей.

Пожалуйста, залогиньтесь или зарегистрируйтесь для голосования.

Нет данных для оценки.
Гость
Имя

Пароль



Вы не зарегистрированны?
Нажмите здесь для регистрации.

Забыли пароль?
Запросите новый здесь.
Поделиться ссылкой
Фолловь меня в Твиттере! • Смотрите канал о путешествияхКак приготовить мидии в тайланде?
Загрузки
Новые загрузки
iChat v.7.0 Final...
iComm v.6.1 - выв...
Visual Studio 200...
CodeGear RAD Stud...
Шаблон для новост...

Случайные загрузки
Apollovcl61
Алгоритм DES шифр...
Разработка клиент...
Indy in Depth Глу...
DelphiXIsoDemo1
Crypt32
Использование Lis...
IconCut [Исходник...
Применение жадног...
GamesBase 3.0
Assembler. Учебни...
Tank [Исходник на...
Preview
Переработанный пл...
Microsoft Press -...
Защита от спама ...
Иллюстрированный ...
Карта сайта
Правила программи...
Как программирова...

Топ загрузок
Приложение Клие... 100801
Delphi 7 Enterp... 98068
Converter AMR<-... 20304
GPSS World Stud... 17070
Borland C++Buil... 14262
Borland Delphi ... 10389
Turbo Pascal fo... 7399
Калькулятор [Ис... 6094
Visual Studio 2... 5242
Microsoft SQL S... 3677
Случайные статьи
0 без пакетов испр...
Обычный режим UNICAST
SIMULATE (МОДЕЛИРО...
Сортировка списка ...
svc.cpp
Как Windows обнови...
Кошачий туалет зак...
Если столбец sever...
Руки прочь от PHP!
Мониторинг
"Jj Issued certifi...
Сжатие данных
Локальные сети с п...
Оператор присваивания
Обработка ошибок
Яндекс учитывает м...
Игровой клуб казин...
Fruit Cocktail
Карта SIMULATE
Протокол анонсиров...
10.7. Дополнительн...
Закрытые данные ка...
7.7. Дополнительна...
Акселерометры
Книга Ра в Вулкан ...
Статистика



Друзья сайта
Программы, игры


Полезно
В какую объединенную сеть входит классовая сеть? Суммирование маршрутов Занимают ли таблицы память маршрутизатора?