Навигация
Главная
Поиск
Форум
FAQ's
Ссылки
Карта сайта
Чат программистов

Статьи
-Delphi
-C/C++
-Turbo Pascal
-Assembler
-Java/JS
-PHP
-Perl
-DHTML
-Prolog
-GPSS
-Сайтостроительство
-CMS: PHP Fusion
-Инвестирование

Файлы
-Для программистов
-Компонеты для Delphi
-Исходники на Delphi
-Исходники на C/C++
-Книги по Delphi
-Книги по С/С++
-Книги по JAVA/JS
-Книги по Basic/VB/.NET
-Книги по PHP/MySQL
-Книги по Assembler
-PHP Fusion MOD'ы
-by Kest
Professional Download System
Реклама
Услуги

Автоматическое добавление статей на сайты на Wordpress, Joomla, DLE
Заказать продвижение сайта
Программа для рисования блок-схем
Инженерный калькулятор онлайн
Таблица сложения онлайн
Популярные статьи
OpenGL и Delphi... 65535
Форум на вашем ... 65535
HACK F.A.Q 65535
Бип из системно... 65535
Гостевая книга ... 65535
Invision Power ... 65535
Содержание сайт... 65535
Организация зап... 65535
Вызов хранимых ... 65535
Программируемая... 65535
Эмулятор микроп... 65535
Подключение Mic... 65535
Создание потоко... 65535
Приложение «Про... 65535
Оператор выбора... 65535
Создание отчето... 65019
Модуль Forms 64812
Пример работы с... 63161
ТЕХНОЛОГИИ ДОСТ... 61521
Имитационное мо... 57363
Реклама
Сейчас на сайте
Гостей: 6
На сайте нет зарегистрированных пользователей

Пользователей: 13,081
новичок: Abdukarimov A
Новости
Реклама
Выполняем курсовые и лабораторные по разным языкам программирования
Подробнее - курсовые и лабораторные на заказ
Delphi, Turbo Pascal, Assembler, C, C++, C#, Visual Basic, Java, GPSS, Prolog, 3D MAX, Компас 3D
Заказать программу для Windows Mobile, Symbian

Калькулятор на Delphi с переводом в другую систему исчисления + Блок схемы
Файл записей с выводом обратного заголовка на Turbo Pascal
Моделирование работы участка термической обработки шестерен на GPSS + По...

Реклама



Подписывайся на YouTube канал о программировании, что бы не пропустить новые видео!

ПОДПИСЫВАЙСЯ на канал о программировании
15.2. Фразы
Слова — основа любого документа. Множество важных задач можно решить поиском слов. Однако иногда приходится искать фразы наподобие «поиск подстроки» или «неявные структуры данных» в длинных строках (в собственных документах, файлах справки, web-страницах или вообще во всей сети).
Как бы вы стали искать в большом тексте «фразу из нескольких слов»? Если вы никогда не видели этого текста, вам пришлось бы начать с начала и просмотреть его целиком. В большинстве учебников по теории алгоритмов описываются различные подходы к решению задачи «поиска подстроки».
Предположим, что у вас есть возможность заранее подготовить текст перед тем, как осуществлять поиск. Можно сделать хэш-таблицу или дерево поиска для индексации всех слов документа и хранить в ней список всех вхождений всех слов документа. Такой обратный индекс позволит программе быстро найти в тексте любое слово. Фразы можно разделять на отдельные слова, но это сложно реализовать и такая программа может оказаться медленной. Однако в некоторых поисковых системах в Интернете для индексации web-страниц используется именно этот подход.
Теперь мы возьмем мощную структуру данных и используем ее в небольшой задаче. Нужно найти самую длинную повторяющуюся подстроку символов в большом текстовом файле. Например, самая длинная повторяющаяся подстрока в фразе «Ask not what your country can do for you, but what you can do for your country» — «can do for you», тогда как подстрока «your country» стоит на втором месте. Как бы вы написали программу, решающую эту задачу?
Здесь уместно вспомнить задачу об анаграммах из раздела 2.4 главы 2. Если входная строка хранится в массиве с [0..п-1], мы можем начать с последовательного сравнения всех возможных пар подстрок, написав что-нибудь подобное:
maxlen = -1
for i = [0, n) for j = (i , n)
if (thislen = comlen(&c[i]. &c[j])) > maxlen maxien = thislen maxi = i maxj = j
Функция comlen (листинг 15.7) возвращает длину одинаковой части двух строк (начиная с первых символов), передаваемых ей в качестве аргументов.
Листинг 15.7. Функция comlen — вычисление длины общей части двух строк
int comlen(char *р, char *q)
i = О
while *p && (*p++ == *q+ + ) i ++ return i
Поскольку этот алгоритм проверяет все возможные пары подстрок, он является квадратичным. Мы смогли бы ускорить его с помощью хэш-таблицы для поиска слов в фразах, но вместо этого мы попробуем новый подход.
Наша новая программа будет обрабатывать не более MAXN символов, хранящихся в массиве с:
#define MAXN 5000000 char с[MAXN], *а[MAXN],
Опубликовал vovan666 April 17 2013 04:04:43 · 0 Комментариев · 1924 Прочтений · Для печати

• Не нашли ответ на свой вопрос? Тогда задайте вопрос в комментариях или на форуме! •


Комментарии
Нет комментариев.
Добавить комментарий
Имя:



smiley smiley smiley smiley smiley smiley smiley smiley smiley
Запретить смайлики в комментариях

Введите проверочный код:* =
Рейтинги
Рейтинг доступен только для пользователей.

Пожалуйста, залогиньтесь или зарегистрируйтесь для голосования.

Нет данных для оценки.
Гость
Имя

Пароль



Вы не зарегистрированны?
Нажмите здесь для регистрации.

Забыли пароль?
Запросите новый здесь.
Поделиться ссылкой
Фолловь меня в Твиттере! • Смотрите канал о путешествияхКак приготовить мидии в тайланде?
Загрузки
Новые загрузки
iChat v.7.0 Final...
iComm v.6.1 - выв...
Visual Studio 200...
CodeGear RAD Stud...
Шаблон для новост...

Случайные загрузки
Исправление проц...
FilesInfo
Андрей Боровский....
Программирование ...
Domen Name IP
RxLIB
Tetris 2002
CodeGear RAD Stud...
Разработка клиент...
Форма в форме
Книга по Delphi (...
Email
Разработка Web-пр...
DelphiXIsoDemo1
XPATComponents
Последнее загруж...
База данных фильм...
Plasma
Assembler. Учебни...
Шифрование по алг...

Топ загрузок
Приложение Клие... 100464
Delphi 7 Enterp... 86596
Converter AMR<-... 20076
GPSS World Stud... 12625
Borland C++Buil... 11745
Borland Delphi ... 8553
Turbo Pascal fo... 7037
Visual Studio 2... 4998
Калькулятор [Ис... 4759
FreeSMS v1.3.1 3541
Случайные статьи
Вызов кодов драйвера
Внутренний генерат...
КЛАССЫ С ДИНАМИЧЕС...
Файл главной компо...
Постановка задачи
Type Identifier ex...
Технический персон...
Компактное оформле...
• Кэширование.
Основные объекты W...
Ускоренное деление
Горизонтально напр...
Практические реком...
Листинг 5.3. Функц...
Формирование запро...
чтобы переданные п...
Обзор панели управ...
Онлайн казино. Игр...
В свойствах File S...
Язык программирова...
Принципы организац...
Введение в создани...
Просеивание элемен...
Метод onServiceCon...
Старые открытки
Статистика



Друзья сайта
Программы, игры


Полезно
В какую объединенную сеть входит классовая сеть? Суммирование маршрутов Занимают ли таблицы память маршрутизатора?