unsigned int hash(char *р) unsigned int h = О for ( . *p: p++) h = MULT * h + *p return h % NHASH
Использование беззнаковых целых чисел гарантирует положительность h. Функция main инициализирует все корзины нулевыми указателями, считывает слова и увеличивает счетчик каждого из слов, после чего перебирает содержимое таблицы хэширования, выводя слова (в произвольном порядке) и количество их повторений.
Листинг 15.5. Функция main программы составления частотного словаря
int та 1n(void )
for i = [О, NHASH) bi n [ i ] = NULL while scanf(”Јs'\ buf) '= EOF incword(buf) for i - [0. NHASH)
for (p = bin[i]; p != NULL; p = p->next) print p->word, p->count return 0
Основная часть работы осуществляется функцией incword (листинг 15.6), увеличивающей значение счетчика данного слова (или инициализирующей его, если такое слово еще не встречалось).
Листинг 15.6. Функция увеличения счетчика для данного слова
void incword(char *s) h = hash ( s )
for (p = bin[h] . p 1= NULL, p = p->next) if strcmp(s, p->word) == 0 (p->count) + + return
p * mal1oc(sizeof(hashnode)) p->count = 1
p->word = malloc(strlenСs ) + l) strcpy(p->word , s) p->next = bin[h] bin[h] = p
В цикле for просматриваются все узлы с одинаковым значением хэш-функции. Если искомое слово найдено, его счетчик увеличивается и происходит возврат из функции. Если слово в списке отсутствует, функция создает новый узел, выделяет память под него и копирует туда строку (опытные программисты на С воспользовались бы функцией strdup), после чего вставляет узел в начало списка.
Этой программе на С требуется 2,4 секунды для считывания входных данных (как и программе на C++), но набор статистики осуществляется всего за 0,5 с (против 4,9 для программы на C++), а результаты выводятся за 0,06 с (было 0,3). Итак, полное время выполнения новой программы при обработке Библии — 3 секунды peftiHO (было 7,6), а чистое время обработки — 0,55 с (было 5,2 с). Наша самодельная хэш-таблица, реализованная в 30 строках кода на языке С, оказалась на порядок быстрее, чем таблицы из стандартной библиотеки шаблонов C++ STL.
На этом примере я продемонстрировал два представления набора слов. Сбалансированные деревья поиска работают со строками как с неделимыми объектами. Эти структуры используются в большинстве реализаций наборов и таблиц в STL (set, map). Элементы в таких структурах всегда упорядочены, поэтому опера- ции поиска предшествующего элемента и последовательного вывода выполняются достаточно быстро. Хэширование требует вычисления значения функции хэширования на основании внутреннего содержимого объекта (строки). Строки разбрасываются по большой таблице. В среднем этот метод работает очень быстро, но в худшем случае он сильно проигрывает сбалансированным деревьям с гарантированным временем выполнения. Кроме того, такая таблица не поддерживает операции, использующие свойство порядка.
Опубликовал vovan666
April 17 2013 00:04:41 ·
0 Комментариев ·
3967 Прочтений ·
• Не нашли ответ на свой вопрос? Тогда задайте вопрос в комментариях или на форуме! •
Комментарии
Нет комментариев.
Добавить комментарий
Рейтинги
Рейтинг доступен только для пользователей.
Пожалуйста, залогиньтесь или зарегистрируйтесь для голосования.
Нет данных для оценки.
Гость
Вы не зарегистрированны? Нажмите здесь для регистрации.