Данный поиск проводится четырьмя различными способами: прямым, линейным, двоичным и хешированием.
Прямой поиск. При прямом поиске местоположение элемента определяется непосредственно с помощью ключа (комната в здании). Прямой поиск применяется тогда, когда число элементов фиксировано и их сравнительно немного.
Линейный поиск. Данный вид поиска наиболее простой для программной реализации, хотя его выполнение занимает много времени. Элементы проверяются последовательно, по одному, пока нужный элемент не будет найден. В отличие от прямого поиска здесь нет системы в расположении элементов. Если список содержит N элементов, то каждый раз в среднем будут проверяться N/2 элементов. Линейный поиск медленный, но позволяет легко добавлять новые элементы, помещая их в конец списка. Хорошо разработанная программа обычно имеет простую (линейную) структуру, и, следовательно, такую же структуру должны иметь и данные, поэтому линейный поиск в таких структурах эффективен.
Двоичный поиск. Для ведения двоичного поиска ключи должны быть упорядочены по величине или алфавиту. В этом случае можно добиться среднего времени поиска log2N. При двоичном поиске ключ сравнивается с ключом среднего элемента списка. Если значение ключа больше, то та же самая процедура повторятся для второй половины списка, если же меньше, то для первой. Таким образом, за шаг этого процесса список уменьшается наполовину.
Основная трудность при двоичном поиске — как вводить новые элементы. Так как список упорядочивается, то введение нового элемента может вызвать переписывание всех элементов для того, чтобы новый элемент поместить в нужном месте.
Хеш-поиск. Этот вид поиска является попыткой применить прямой поиск для поиска в больших наборах данных. Из изначального значения ключа вычисляется значение псевдоключа, называемого хеш-кодом, и этот код используется как индекс в таблице адресов элементов. Если все ключи соответствуют разным хеш-кодам, то любой элемент будет найден за один прямой поиск.
Пример. В абстрактном компиляторе может быть отведено 1000 мест для имен переменных. В языке допускаются слова из 6 символов. Это позволяет создавать 266 имен, что гораздо больше, чем размер таблицы символов. Но если каждое число, представляющее имя, уменьшить до числа, находящегося между 0 и 999, то имена могут быть записаны в таблицу. Алгоритмы вычисления хеш-кодов различны, например имя (ключ) можно рассматривать как двоичное число. Это число можно разделить на размер таблицы, остаток использовать как код. Другие алгоритмы предлагают сложение битов внутри числа или некоторые другие функции с ключом.
Недостатком хеш-поиска является тот факт, что некоторые идентификаторы могут иметь одинаковые хеш-коды, поэтому возникает проблема обработки пересечений элементов, т.е. элементов, имеющих одинаковые хеш-коды. Когда определенное значение хеш-кода встречается первый раз, его помещают в определенное место в таблице. Если произошло пересечение с другим элементом, его помещают в другое место в соответствии со следующим алгоритмом:
INSERT: procedure (ключ, аргумент);
declare 1 TABLE(размер),
2 KEY,
2 ARGUMENT;
declare хеш–код;
Вычислить хеш–код;
/* если запись находится в таблице */
if TABLE(хеш-код).KEY = ключ then return;
/* обработка совпадающих хеш-кодов */
do while (TABLE(хеш-код).KEY¹0 &
TABLE(хеш-код).KEY¹ключ);
хеш–код = новое значение, зависящее от
(хеш–код, ключ);
end;
TABLE(хеш-код).KEY = ключ;
TABLE(хеш-код).ARGUMENT = аргумент;
end INSERT;
Таким образом, в случае пересечения элементов имеется переход к следующему месту в таблице. Если нужное место занято, — то переход на место, расположенное на некотором расстоянии от занятого, или вычисление нового хеш-кода, исходя из имеющегося ключа и кода.
Основным недостатком хеш-поиска является тот факт, что при плотном заполнении таблицы алгоритм ввода элементов весьма трудоемок.