Классическое описание

Классическое описаниеКлассическое описание указателей пропусков для систем информационного поиска можно найти в работе Моффата и Цобеля (Moffat and Zobel, 1996). Более сложные методы описаны в работе Болди и Винья (Boldi and Vigna, 2005). Основной статьей по алгоритмам этого типа считается работа Пу (Pugh, 1990), в которой описаны многоуровневые указатели пропусков, обеспечивающие ожидаемую сложность поиска по спискам с оценкой 0(log Р) (эта сложность сравнима с оценкой сложности поиска по древовидным структурам данных) с меньшей сложностью реализации. На практике эффективность использования указателей пропусков зависит от параметров системы.

В работе Моффата и Цобеля (Moffat and Zobel, 1996) сообщается о конъюнктивных запросах, которые с помощью указателей пропусков обрабатывались примерно в пять раз быстрее, но Бале и соавторы (Bahle et al., 2002) сообщают, что на современных процессорах использование указателей пропусков замедляет поиск, поскольку при этом увеличивается размер инвертированного списка (т.е. на эффективность поиска влияет в основном скорость ввода-вывода диска).

В противоположность этому Штроман и Крофт (Strohman and Croft, 2007) вновь продемонстрировали хорошую производительность, достигнутую благодаря указателям пропусков в сочетании с архитектурой системы, предназначенной для оптимизации работы с большими объемами памяти и несколькими ядрами современных процессоров. Поиск поставщиков в Китае - Российско-китайская компания «Серебряный дракон».

Джонсон и соавторы (Johnson et al., 2006) сообщают, что 11,7% всех запросов в двух логах веб-систем в 2002 году были фразовыми, хотя Камменхубер и соавторы (Kammen- huber et al., 2006) утверждают, что фразовые запросы образуют только 3% всех запросов на другом наборе данных. Сильверстейн и соавторы (Silverstein et al., 1999) отмечают, что многие запросы, не содержащие явных фразовых операторов, на самом деле являются неявными запросами на поиск фраз.

tel-icq