Направленный поиск

Направленный поиск Активной областью исследований по XML-поиску является направленный поиск (focused retrieval), описанный в работе Тротмана и др. (Trotman et. al., 2007). Этот подход ставит цель не возвращать вложенные элементы, имеющие один или несколько общих подэлементов. Существуют свидетельства того, что пользователи не любят избыточности, порожденной вложенными элементами (Betsi et al., 2006). Для направленного поиска необходимо ввести оценки, штрафующие избыточность (Kazai and Laimas, 2006; Laimas et al., 2007). Тротман и Гева (Trotman and Geva, утверждают, что XML-поиск представляет собой разновидность фрагментов документа (passage retrieval), при котором поисковая система в ответ на запрос пользователя возвращает не документы, а короткие фрагменты (Salton et al., 1993; Heasrt and Plaunt, 2991; Zobel et al., 1995; Hearst and Plaunt, 1993; Zobel et al., 1995; Hearst, 1997; Kaszkiel and Zobel, 1997). Несмотря на то что границы элементов в XML-документах облегчают идентификацию границ между отрывками, в большинстве случае наиболее релевантные отрывки не совпадают с XML-элементами.

В последние годы в рамках проекта INEX стандартом стал формат запросов NEX1, предложенный Тротманом и Сигурбьорнссоном (Trotman and Sigurbjornsson, 2004V Рис. 10.3 заимствован из их статьи. О’Кифи и Тротман (O’Keefe and Trotman, 2004) привели свидетельства того, что пользователи не в состоянии надежно различать дочерние оси и оси наследников. Исходя из этого, в формате NEXI (и XML-фрагментах) разрешены только оси наследников. Эти структурные ограничения в недавних экспериментах INEX трактуются как “подсказки”. Эксперты могут оценивать элемент как высокорелевантный, даже если он нарушает одно из структурных ограничений, указанных в запросе NEXI.

В качестве альтернативы языкам структурированных запросов, таким как NEXI, были предложены более развитые пользовательские интерфейсы для формулировки запросов (Tannier and Geva, 2005; van Zwol et al., 2006; Woodley and Geva, 2006).

tel-icq