Обратная связь по релевантности и расширение запроса

Обратная связь по релевантности и расширение запроса Во многих коллекциях одно и то же понятие может выражаться разными словами. Это явление, известное как синонимия (synonymy), влияет на полноту поиска в большинстве информационно-поисковых систем. Например, пользователи хотели бы, чтобы запросу aircraft соответствовало также слово plane (но только в смысле самолет, а не сто- тярный рубанок), а запросу thermodynamics (термодинамика) — слово heat (тепло) в соответствующем контексте. Пользователи часто стараются самостоятельно разрешить эту проблему, уточняя запросы. В этой главе мы рассмотрим способы, с помощью которых система может сама уточнить запрос либо автоматически, либо с участием пользователя.

Методы решения этой задачи разделяются на две основные категории: глобальные и локальные. Глобальные методы предусматривают расширение или новую формулировку запроса независимо от запроса и возвращаемых результатов, так что изменения в формулировке запроса приводят к появлению нового запроса, соответствующего другим семантически близким терминам. К глобальным относятся следующие методы.

Метод RF может предусматривать одну или несколько итераций. В основе этого процесса лежит идея, согласно которой пользователь не в состоянии сформулировать точный запрос, не зная хорошо содержания коллекции, но может оценить документы. Поэтому целесообразно выполнить несколько таких итераций, чтобы уточнить запрос. В рамках этого сценария метод RF может способствовать эволюции информационной потребностей пользователя. Просмотр некоторых документов может помочь пользователю уточнить свои представления об информации, которую он ищет.

Ярким примером метода RF является поиск изображений. Результаты поиска изображений легко просмотреть, но именно в этой области пользователю трудно сформулировать свой запрос словами, но легко указать, какие изображения являются релевантными или нерелевантными. После того как пользователь введет исходный запрос bike на странице

http://nayana.есе.ucsb.edu/imsearch/imsearch.html, он получит первоначальный список результатов (в данном случае — изображений). Пользователь выбрал изображения, которые считает релевантными. Они используются для уточнения запроса, в то время как остальные изображения на новую формулировку запроса не влияют. Новые результаты, ранжированные после выполнения итерации по методу RF.

tel-icq