lucene - supported - solr4




Семантический анализ с использованием Solr (2)

Я подумываю о добавлении семантического анализа к моей установке Solr, но я точно не знаю, с чего начать.

В принципе, я бы хотел, чтобы Solr смог найти «похожие» слова (взятые из тела проиндексированных документов). Например, если я ищу «музыку», я должен иметь возможность запросить семантический движок и получить «рок», «поп» и т. Д. (Конечно, если эти слова появились рядом с музыкой в ​​некоторых индексированных документах).

Я нашел этот проект, но не знаю, стоит ли начинать правильно: http://code.google.com/p/semanticvectors/



Семантическое индексирование - хорошее место для начала. Однако, по моему опыту, эти технологии не так хорошо работают на практике. Вы часто оказываетесь в очень странных результатах. Кроме того, из-за Google у людей есть определенное ожидание того, как должен вести себя поиск по ключевым словам, т. Е. Ваш поисковый запрос должен появиться в соответствующем документе.