[python] Практические примеры использования NLTK


Answers

НЛП в целом очень полезна, поэтому вы можете расширить свой поиск до общего применения текстовой аналитики. Я использовал NLTK для помощи MOSS 2010 путем создания таксономии файлов путем извлечения концептуальных карт. Он работал очень хорошо. Это не займет много времени, прежде чем файлы начнут кластеры полезными способами.

Часто для понимания текстовой аналитики вы должны думать в касательных к тем, как вы привыкли думать. Например, текстовая аналитика чрезвычайно полезна для обнаружения. Большинство людей, однако, даже не знают, какая разница между поиском и открытием. Если вы прочитаете эти темы, вы, скорее всего, «найдете» способы, которыми вы, возможно, захотите, чтобы NLTK работал.

Кроме того, рассмотрите свое мировоззрение текстовых файлов без NLTK. У вас есть группа случайных строк длины, разделенных пробелами и пунктуацией. Некоторые из знаков препинания изменяют, как они используются, например, период (который также является десятичной точкой и маркером постфикса для сокращения). С помощью NLTK вы получаете слова и многое другое до того, как получаете части речи. Теперь у вас есть дескриптор содержимого. Используйте NLTK для обнаружения понятий и действий в документе. Используйте NLTK для получения «значения» документа. Значение в этом случае относится к сущностным отношениям в документе.

Хорошо, что интересно узнать о НЛТК. В течение нескольких следующих лет текстовая аналитика будет широко распространена. Те, кто это понимает, лучше подходят для лучшего использования новых возможностей.

Question

Я играю с Natural Language Toolkit (NLTK).

Его документация ( Book and HOWTO ) довольно громоздка, и примеры иногда немного продвинуты.

Есть ли хорошие, но основные примеры использования / применения NLTK? Я думаю о таких вещах, как статьи NTLK в блоге Stream Hacker .




Links