[nlp] Каковы хорошие отправные точки для кого-то, кто интересуется обработкой на естественном языке? [закрыто]


Answers

Хомский - совершенно неправильный источник, чтобы искать НЛП (и он сказал бы сам, решительно) - см .: « Статистические методы и лингвистика » Абни.

Юрафски и Мартин, упомянутые выше, являются стандартной ссылкой, но я сам предпочитаю Маннинга и Шютце . Если вы серьезно относитесь к НЛП, вы, вероятно, захотите прочитать и то, и другое. Есть видео одного из курсов Маннинга, доступных онлайн .

Question

Вопрос

Поэтому я недавно придумал несколько новых возможных проектов, которые должны были бы иметь дело с получением «значения» из текста, представленного и созданного пользователями.

Обработка естественного языка - это область, которая занимается этими проблемами, и после некоторых начальных исследований я нашел сотрудничество с OpenNLP Hub и университетом, как проект tryo . И имеет это .

Если бы кто-нибудь мог связать меня с некоторыми хорошими ресурсами, из резюме документов и вступительных текстов в apis, я был бы счастливее, чем 6-летний ребенок, открывший рождественские подарки!

Обновить

По одной из ваших рекомендаций я нашел opencyc ( «крупнейшая в мире и самая полная база знаний и здравый смысл» ). Еще более удивительно, что есть проект, который является дистиллированной версией opencyc под названием UMBEL . Он содержит семантические данные в синтаксисе rdf / owl / skos n3.

Я также наткнулся на antlr , генератор парсера для «создания распознавателей, интерпретаторов, компиляторов и переводчиков из грамматических описаний» .

И здесь у меня есть вопрос, в котором перечислены тонны бесплатных и открытых данных .

Благодаря сообществу !




Более простое место, чтобы начать с строительных блоков, - это посмотреть на документацию для пакета, который пытается это сделать. Я бы рекомендовал Python [Natural Language Toolkit (NLTK) 1 , особенно из-за их хорошо написанной, свободной книги , которая заполнена примерами. Это не даст вам пути к тому, что вы хотите (это проблема с AI-hard), но это даст вам хорошую основу. В NLTK есть парсеры, chunkers, контекстно-свободные грамматики и многое другое.




Очень приятное читаемое введение - «Инстинкт языка» Стивена Пинкера. Он попадает в материал Чомского, а также рассказывает интересные истории из угла эволюционной биологии. Возможно, стоит начать с чего-то подобного, прежде чем погрузиться в документы Хомского и связанные с ними работы, если вы новичок в этом вопросе.




Одним из первых исследователей в НЛП является Ноам Хомский; он написал небольшие книги по этому предмету в 50-х годах до 70-х годов. Вы можете найти это интересное чтение.




Я очень рекомендую поиграть в NLTK и прочитать книгу NLTK . NLTK очень мощный и легкий в использовании.




Links



Tags

nlp   dcg