[Parsing] Как я могу использовать NLP для анализа ингредиентов рецептов?


Answers

Я думаю, это уже несколько лет, но я думал о том, чтобы сделать что-то подобное себе и наткнулся на это, поэтому подумал, что у меня может быть удар в нем, если он будет полезен кому-либо еще в f

Несмотря на то, что вы говорите, что хотите разобрать бесплатный тест, большинство рецептов имеют довольно стандартный формат для своих списков рецептов: каждый ингредиент находится на отдельной строке, структура точного предложения редко бывает очень важна. Диапазон vocab также относительно невелик.

Одним из способов может быть проверка каждой строки для слов, которые могут быть существительными и словами / символами, которые выражают величины. Я думаю, что WordNet может помочь увидеть, что слово может быть существительным или нет, но я не использовал его раньше себя. Кроме того, вы могли бы использовать http://en.wikibooks.org/wiki/Cookbook:Ingredients в качестве списка слов, хотя, опять же, я не знаю точно, насколько он всеобъемлющий.

Другая часть - признать величины. Они представлены в нескольких разных формах, но недостаточно, чтобы создать список ключевых слов. В частности, убедитесь, что у вас хорошая отчетность об ошибках. Если программа не может полностью проанализировать строку, попросите ее сообщить вам, что это за строка, а также то, что она / не признала, поэтому вы можете соответствующим образом скорректировать списки ключевых слов.

Aaanyway, я не гарантирую, что это будет работать (и это почти наверняка не будет на 100% надежным), но вот как я начал бы подходить к проблеме

Question

Мне нужно разобрать ингредиенты рецепта на количество, измерение, предмет и описание, применимые к линии, такие как 1 чашка муки, кожура из 2 лимонов и 1 чашка упакованного коричневого сахара и т. Д. Каким будет лучший способ сделать это? Я заинтересован в использовании python для проекта, поэтому я предполагаю, что использование nltk - лучшая ставка, но я открыт для других языков.




Можете ли вы уточнить, что такое ваш вклад? Если у вас есть только такой ввод:

1 cup flour
2 lemon peels
1 cup packed brown sugar

Это не будет слишком сложно разобрать, не используя никакой НЛП вообще.