nlp - 重要 - 頻繁に使う 英語




自然な英語の単語 (4)

私はいくつかの言語処理操作のために見つけることができる最も網羅的な英語の単語リストが必要ですが、十分な品質のインターネット上で何かを見つけることはできませんでした。

外国語やテクニカルな言葉を含む英語では、1,000,000語があります。

おそらくちょっと分類されているインターネットからダウンロードできるようなソース(または500k単語に近いもの)をお勧めしますか? あなたの言語処理アプリケーションにはどんな入力を使いますか?



誰があなたに100万の言葉があると言ったのですか? Wikipediaによると、Oxford English Dictionaryには600,000しかありません。 そして、OEDは、使用されているすべての技術用語およびスラングの用語を含めるよう試みる。


私は制御された/自然な英語と言語ドメインの知識処理に関するPurdueの研究を行った。

私はtryoプロジェクトを見ていきます: http ://attempto.ifi.uzh.ch/site/description/これは、管理された自然な英語を構築するのに役立つプロジェクトです。

あなたは単語辞書全体をhttp://attempto.ifi.uzh.ch/site/downloads/files/clex-6.0-080806.zipからダウンロードすることができます。それは〜100,000自然な英語の単語を持っています。

また、ドメイン固有の単語のための独自の辞書を提供することもできます。これが私たちの研究で行ったことです。 自然言語のテキストを解析してフォーマットするためのWebサービスを提供しています。