nlp - 활용 - 자연어처리 튜토리얼정크 데이터에 대한 NLP- 감정 처리에는 시간이 필요합니다. (1)

입력 텍스트에 대한 감정을 찾으려고합니다. 이 테스트는 쓸데없는 문장입니다. 문장을 찾으려고 할 때 주석을 구문 분석하려면 약 30 초 가량 소요됩니다. 일반 텍스트의 경우 1 초도 채 걸리지 않습니다. 수백만 개의 데이터를 처리해야하는 경우 처리 시간이 추가됩니다. 이에 대한 해결책.

String text = "Nm n n 4 n n bkj nun4hmnun Onn njnb hm5bn nm55m nbbh n mnrrnut but n rym4n nbn 4nn65 m nun m n nn nun 4nm 5 gm n my b bb b b rtmrt55tmmm5tttn b b bb g bn nn n h r ret n nun bn d. B bbbbbbbbbbr bung NHnhn nn nk, v v v n gain t g 4gnyhimmigration ndn nb NVnb bin uny 7 nbbbbbnn vv bbvb ninn njnj n4 nm n km n n n cb j bun. Nhfnt bn nn. N hm nn nun m bum my b mmmnbjk nn n by nn nun nun n nun nn bn n nhn n nn n n m NH nb4mnm mkn 4 n n n n hm r b rnfngg4d in b nut mmmkmmm5 bbjn n n ij BBM 8u8i by nun n.nn hm n. n4n By 4n4n bunny RN bny hm j mi. Nymmn FBT not mn n n nm g by n n nnm? Rnyb vCard n5 Yu nn n n n n nt .nm mn nt n nb n n n n by y5nnnhyyh h b b nt njj n m f4n re";
Properties props = new Properties();
      props.setProperty("annotators","tokenize, ssplit, pos,parse,sentiment");
      StanfordCoreNLP pipeline = new StanfordCoreNLP(props);
      Annotation annotation = pipeline.process(text);

NLP 감정 교정을 위해 나는 데이터를 분석해야하고 그 이유는 시간이 걸릴 것이라고 생각합니다.

감사


예, 표준 PCFG 파서 (다른 옵션을 지정하지 않고 기본적으로 실행되는 파서)는 이런 종류의 긴 말도 안되는 데이터를 막습니다. PCFG보다 실질적으로 빠르며 정확한 정확성이있는 shift-reduce 선거 구민 파서를 사용하면 더 나은 행운을 누릴 수 있습니다.