크롤링 대상 : 네이터 카페의 자동차 관련 커뮤니티들
사용 언어: 파이썬
python or java
selenium(crowling)
Crawl
Post
step
(Crowl data로 DB에 저장되어 있는) 선정된 카페들로부터 Data를 크롤링
(모두 크롤링,단 하루 분량 게시글만 가져오기)
자연어 처리 → 유사도 분석을 통해 RO정보 매칭
특정 기준(ex. 유사도 퍼센트)에 부합한 게시글만 Post 객체로 DB에 저장