종종 글을 읽다보면 웹크롤링을 하거나 html 파싱을 한다는 말을 자주 듣는다. 또는 스크래핑을 한다고도 하는데 용어가 혼동되기도 한다. 원래의 뜻을 살펴보면 크롤(crawl)은 기어가다는 뜻이다. 스크랩(scrap)은 단편의 정보를 뜻하고 파싱(parse)은 분석한다는 뜻이 강하다. 위 세가지를 종합해보면 기어다니면서 단편의 정보를 모아서 분석한다? 응? 말되네? 최신 빅데이터와 데이터 수집을 위해서 크롤링이나 스크래핑을 많이 하는 추세다. 그리고 크롤링과 스크래핑을 구별하는 것은 크게 의미가 없다고 본다. 대략 크롤링과 스크래핑은 인터넷의 정보를 모으는 일을 생각하면 된다. 그러면 파싱이란? 예를들어 시간에 대한 표현을 보면 "2019년 12월 10일"이라면 표현이 있다. 이 표현을 '년' 앞에는 년..