이 글은 빅데이터 분석에 관심을 갖거나 시작하려는 분들에게 도움을 주는 글입니다. 최근 동향을 보면 빅데이터 분석을 쉽게해주는 도구로 파이썬, 판다스(pandas)가 대표적이다. 판다스는 파이썬(python)이라는 프로그래밍 언어로 만들어진 프레임워크다. 쉽게말해서 파이썬 문법으로 사용할 수 있는 도구의 집합체 정도로 요약해두면 된다. 그러니 판다스를 사용하려면 파이썬(python)을 기본으로 알고 있어야 한다. 그리고 판다스와 함께 numpy란 녀석도 곁가지로 꼭 알아두어야 한다. numpy는 C언어로 구현된 python 바인딩 수학(math) 패키지(프레임웍)다. 쉽게 말해서 numpy에서 제공하는 수학연산에 대한 구현이 c언어로 최적화 되어있어 매우 빠르다. 예를들어 데이터를 다루면서 벡터연산(한번..