반응형

데이터분석 2

데이터분석은 탐험과 같은 느낌이다.

개발자로서 데이터분석은 필요성보다는 호기심으로 더 끌린다. 이건 개인적인 생각이겠지만, 비슷한 생각을 가진 분들이 있을 것이다.2년전 뒤늦게 데이터분석과 머신러닝, 딥러닝에 입문하게 되었다. 물론 생업이 데이터 과학자나 엔지니어가 아니기 때문에 업무적으로 지속적인 사용은 하지 못했기 때문에 아직 기본 수준이라 생각된다. 그래도 대부분은 모델들에 대한 이론은 어느정도 살펴보고, 통계학이나 신경망의 loss fuction의 특성, 역전파 알고리즘을 수학적으로 증명하고 코드로 만들어보기도 했었다. (양질의 교육자료 덕분에 이런 혜택을 얻고 새로운 세상에 눈뜬 것에 항상 감사한다.)2년전 강화학습까지 공부중이었는데 그 뒤로 손을 놔버렸다. 워낙 개발이라는 것이 방대하고 변화하고 공부할 것이 많기 때문에 잠시 데..

빅데이터 분석에서 판다스(pandas)를 알아야 하는 이유.

이 글은 빅데이터 분석에 관심을 갖거나 시작하려는 분들에게 도움을 주는 글입니다. 최근 동향을 보면 빅데이터 분석을 쉽게해주는 도구로 파이썬, 판다스(pandas)가 대표적이다. 판다스는 파이썬(python)이라는 프로그래밍 언어로 만들어진 프레임워크다. 쉽게말해서 파이썬 문법으로 사용할 수 있는 도구의 집합체 정도로 요약해두면 된다. 그러니 판다스를 사용하려면 파이썬(python)을 기본으로 알고 있어야 한다. 그리고 판다스와 함께 numpy란 녀석도 곁가지로 꼭 알아두어야 한다. numpy는 C언어로 구현된 python 바인딩 수학(math) 패키지(프레임웍)다. 쉽게 말해서 numpy에서 제공하는 수학연산에 대한 구현이 c언어로 최적화 되어있어 매우 빠르다. 예를들어 데이터를 다루면서 벡터연산(한번..

반응형