반응형

A.I. 3

데이터분석은 탐험과 같은 느낌이다.

개발자로서 데이터분석은 필요성보다는 호기심으로 더 끌린다. 이건 개인적인 생각이겠지만, 비슷한 생각을 가진 분들이 있을 것이다.2년전 뒤늦게 데이터분석과 머신러닝, 딥러닝에 입문하게 되었다. 물론 생업이 데이터 과학자나 엔지니어가 아니기 때문에 업무적으로 지속적인 사용은 하지 못했기 때문에 아직 기본 수준이라 생각된다. 그래도 대부분은 모델들에 대한 이론은 어느정도 살펴보고, 통계학이나 신경망의 loss fuction의 특성, 역전파 알고리즘을 수학적으로 증명하고 코드로 만들어보기도 했었다. (양질의 교육자료 덕분에 이런 혜택을 얻고 새로운 세상에 눈뜬 것에 항상 감사한다.)2년전 강화학습까지 공부중이었는데 그 뒤로 손을 놔버렸다. 워낙 개발이라는 것이 방대하고 변화하고 공부할 것이 많기 때문에 잠시 데..

빅데이터 분석에서 판다스(pandas)를 알아야 하는 이유.

이 글은 빅데이터 분석에 관심을 갖거나 시작하려는 분들에게 도움을 주는 글입니다. 최근 동향을 보면 빅데이터 분석을 쉽게해주는 도구로 파이썬, 판다스(pandas)가 대표적이다. 판다스는 파이썬(python)이라는 프로그래밍 언어로 만들어진 프레임워크다. 쉽게말해서 파이썬 문법으로 사용할 수 있는 도구의 집합체 정도로 요약해두면 된다. 그러니 판다스를 사용하려면 파이썬(python)을 기본으로 알고 있어야 한다. 그리고 판다스와 함께 numpy란 녀석도 곁가지로 꼭 알아두어야 한다. numpy는 C언어로 구현된 python 바인딩 수학(math) 패키지(프레임웍)다. 쉽게 말해서 numpy에서 제공하는 수학연산에 대한 구현이 c언어로 최적화 되어있어 매우 빠르다. 예를들어 데이터를 다루면서 벡터연산(한번..

머신러닝과 인공지능(artificial intelligence)에 대한 단상

관심이 없는 사람들 조차 4차산업과 머신러닝, 인공지능, 알파고라는 단어는 쉽게 접하게 되는 요즘이다.스마트폰에 음성명령을 인식해서 검색이나, 앱을 실행주는 기능을 사용하려면 가끔 혼잣말 하는 듯 하여 좀 어색하기는 하지만 꽤 편리하다.자율주행 자동차나 졸음운전으로 인한 사고를 미연에 알아차려 제동을 거는 등의 활용은 매우 유익하다고 생각한다.이젠 기업들은 빅데이터를 분석하여 특정 고객둘의 니즈에 대한 인사이트를 얻어내는 일을 기계의 힘에 맏기는 시대가 도래하기 시작했다.사실 이런 작업이나 연구가 한순간에 이뤄진 것은 아니다. 오래전부터 계속 연구되고 발전되어 왔지만 이렇게 급격하게 진전되는 듯 보이는 이유는 빅데이터와 하드웨어의 발전의 힘이다.빅데이터와 하드웨어 이 두가지를 따로 때어놓을 수는 없다. ..

A.I./가볍게 2019.03.25
반응형