본문 바로가기

사전캠프 데일리미션

데이터분석 아티클 13 - R vs 파이썬, 빅데이터 분석에 무엇이 더 좋을까?

1. 오늘의 아티클(주제)

https://yozm.wishket.com/magazine/detail/1178/

 

R vs 파이썬, 빅데이터 분석엔 무엇이 더 좋을까? | 요즘IT

데이터 분석가와 과학자는 수학이나 통계학적인 지식을 갖춰야 함은 물론 머신러닝, 딥러닝 알고리즘에 대한 이해, 프로그래밍 언어에 대한 숙달까지 갖춰야 합니다. 특히 프로그래밍 언어를

yozm.wishket.com

2. 아티클 정보 요약

빅데이터를 위한 프로그래밍 언어

1)프로그래밍 언어의 종류

 : 여러 언어 체계가 있으며, 각 언어마다 다른 장단점 있음

 

R vs 파이썬

-빅데이터 처리 위한 대표적 언어

1)공통점

-데이터 분석을 위한 다양한 패키지 제공

-데이터 분석가 및 데이터 과학자에 주요 이용자층 형성 => 다양한 기능, 잦은 업데이트, 커뮤니티 활성화

-오픈소스 : 무료

2)R의 특징 : 'R의 가장 큰 장점은 통계학자가 만들었다는 것이고 R의 가장 큰 단점 역시 통게학자가 만들었다'

-통계 분석과 관련한 다양한 기능 제공

-복잡한 통계 알고리즘도 단 몇 줄의 코드로 구현 가능

-같은 통계 분석 시 파이썬보다 더욱 상세한 결과물

-단점 : 파이썬보다 느림 =>빅데이터 처리에 있어 치명적 단점

3)파이썬의 특징

-최신 머신러닝, 딥러닝 알고리즘 제공 : R도 제공하나 수준 차이 큼

-최신 AI 환경들 대부분 파이썬 기반으로 하고 있음

-단점 : 통계분석에선 R에 비해 뒤떨어짐

 

어떤 프로그래밍 언어를 선택해야 하는가

1)분석 목적에 적합한 프로그래밍 언어

-위의 특성에 따라 언어 선택

-하지만 대부분의 데이터 분석가 혹은 과학자는 통계분석과 AI 알고리즘 모두 이용해야 하는 경우가 대부분

 =>목적뿐만 아니라 다양한 측면에서 고려해야 : '사람들이 얼마나 자주 사용하는가?'

2)많은 사람들이 사용하는 프로그래밍 언어

-많이 사용한다는 것체가 많은 장점이 있다는 것을 의미

-최신 알고리즘 혹은 새로운 기능 우선 배포

-커뮤니티 통한 검색 쉽고 빠르게 할 수 있음

 

선택의 몫

-자신의 목적이 무엇인가, 다른 사람들은 같은 분야에서 어떤 프로그램을 많이 사용하고 있는가 고려해야함

3. 인사이트 

-R은 통계에, 파이썬은 머신러닝/딥러닝/AI 분야에 특화됨

-같은 분야의 사람들이 얼마나 많이 쓰는지, 관련 커뮤니티 얼마나 활성화되어있는지 고려할 것!