1. 오늘의 아티클(주제)
https://yozm.wishket.com/magazine/detail/1178/
2. 아티클 정보 요약
빅데이터를 위한 프로그래밍 언어
1)프로그래밍 언어의 종류
: 여러 언어 체계가 있으며, 각 언어마다 다른 장단점 있음
R vs 파이썬
-빅데이터 처리 위한 대표적 언어
1)공통점
-데이터 분석을 위한 다양한 패키지 제공
-데이터 분석가 및 데이터 과학자에 주요 이용자층 형성 => 다양한 기능, 잦은 업데이트, 커뮤니티 활성화
-오픈소스 : 무료
2)R의 특징 : 'R의 가장 큰 장점은 통계학자가 만들었다는 것이고 R의 가장 큰 단점 역시 통게학자가 만들었다'
-통계 분석과 관련한 다양한 기능 제공
-복잡한 통계 알고리즘도 단 몇 줄의 코드로 구현 가능
-같은 통계 분석 시 파이썬보다 더욱 상세한 결과물
-단점 : 파이썬보다 느림 =>빅데이터 처리에 있어 치명적 단점
3)파이썬의 특징
-최신 머신러닝, 딥러닝 알고리즘 제공 : R도 제공하나 수준 차이 큼
-최신 AI 환경들 대부분 파이썬 기반으로 하고 있음
-단점 : 통계분석에선 R에 비해 뒤떨어짐
어떤 프로그래밍 언어를 선택해야 하는가
1)분석 목적에 적합한 프로그래밍 언어
-위의 특성에 따라 언어 선택
-하지만 대부분의 데이터 분석가 혹은 과학자는 통계분석과 AI 알고리즘 모두 이용해야 하는 경우가 대부분
=>목적뿐만 아니라 다양한 측면에서 고려해야 : '사람들이 얼마나 자주 사용하는가?'
2)많은 사람들이 사용하는 프로그래밍 언어
-많이 사용한다는 것체가 많은 장점이 있다는 것을 의미
-최신 알고리즘 혹은 새로운 기능 우선 배포
-커뮤니티 통한 검색 쉽고 빠르게 할 수 있음
선택의 몫
-자신의 목적이 무엇인가, 다른 사람들은 같은 분야에서 어떤 프로그램을 많이 사용하고 있는가 고려해야함
3. 인사이트
-R은 통계에, 파이썬은 머신러닝/딥러닝/AI 분야에 특화됨
-같은 분야의 사람들이 얼마나 많이 쓰는지, 관련 커뮤니티 얼마나 활성화되어있는지 고려할 것!
'사전캠프 데일리미션' 카테고리의 다른 글
데이터분석 아티클 15 - 사용자 행동 데이터 분석: ②넷플릭스와 아마존은 데이터 분석을 어떻게 할까요? (2) | 2023.12.15 |
---|---|
데이터분석 아티클 14 - 사용자 행동 데이터 분석: ①사용자 행동 데이터 왜 필요할까요? (0) | 2023.12.14 |
데이터분석 아티클 12 - SQL 가독성을 높이는 다섯 가지 사소한 습관 (0) | 2023.12.13 |
데이터분석 아티클 11 - 양질의 데이터를 판별하는 5가지 방법 : ⑤목적에 적합한 데이터인가? (0) | 2023.12.13 |
데이터분석 아티클 10 - 양질의 데이터를 판별하는 5가지 방법 : ④데이터 형식을 파악했는가? (0) | 2023.12.12 |