본문 바로가기

전체 글

(160)
데이터분석 아티클 07 - 양질의 데이터를 판별하는 5가지 방법 : ①데이터 양은 충분한가 1. 오늘의 아티클(주제) https://yozm.wishket.com/magazine/detail/1070/ 양질의 데이터를 판별하는 5가지 방법 : ① 데이터 양은 충분한가? | 요즘IT 양질의 데이터 조건 첫 번째는 ‘충분한 양의 데이터’입니다. 최근 빅데이터라는 단어가 기승을 부리고 있으며 빅데이터는 기본적으로 방대한 양의 데이터를 의미합니다. 하지만 현실적으로 yozm.wishket.com 2. 아티클 정보 요약 양질의 데이터란 무엇인가? 1)데이터의 품질 -다양한 데이터를 보유하는 것이 이익 취득에 직결되지는 않는다. -고품질의 데이터일수록 실제로 활용될 확률이 높다. -경제적/시강적 비용의 측면에서 양질의 데이터를 판별할 줄 아는 능력은 중요하다. 2)양질의 데이터를 판단하는 방법 -데이터 ..
12/11 substr 단순 실수, having 복습, 수학/논리문제 SQL 카타 52번 상반기 아이스크림 총주문량이 3,000보다 높으면서 아이스크림의 주 성분이 과일인 아이스크림의 맛을 총주문량이 큰 순서대로 조회하는 SQL 문을 작성해주세요. 어려울 건 전혀 없었으나 결과값에 strawberry 밖에 안 나와서 정답이 아닌 줄 알고 한참을 고민했던 문제. SELECT a.flavor from first_half a left join icecream_info b on a.flavor=b.flavor where b.ingredient_type = 'fruit_based' and a.total_order in (select total_order from first_half group by flavor having total_order >=3000) 그런데 사실....딱히 ..
12/08 WIL SQL 이번주는 넘 재밌다보니 거의 SQL카타 위주로 공부해버린 것 같다...ㅎ 일단은 이번주에 자주 등장한 having 함수와 where 함수 두 가지에 대한 정리(오전에 급하게 알바하고 왔더니 너무 피곤해서 주말에 내용 추가 예정..ㅠ) 1. Having 함수 having 함수핵심 -위치/순서 : where-group-having-order -컴퓨터의 번역 순서 : FROM > WHERE > GROUP BY > HAVING > SELECT > ORDER BY -where에는 집계함수(sum 등)을 사용하지 못한다. -having은 집계함수로 조건을 걸어주는 역할을 하기에, 반드시 집계함수와 group by가 선행되어야 한다 =>having은 집계함수를, where는 단일 데이터를 조건으로 건다는 차이..
데이터분석 아티클 07 - 데이터 분석가가 되어보니 중요한 것들 1. 오늘의 아티클(주제) https://yozm.wishket.com/magazine/detail/1863/ 데이터 분석가가 되어보니 중요한 것들 | 요즘IT 개발자, 디자이너, 기획자, HR, 오퍼레이션 등 대부분의 직무에서 우리가 일하기 전 예상했던 업무와 실제 업무에는 차이점이 존재합니다. 비즈니스는 빠르게 변화하기 때문에, 학생 때 배운 교 yozm.wishket.com 2. 아티클 정보 요약 -데이터 분석가에 대한 글쓴이의 정의 : 모델링 하는 사람(학생 시절) -> '좋은 의사결정을 하도록 돕는 사람' =>데이터에 기반해 성공 확률이 높은 의사결정을 지속적으로 하도록 돕는 사람 -데이터 분석가에게 중요한 점 세 가지 ①데이터 기반 ②성공 확률이 높은 의사결정 ③지속성 1)데이터 기반 (1)데..
12/08 일지 : 서브쿼리, 중복 체크와 sum(), right(left) join, 서브쿼리 where column _name not in () 카타 47. 식품분류 별 가장 비싼 식품의 정보 조회하기 https://school.programmers.co.kr/learn/courses/30/lessons/131116 프로그래머스 코드 중심의 개발자 채용. 스택 기반의 포지션 매칭. 프로그래머스의 개발자 맞춤형 프로필을 등록하고, 나와 기술 궁합이 잘 맞는 기업들을 매칭 받으세요. programmers.co.kr 다음은 식품의 정보를 담은 FOOD_PRODUCT 테이블입니다. FOOD_PRODUCT 테이블은 다음과 같으며 PRODUCT_ID, PRODUCT_NAME, PRODUCT_CD, CATEGORY, PRICE는 식품 ID, 식품 이름, 식품코드, 식품분류, 식품 가격을 의미합니다. 문제 FOOD_PRODUCT 테이블에서 식품분류별로 가격이 ..
12/07 일지 having(보충) sql 카타 6번 문제 : 동명 동물 수 찾기 ANIMAL_INS 테이블은 동물 보호소에 들어온 동물의 정보를 담은 테이블입니다. ANIMAL_INS 테이블 구조는 다음과 같으며, ANIMAL_ID, ANIMAL_TYPE, DATETIME, INTAKE_CONDITION, NAME, SEX_UPON_INTAKE는 각각 동물의 아이디, 생물 종, 보호 시작일, 보호 시작 시 상태, 이름, 성별 및 중성화 여부를 나타냅니다. 동물 보호소에 들어온 동물 이름 중 두 번 이상 쓰인 이름과 해당 이름이 쓰인 횟수를 조회하는 SQL문을 작성해주세요. 이때 결과는 이름이 없는 동물은 집계에서 제외하며, 결과는 이름 순으로 조회해주세요. 지난번에 공부했던 having을 활용하는 문제. 아직 방식이 익숙하지 않으니 별의..
데이터분석 아티클 06 - 데이터기반 의사결정의 장점 1. 오늘의 아티클(주제) https://yozm.wishket.com/magazine/detail/1051/ 데이터 기반 의사결정의 장점 | 요즘IT 데이터 기반 의사결정은 의사결정을 내리기 전, 데이터를 활용해서 이대로 진행해도 무리가 없는지 체크하여 행동 방침을 승인하는 과정을 의미합니다. 데이터 기반의 의사결정은 분명 수많은 yozm.wishket.com 2. 아티클 정보 요약 1)데이터기반 의사결정(Data-Driven Decision-Making, DDDM) : 데이터를 활용한 의사 결정 -더 확실한 결정을 내릴 기회 제공 : 결단력 제공, 기존 역량 평가에 용이 -진두지휘적 통솔력 -비용 절감 효과 2)데이터 기반 업무 처리를 위해 필요한 것 -예상치 못한 곳에서 패턴 찾기 : 쉬워보일 수 ..
데이터분석 아티클 05 - 데이터 시각화 101: ③데이터 속 거짓말 발견하기 1. 오늘의 아티클(주제) https://yozm.wishket.com/magazine/detail/1821/ 데이터 시각화 101: ③데이터 속 거짓말 발견하기 | 요즘IT 간혹 직관적으로 이해된 시각화가 부정확한 정보를 전달하기도 하고, 시각적으로 오해를 불러일으키기도 합니다. 그 때문에 우리는 이러한 문제점이 왜 일어나는지 이해하고, 데이터 시각화 yozm.wishket.com 2. 아티클 정보 요약 1)막대그래프를 특히 주의하자 -기준선이 '0'인지 확인하기 : 기준선에 따라 왜곡된 정보를 전달할 수 있음 -Y축 살펴보기 : 물결선 표시 등으로 실제를 과장할 수 있음(비수도권 지역 공항 적자 그래프) 2)선 그래프의 스케일 -두 개의 Y축 멀리하기(미국 가족계획연맹의 암 검진과 낙태율) -누적값으..