본문 바로가기

전체 글

(148)
데이터분석 아티클 10 - 양질의 데이터를 판별하는 5가지 방법 : ④데이터 형식을 파악했는가? 1. 오늘의 아티클(주제) https://yozm.wishket.com/magazine/detail/1107/ 양질의 데이터를 판별하는 5가지 방법 : ④ 데이터 형식을 파악했는가? | 요즘IT 데이터 구조와 생김새에서 모든 데이터는 차이를 보입니다. 그리고 데이터의 생김새, 즉 데이터 형식에 따라서 분석 가치가 높은 양질의 데이터와 그렇지 못한 저품질의 데이터가 나뉘기도 합 yozm.wishket.com 2. 아티클 정보 요약 -양질의 데이터일 수록 형식에 특별한 공통점이 있으며, 저품질의 것도 마찬가지! 데이터가 순수한 정형 데이터인가? 1)정형 데이터와 비정형 데이터 (1)정형 데이터 : 미리 정해 놓은 형식과 구조에 따라 고정된 자리에 저장되는 데이터 =>숫자이거나 수치화 가능! 사실상 수치데이터..
데이터분석 아티클 09 - 양질의 데이터를 판별하는 5가지 방법 : ③관계형 데이터베이스인가? 1. 오늘의 아티클(주제) https://yozm.wishket.com/magazine/detail/1096/ 양질의 데이터를 판별하는 5가지 방법 : ③ 관계형 데이터베이스인가? | 요즘IT 보통 빅데이터의 특성을 이야기할 때 3V라는 단어를 언급하는 경우가 많습니다. Velocity(속도), Volume(양), Variety(다양성)까지 V로 시작하는 3가지 단어의 묶음입니다. 이때 Variety(다양성)이라는 단 yozm.wishket.com 2. 아티클 정보 요약 -빅데이터의 특성 : 3V -> Velocity(속도), Volume(양), Variety(다양성) =>어떤 다양한 모습의 빅데이터라도 활용하기 좋은 데이터들이 지키고 있는 공통의 형식이 존재함! '데이터형식! 관계형 데이터베이스 1)관..
12/12 일지 - join 함수(세개 병합, 테이블 위치, 병합 기준 칼럼), datediff 및 날짜차이 구하기 주의점 SQL 카타 문제 58: PATIENT, DOCTOR 그리고 APPOINTMENT 테이블에서 2022년 4월 13일 취소되지 않은 흉부외과(CS) 진료 예약 내역을 조회하는 SQL문을 작성해주세요. 진료예약번호, 환자이름, 환자번호, 진료과코드, 의사이름, 진료예약일시 항목이 출력되도록 작성해주세요. 결과는 진료예약일시를 기준으로 오름차순 정렬해주세요. select b.apnt_no, a.pt_name, a.pt_no, b.mcdp_cd, b.dr_name, b.apnt_cncl_ymd from patient a join (SELECT a.apnt_no apnt_no, a.pt_no pt_no, a.mcdp_cd mcdp_cd, b.dr_name dr_name, a.apnt_cncl_ymd apnt_cn..
데이터분석 아티클 08 - 양질의 데이터를 판별하는 5가지 방법 : ②믿을 수 있는 데이터인가? 1. 오늘의 아티클(주제) https://yozm.wishket.com/magazine/detail/1074/ 양질의 데이터를 판별하는 5가지 방법 : ② 믿을 수 있는 데이터인가? | 요즘IT 데이터 신뢰성이란 데이터가 얼마나 실제 정보를 똑바로 담고 있는가에 대한 개념으로 이해하면 좋습니다. 데이터 자체에 틀린 정보가 담겨있을 수도 있으며, 확실한 값이 아닌 추정 값을 데 yozm.wishket.com 2. 아티클 정보 요약 -데이터 신뢰성 : 얼마나 실제 정보를 똑바로 담고 있는가에 대한 개념 신뢰성 있는 데이터인가? 1)데이터 오류 : 사실이 아닌 잘못된 정보를 적재하고 있는 경우 -컴퓨터를 통해 자동적으로 찾아내기 어려움 -크게 프로그래밍 오류를 비롯한 수집 당시의 오류, 데이터 조작 시의 오류..
데이터분석 아티클 07 - 양질의 데이터를 판별하는 5가지 방법 : ①데이터 양은 충분한가 1. 오늘의 아티클(주제) https://yozm.wishket.com/magazine/detail/1070/ 양질의 데이터를 판별하는 5가지 방법 : ① 데이터 양은 충분한가? | 요즘IT 양질의 데이터 조건 첫 번째는 ‘충분한 양의 데이터’입니다. 최근 빅데이터라는 단어가 기승을 부리고 있으며 빅데이터는 기본적으로 방대한 양의 데이터를 의미합니다. 하지만 현실적으로 yozm.wishket.com 2. 아티클 정보 요약 양질의 데이터란 무엇인가? 1)데이터의 품질 -다양한 데이터를 보유하는 것이 이익 취득에 직결되지는 않는다. -고품질의 데이터일수록 실제로 활용될 확률이 높다. -경제적/시강적 비용의 측면에서 양질의 데이터를 판별할 줄 아는 능력은 중요하다. 2)양질의 데이터를 판단하는 방법 -데이터 ..
12/11 substr 단순 실수, having 복습, 수학/논리문제 SQL 카타 52번 상반기 아이스크림 총주문량이 3,000보다 높으면서 아이스크림의 주 성분이 과일인 아이스크림의 맛을 총주문량이 큰 순서대로 조회하는 SQL 문을 작성해주세요. 어려울 건 전혀 없었으나 결과값에 strawberry 밖에 안 나와서 정답이 아닌 줄 알고 한참을 고민했던 문제. SELECT a.flavor from first_half a left join icecream_info b on a.flavor=b.flavor where b.ingredient_type = 'fruit_based' and a.total_order in (select total_order from first_half group by flavor having total_order >=3000) 그런데 사실....딱히 ..
12/08 WIL SQL 이번주는 넘 재밌다보니 거의 SQL카타 위주로 공부해버린 것 같다...ㅎ 일단은 이번주에 자주 등장한 having 함수와 where 함수 두 가지에 대한 정리(오전에 급하게 알바하고 왔더니 너무 피곤해서 주말에 내용 추가 예정..ㅠ) 1. Having 함수 having 함수핵심 -위치/순서 : where-group-having-order -컴퓨터의 번역 순서 : FROM > WHERE > GROUP BY > HAVING > SELECT > ORDER BY -where에는 집계함수(sum 등)을 사용하지 못한다. -having은 집계함수로 조건을 걸어주는 역할을 하기에, 반드시 집계함수와 group by가 선행되어야 한다 =>having은 집계함수를, where는 단일 데이터를 조건으로 건다는 차이..
데이터분석 아티클 07 - 데이터 분석가가 되어보니 중요한 것들 1. 오늘의 아티클(주제) https://yozm.wishket.com/magazine/detail/1863/ 데이터 분석가가 되어보니 중요한 것들 | 요즘IT 개발자, 디자이너, 기획자, HR, 오퍼레이션 등 대부분의 직무에서 우리가 일하기 전 예상했던 업무와 실제 업무에는 차이점이 존재합니다. 비즈니스는 빠르게 변화하기 때문에, 학생 때 배운 교 yozm.wishket.com 2. 아티클 정보 요약 -데이터 분석가에 대한 글쓴이의 정의 : 모델링 하는 사람(학생 시절) -> '좋은 의사결정을 하도록 돕는 사람' =>데이터에 기반해 성공 확률이 높은 의사결정을 지속적으로 하도록 돕는 사람 -데이터 분석가에게 중요한 점 세 가지 ①데이터 기반 ②성공 확률이 높은 의사결정 ③지속성 1)데이터 기반 (1)데..