컴/폰
📊 데이터 과학 입문자가 꼭 알아야 할 개념
놀이장군
2025-05-14 15:00
조회수 : 37
‘데이터 과학’이라는 단어, 막연하게 어렵게 느껴지셨나요?
하지만 실제로는 몇 가지 핵심 개념만 정확히 이해해도
배움의 문턱이 훨씬 낮아집니다.
지금부터 처음 시작할 때 꼭 알아야 할 기본 개념들을 정리해드릴게요.
✅ 1. 데이터프레임 (DataFrame)
표 형태의 데이터 구조
엑셀과 비슷하지만 훨씬 강력함
파이썬에서는 Pandas 라이브러리를 통해 다룸
핵심 용도
→ 행(row)과 열(column)을 기준으로 필터링, 정렬, 요약 등 다양한 작업 가능
✅ 2. 기술 통계(Descriptive Statistics)
데이터를 요약해서 한눈에 파악할 수 있게 해주는 기초 통계
평균, 중앙값, 최빈값, 표준편차, 사분위수 등
시각화와 함께 쓰이면 분석이 쉬워짐
예시
→ "이 제품의 평균 구매 연령은 34세입니다" 같은 인사이트 도출
✅ 3. 데이터 전처리 (Data Cleaning)
빠진 값, 이상치, 잘못된 형식을 정리하는 작업
머신러닝 이전 단계에서 가장 중요하고 가장 오래 걸리는 과정
결측값 채우기, 중복 제거, 타입 변환 등이 여기에 포함됨
✅ 4. 시각화 (Data Visualization)
데이터를 그래프나 차트로 표현하는 작업
많이 쓰는 도구: Matplotlib, Seaborn, Plotly, Tableau
수치보다 패턴과 경향을 한눈에 볼 수 있게 해줌
예시
→ 매출이 언제 가장 높은지, 고객이 언제 이탈하는지 시각화로 확인 가능
✅ 5. 머신러닝(Machine Learning)의 기본 개념
데이터를 학습해서 패턴을 찾고 예측하는 알고리즘
지도학습 vs 비지도학습
분류, 회귀, 클러스터링 등의 용어 이해가 기본
입문자용 모델 예시
→ 선형회귀, 의사결정나무, K-최근접 이웃(KNN)
✅ 6. 피처(Feature)와 타겟(Target)
피처: 예측에 사용되는 입력값
타겟: 우리가 맞히고 싶은 정답값 (예: 고객의 구매 여부)
머신러닝에서는 항상 피처 → 타겟 예측하는 흐름
처음엔 용어도 많고 헷갈리지만,
하나하나 실습하며 익히다 보면
데이터가 말하는 소리를 듣게 되는 순간이 분명히 옵니다.
‘아직 잘 모르겠는데요’라는 감정조차도
지금 당연한 과정입니다. 계속 이어가보세요 :)