알통 지식정보공유

알록달록

ChevronLeft

컴/폰

📊 데이터 과학 입문자가 꼭 알아야 할 개념

FileX

놀이장군

2025-05-14 15:00

조회수 : 37

썸네일 이미지

‘데이터 과학’이라는 단어, 막연하게 어렵게 느껴지셨나요?

하지만 실제로는 몇 가지 핵심 개념만 정확히 이해해도

배움의 문턱이 훨씬 낮아집니다.

지금부터 처음 시작할 때 꼭 알아야 할 기본 개념들을 정리해드릴게요.


✅ 1. 데이터프레임 (DataFrame)

표 형태의 데이터 구조

엑셀과 비슷하지만 훨씬 강력함

파이썬에서는 Pandas 라이브러리를 통해 다룸


핵심 용도

→ 행(row)과 열(column)을 기준으로 필터링, 정렬, 요약 등 다양한 작업 가능


✅ 2. 기술 통계(Descriptive Statistics)

데이터를 요약해서 한눈에 파악할 수 있게 해주는 기초 통계

평균, 중앙값, 최빈값, 표준편차, 사분위수 등

시각화와 함께 쓰이면 분석이 쉬워짐


예시

→ "이 제품의 평균 구매 연령은 34세입니다" 같은 인사이트 도출


✅ 3. 데이터 전처리 (Data Cleaning)

빠진 값, 이상치, 잘못된 형식을 정리하는 작업

머신러닝 이전 단계에서 가장 중요하고 가장 오래 걸리는 과정

결측값 채우기, 중복 제거, 타입 변환 등이 여기에 포함됨


✅ 4. 시각화 (Data Visualization)

데이터를 그래프나 차트로 표현하는 작업

많이 쓰는 도구: Matplotlib, Seaborn, Plotly, Tableau

수치보다 패턴과 경향을 한눈에 볼 수 있게 해줌


예시

→ 매출이 언제 가장 높은지, 고객이 언제 이탈하는지 시각화로 확인 가능


✅ 5. 머신러닝(Machine Learning)의 기본 개념

데이터를 학습해서 패턴을 찾고 예측하는 알고리즘

지도학습 vs 비지도학습

분류, 회귀, 클러스터링 등의 용어 이해가 기본


입문자용 모델 예시

→ 선형회귀, 의사결정나무, K-최근접 이웃(KNN)


✅ 6. 피처(Feature)와 타겟(Target)

피처: 예측에 사용되는 입력값

타겟: 우리가 맞히고 싶은 정답값 (예: 고객의 구매 여부)

머신러닝에서는 항상 피처 → 타겟 예측하는 흐름


처음엔 용어도 많고 헷갈리지만,

하나하나 실습하며 익히다 보면

데이터가 말하는 소리를 듣게 되는 순간이 분명히 옵니다.

‘아직 잘 모르겠는데요’라는 감정조차도

지금 당연한 과정입니다. 계속 이어가보세요 :)

4,000

23

댓글

  • 치킨값 님이 감사의 마음으로 놀이장군님께 0알을 증정했어요!

  • cookie929 님이 감사의 마음으로 놀이장군님께 0알을 증정했어요!

  • 난나 님이 감사의 마음으로 놀이장군님께 0알을 증정했어요!

  • 김효재 님이 감사의 마음으로 놀이장군님께 0알을 증정했어요!