
1 개요
- 2025-06-01, Introduction to Data Science
- 2025-12-08, Basic Concepts Supplement
2 방법론 & 프로세스
2.1 CRISP-DM 파이프라인
CRISP-DM (Cross-Industry Standard Process for Data Mining)은 데이터 마이닝/분석 프로젝트의 표준 프로세스 모델이다. 다음은 CRISP-DM의 6단계와 각 단계에서 다룰 주요 주제들이다.
- 2026-03-28, Business Understanding — 문제 정의와 ROI 계산
- 2026-03-28, Data Understanding — EDA와 데이터 품질 진단
- 1111-11-11, Data Preparation — 전처리, 피처 엔지니어링
- 1111-11-11, Modeling — 모델 선택과 학습 전략
- 1111-11-11, Evaluation — 비즈니스 메트릭 vs 기술 메트릭
- 1111-11-11, Deployment — 서빙, 모니터링, 피드백 루프
2.2 성능 평가
- 2026-03-06, 성능 지표 — F1 Score, Precision, Recall, AUC
- 1111-11-11, 비용-성능 트레이드오프 분석
- 1111-11-11, 도메인별 평가 지표 설계 (의료, 금융, 물류)
2.3 MLOps & 시스템 설계
- 1111-11-11, 모델 서빙 아키텍처 — TorchServe, vLLM, FastAPI
- 1111-11-11, 피처 스토어 & 데이터 파이프라인
- 1111-11-11, 모델 모니터링 — 드리프트 탐지, 품질 추적
- 1111-11-11, 재학습 전략 — Trigger 기반 vs 스케줄 기반
2.4 LLM & AI 시스템
- 1111-11-11, RAG 시스템 설계 — Vector DB, Embedding, Retrieval
- 1111-11-11, Fine-tuning 전략 — LoRA, QLoRA, Instruction Tuning
- 1111-11-11, 프롬프트 엔지니어링 — CoT, Few-shot, DSPy
- 1111-11-11, AutoML & 하이퍼파라미터 최적화 — Optuna, Ray Tune
- 2026-04-21, LLM 앱 발화 데이터 저장소 — PostgreSQL vs Cosmos DB (DS 의사결정 프레임)
3 도메인 응용 프로젝트
- 2026-04-09, DL 학습 데이터가 거의 없을 때: 도메인 분류기 증강 전략
3.1 MINERVA 도메인 분류기 시리즈 — AI Agent 과제 2 ML 서브컴포넌트
- 2026-04-17, 1편: 기획과 의도
- 2026-04-17, 2편: 데이터 큐레이션
- 2026-04-17, 3편: 모델 후보 선정
- 2026-04-17, 4편: 실험 설계와 학습 파이프라인
- 2026-04-17, 5편: 결과 분석과 통계 검증
- 2026-04-17, 6편: Task 재정의 — 접미사 가설과 합성 데이터 갭
- 2026-04-17, 7편: 배포 의사결정과 후속 실험
4 Essay
- 2026-04-03, PCR 데이터 사이언스 역량의 포트폴리오 전략과 타 산업 전이