그래프 마이닝 (06837) 강의계획서


1. 강의 정보

  • 강의 시간: 화요일 (2–3교시), 목요일 (3교시)
  • 강의실: 소피이바라관 B346

2. 담당교수 및 조교

담당 교수

  • 이름: 이오전 교수
  • 연구실: 미카엘관 T404
  • 이메일: ojlee@catholic.ac.kr
  • 웹사이트: NS Lab @ CUK Website
  • 오피스 아워: 추후 공지 (이메일 문의 후 예약 또는 시간 지정)

3. 교과목 개요

이 강의에서는 대규모 그래프와 네트워크 분석 및 마이닝을 위한 기법과 알고리즘을 심도 있게 다룹니다. 수강생들은 다음을 학습하게 됩니다:

  • 그래프 데이터의 특징: 다양한 그래프 데이터 유형과 이들의 저장·처리상의 문제점
  • 핵심 그래프 마이닝 기법: 그래프 탐색, 중심성(centrality) 지표, 커뮤니티 검출 등
  • 실제 활용 사례: 소셜 네트워크 분석, 이상 감지, 추천 시스템 등

학기 말까지 수강생들은:

  • 복잡한 그래프 데이터를 효율적으로 표현하고 저장할 수 있는 능력
  • 주요 그래프 마이닝 알고리즘을 적용해 유의미한 정보를 도출할 수 있는 능력
  • 파이썬 NetworkX 등 프로그래밍 도구를 활용해 그래프 분석·시각화 실무 능력

4. 학습자료


5. 주차별 강의 일정 (예정)

주차 주제 핵심 개념 및 활동
1 그래프 마이닝 소개 - 그래프 마이닝 개요
- 그래프 유형 및 응용 분야
- 그래프 기본 개념 (노드, 엣지, 차수 등)
- 예시 코드: NetworkX로 간단한 그래프 생성
2 그래프 표현 및 저장 - 인접 리스트 & 인접 행렬
- 희소(sparse) 행렬 표현
- 그래프 데이터베이스
- 예시 코드: NetworkX 그래프를 희소 행렬로 변환
3 중심성(Centrality) 지표 - 차수, 매개 중심성(Betweenness), 근접 중심성(Closeness), 고유벡터 중심성(Eigenvector)
- PageRank
- 예시 코드: NetworkX에서 중심성 지표 계산
4 그래프 시각화 - 시각화 기법(스프링 임베딩, 원형 등)
- 그래프 탐색 도구(Gephi, Cytoscape 등)
- 예시 코드: NetworkX로 그래프 시각화
5 커뮤니티 검출 - 커뮤니티 정의 및 특성
- 클러스터링(k-means, 계층적 등)
- 모듈러리티(Modularity) & Louvain
- 예시 코드: Louvain 기법 활용 커뮤니티 검출
6 링크 예측(Link Prediction) - 양·음·중립 링크 개념
- Common Neighbors, Jaccard 계수 등
- 예시 코드: NetworkX로 링크 예측
7 서브그래프 마이닝(Subgraph Mining) - 빈발 서브그래프 마이닝(FSM)
- 알고리즘(gSpan, FSG 등)
- 예시 코드: gSpan으로 빈발 서브그래프 마이닝
8 중간고사 - 1~7주차 내용 평가
9 그래프 커널(Graph Kernels) - 그래프 커널 개요
- WL(Weisfeiler-Lehman) 기법
- 예시 코드: WL relabeling 프로세스 예시
10 노드 분류(Node Classification) - 특징 추출 방법
- 분류기(SVM, 랜덤 포레스트 등)
- 예시 코드: NetworkX에서 노드 분류
11 소셜 네트워크 응용 - 소셜 네트워크에서의 커뮤니티 검출, 링크 예측
- 예시 코드: NetworkX로 소셜 네트워크 분석
12 교통망(Transportation) 응용 - 최단 경로 알고리즘
- 교통망에서의 중심성 지표
- 예시 코드: 교통망 그래프 최단 경로 탐색
13 웹 그래프(Web Graph) 응용 - 웹 그래프 크롤링
- 웹 그래프 분석
- 예시 코드: NetworkX로 웹 그래프 크롤링 및 분석
14 추가 주제 & 마무리 - 그래프 매칭, 기타 고급 기법
- 중요한 그래프 지표
- 향후 연구 방향
15 (오픈/복습 주간)* - (프로젝트 발표, 초청 강의, 복습 등 선택 진행)
16 기말고사 - 1~14주차 전체 내용 종합 평가

* 15주차에는 교수 재량에 따라 추가 복습, 발표, 혹은 특별 강의가 진행될 수 있습니다.


6. 과제 및 실습

  • 과제: GitHub 저장소에 매주 실습 자료와 과제 문제가 올라옵니다.
    모든 과제는 정해진 기한 내에 온라인 학습 플랫폼을 통해 제출해야 합니다.

지각 제출 정책

  • 마감 기한 이후 제출된 과제는 최고 B(8점)까지 점수가 가능합니다.
  • 기한을 크게 넘겼거나 미제출 시 해당 과제는 F(0점) 처리될 수 있습니다.

7. 평가 방식

평가 항목 반영 비율
출석 10%
과제 30%
중간고사 30%
기말고사 30%

성적 등급 기준

  • A: 80–100
  • B: 60–80
  • C: 60 미만
  • F: 시험 결시

(교수 재량에 따라 등급 기준이 약간 조정될 수 있습니다.)


8. 학문 윤리 및 표절 방지

  • 정책: 표절 또는 학업 부정행위(무단 복사 등)는 절대 허용되지 않습니다.
  • 조치: 적발 시 과제/시험 0점 혹은 과목 낙제 등 엄중 처분이 가능합니다.
  • 가이드라인:
    1. 본인의 힘으로 과제를 수행하십시오.
    2. 외부 자료나 코드를 사용한 경우, 반드시 출처를 명시하십시오.
    3. 인용·협업에 대해 궁금한 사항이 있을 시, 교수나 조교에게 문의하시기 바랍니다.

9. 시험

  • 중간고사 (8주차): 구체적인 시험 범위와 형식은 추후 안내합니다.
  • 기말고사 (16주차): 학기 전체 내용을 대상으로 종합 평가합니다.
  • 추가 시험 정책: 질병이나 불가피한 사유로 시험에 응시하지 못할 경우, 해당 증빙서류를 제출해야만 재시험이 가능합니다.

10. 문의 및 오피스 아워

  • 교수 오피스 아워: 추후 공지. 추가 상담이나 문의가 있을 경우 이메일로 예약 가능합니다.
  • 조교 오피스 아워: 추후 공지. 과제, 프로젝트, 기타 강의 관련 문의는 조교에게도 가능합니다.

주의: 본 강의계획서는 일부 변경될 수 있으며, 변경 사항은 온라인 학습 플랫폼이나 이메일로 공지됩니다. 학생들은 각종 공지사항을 반드시 확인해야 합니다.