Profile

Minystory

      • Graph (1)
      • Python (2)
      • SQL (1)
      • Kubernetes (2)
      • Dacon (3)
      • Apache Airflow (7)
      • Apache Spark (8)
      • Crawling (4)
      • Blog (9)
      • Ubuntu (1)
      • Open Source (1)
      • Tools (1)
    최신글
    • Hugo 블로그 만들기 (5) - 본문 레이아웃 개선 (헤더와 푸터 및 Disqus 댓글 기능 구현)
      2025.12.15
    • Hugo 블로그 만들기 (4) - 검색 기능 개선 및 검색 페이지 구현 (Fuse.js)
      2025.12.14
    • Hugo 블로그 만들기 (3) - Taxonomies로 태그/카테고리 페이지 커스터마이징
      2025.11.22
    • Hugo 블로그 만들기 (2) - 메인 레이아웃 커스터마이징 (메뉴, 목차, 헤더)
      2025.11.04
    • Hugo 블로그 만들기 (1) - 프로젝트 구성과 GitHub Pages 배포 (Submodule 활용)
      2025.11.01

    Minystory

    Dataset

    전체 글 1

    2025년 06월 29일
    Data Engineering Apache Spark
    Cover Image

    Apache Spark - DataFrame과 Dataset API 활용하기

    Apache Spark의 Structured API를 다루며, DataFrame과 Dataset의 기본 개념부터 Schema 정의, Column 연산, Row 처리까지 단계별로 안내합니다. 데이터 엔지니어링을 위한 효율적인 데이터 조작 기법을 배우고 실무에 적용하세 …
    #Apache Spark #Structured API #DataFrame #Dataset #PySpark
    Cover Image
    Minystory - © CC BY 4.0