Minystory전체 글 402025년 07월 12일Data Engineering Apache SparkApache Spark - 외부 데이터베이스 연동 (PostgreSQL, MySQL)Apache Spark의 외부 데이터 소스 연결과 데이터 읽기/쓰기를 다루며, JDBC, RDBMS 등과의 연동을 단계별로 안내합니다. 빅데이터 처리를 위한 실용적인 기법을 배우세요.#Apache Spark #JDBC #RDBMS #Hive #PostgreSQL2025년 07월 10일Data Engineering Apache SparkApache Spark - 다양한 데이터 소스 읽기/쓰기 (Parquet, JSON, CSV, Avro)Apache Spark의 다양한 데이터 소스를 다루며, Parquet, JSON, CSV, Avro 등 형식의 데이터 읽기/쓰기를 단계별로 안내합니다. 빅데이터 처리를 위한 실용적인 기법을 배우세요.#Apache Spark #Data Sources #Parquet #JSON #CSV2025년 07월 06일Linux UbuntuMac에서 UTM으로 Ubuntu Server 24.04 설치하기Mac에서 UTM 가상화 소프트웨어를 사용하여 Ubuntu Server 24.04 LTS를 가상머신으로 설치하는 가이드를 제공합니다. ARM64 이미지 다운로드, 네트워크 구성, SSH 접속 설정까지 단계별로 안내합니다.#Ubuntu #Ubuntu Server #UTM #Virtual Machine #Mac2025년 07월 05일Data Engineering Apache SparkApache Spark - 스파크 SQL과 테이블/뷰 관리Apache Spark의 Spark SQL을 다루며, SQL 쿼리 실행부터 테이블/뷰 관리, 메타데이터 캐싱까지 단계별로 안내합니다. 빅데이터 분석과 데이터 엔지니어링을 위한 강력한 도구를 습득하고 실무에 적용하세요.#Apache Spark #Spark SQL #SQL #View #PySpark2025년 07월 03일Algorithm SQL프로그래머스 SQL Lv.4, 5 완전 정복 - 20문제 상세 풀이 (JOIN, GROUP BY, 윈도우 함수)이직 준비를 하면서 오랜만에 코딩테스트를 보게되었는데, SQL 코딩테스트는 어떻게 나오나 궁금해서 프로그래머스 Lv.4, 5 수준의 문제를 모두 풀어보았습니다. 표에서 제목을 클릭하면 프로그래머스 문제 풀이로 이동합니다.#프로그래머스 #알고리즘 #코딩테스트 #SQL #JOIN2025년 06월 29일Data Engineering Apache SparkApache Spark - DataFrame과 Dataset API 활용하기Apache Spark의 Structured API를 다루며, DataFrame과 Dataset의 기본 개념부터 Schema 정의, Column 연산, Row 처리까지 단계별로 안내합니다. 데이터 엔지니어링을 위한 효율적인 데이터 조작 기법을 배우고 실무에 적용하세 …#Apache Spark #Structured API #DataFrame #Dataset #PySpark2025년 06월 29일Data Engineering Apache SparkApache Spark - 스파크 애플리케이션 구조와 RDD 이해하기Apache Spark의 애플리케이션 구조와 RDD 개념을 다루며, Driver Process, Executor, Job, Stage, Task부터 Transformation과 Action까지 단계별로 안내합니다.#Apache Spark #Spark Application #RDD #Spark Shell #Spark Web UI2025년 06월 28일Data Engineering Apache SparkApache Spark - 로컬 환경에서 설치하고 PySpark 실행하기Apache Spark의 설치와 PySpark 실행 과정을 다루며, JDK와 HDFS 설정부터 호스트명 오류 해결까지 단계별로 안내합니다. 또한, HDFS 실행 중 발생한 호스트명과 관련된 오류를 해결하는 과정을 공유합니다.#Apache Spark #Spark Shell #JDK #Hadoop #HDFS2025년 06월 22일Data Engineering Apache SparkApache Spark - 스파크의 기본 개념과 아키텍처Apache Spark의 기본 개념과 아키텍처를 다루며, 스파크의 시작부터 컴포넌트, Spark Driver, SparkSession, Cluster Manager, 배포 모드까지 단계별로 안내합니다. 데이터 엔지니어링과 빅데이터 처리를 위한 필수 지식을 습득하고 …#Apache Spark #Spark Architecture #SparkSession #Cluster Manager #PySpark2025년 06월 08일Data Engineering Apache AirflowApache Airflow - 외부 시스템 연동 (Connection, Hook, PostgreSQL)Apache Airflow의 Connection과 Hook 개념을 소개하고, Docker Compose를 활용한 Postgres 컨테이너 생성부터 Connection 설정, Hook 사용, bulk_load 기능까지 단계별로 안내합니다. Docker Compose, …#Apache Airflow #Connection #Hook #Docker Compose #Postgres 이전1 2 3 4다음
2025년 07월 12일Data Engineering Apache SparkApache Spark - 외부 데이터베이스 연동 (PostgreSQL, MySQL)Apache Spark의 외부 데이터 소스 연결과 데이터 읽기/쓰기를 다루며, JDBC, RDBMS 등과의 연동을 단계별로 안내합니다. 빅데이터 처리를 위한 실용적인 기법을 배우세요.#Apache Spark #JDBC #RDBMS #Hive #PostgreSQL
2025년 07월 10일Data Engineering Apache SparkApache Spark - 다양한 데이터 소스 읽기/쓰기 (Parquet, JSON, CSV, Avro)Apache Spark의 다양한 데이터 소스를 다루며, Parquet, JSON, CSV, Avro 등 형식의 데이터 읽기/쓰기를 단계별로 안내합니다. 빅데이터 처리를 위한 실용적인 기법을 배우세요.#Apache Spark #Data Sources #Parquet #JSON #CSV
2025년 07월 06일Linux UbuntuMac에서 UTM으로 Ubuntu Server 24.04 설치하기Mac에서 UTM 가상화 소프트웨어를 사용하여 Ubuntu Server 24.04 LTS를 가상머신으로 설치하는 가이드를 제공합니다. ARM64 이미지 다운로드, 네트워크 구성, SSH 접속 설정까지 단계별로 안내합니다.#Ubuntu #Ubuntu Server #UTM #Virtual Machine #Mac
2025년 07월 05일Data Engineering Apache SparkApache Spark - 스파크 SQL과 테이블/뷰 관리Apache Spark의 Spark SQL을 다루며, SQL 쿼리 실행부터 테이블/뷰 관리, 메타데이터 캐싱까지 단계별로 안내합니다. 빅데이터 분석과 데이터 엔지니어링을 위한 강력한 도구를 습득하고 실무에 적용하세요.#Apache Spark #Spark SQL #SQL #View #PySpark
2025년 07월 03일Algorithm SQL프로그래머스 SQL Lv.4, 5 완전 정복 - 20문제 상세 풀이 (JOIN, GROUP BY, 윈도우 함수)이직 준비를 하면서 오랜만에 코딩테스트를 보게되었는데, SQL 코딩테스트는 어떻게 나오나 궁금해서 프로그래머스 Lv.4, 5 수준의 문제를 모두 풀어보았습니다. 표에서 제목을 클릭하면 프로그래머스 문제 풀이로 이동합니다.#프로그래머스 #알고리즘 #코딩테스트 #SQL #JOIN
2025년 06월 29일Data Engineering Apache SparkApache Spark - DataFrame과 Dataset API 활용하기Apache Spark의 Structured API를 다루며, DataFrame과 Dataset의 기본 개념부터 Schema 정의, Column 연산, Row 처리까지 단계별로 안내합니다. 데이터 엔지니어링을 위한 효율적인 데이터 조작 기법을 배우고 실무에 적용하세 …#Apache Spark #Structured API #DataFrame #Dataset #PySpark
2025년 06월 29일Data Engineering Apache SparkApache Spark - 스파크 애플리케이션 구조와 RDD 이해하기Apache Spark의 애플리케이션 구조와 RDD 개념을 다루며, Driver Process, Executor, Job, Stage, Task부터 Transformation과 Action까지 단계별로 안내합니다.#Apache Spark #Spark Application #RDD #Spark Shell #Spark Web UI
2025년 06월 28일Data Engineering Apache SparkApache Spark - 로컬 환경에서 설치하고 PySpark 실행하기Apache Spark의 설치와 PySpark 실행 과정을 다루며, JDK와 HDFS 설정부터 호스트명 오류 해결까지 단계별로 안내합니다. 또한, HDFS 실행 중 발생한 호스트명과 관련된 오류를 해결하는 과정을 공유합니다.#Apache Spark #Spark Shell #JDK #Hadoop #HDFS
2025년 06월 22일Data Engineering Apache SparkApache Spark - 스파크의 기본 개념과 아키텍처Apache Spark의 기본 개념과 아키텍처를 다루며, 스파크의 시작부터 컴포넌트, Spark Driver, SparkSession, Cluster Manager, 배포 모드까지 단계별로 안내합니다. 데이터 엔지니어링과 빅데이터 처리를 위한 필수 지식을 습득하고 …#Apache Spark #Spark Architecture #SparkSession #Cluster Manager #PySpark
2025년 06월 08일Data Engineering Apache AirflowApache Airflow - 외부 시스템 연동 (Connection, Hook, PostgreSQL)Apache Airflow의 Connection과 Hook 개념을 소개하고, Docker Compose를 활용한 Postgres 컨테이너 생성부터 Connection 설정, Hook 사용, bulk_load 기능까지 단계별로 안내합니다. Docker Compose, …#Apache Airflow #Connection #Hook #Docker Compose #Postgres