Minystory

데이터 월드의 탐험일지

2023-04-02 Log

Spark study

April 2, 2023 · 4 min · 811 words · minyeamer

[Python] 만개의 레시피 데이터 수집

최근 레시피 생성을 목적으로 한 사이드 프로젝트에 참여하게 되었는데 모델 학습을 위한 만개의 레시피 데이터 크롤링을 진행해보았습니다. 스키마 구성 기존엔 레시피 명칭과 음식 재료 정보만을 수집할 계획이었지만, 만개의 레시피의 각 페이지를 살펴보면서 추가적으로 가져갈만한 데이터가 있음을 확인하여 우선적으로 테이블 관계 및 스키마를 구성해보았습니다. 초기에 만개의 레시피와 공공데이터를 데이터 소스로 삼았기 때문에, 만개의 레시피에 대한 DB _10000, 공공데이터에 대한 DB food로 구성했습니다. _10000 DB 내 테이블은 만개의 레시피 내 각각의 페이지에서 가져온 데이터로 구성되며,...

March 26, 2023 · 6 min · 1223 words · minyeamer

2023-03-25 Log

Spark study

March 25, 2023 · 3 min · 537 words · minyeamer

2023-03-21 Log

Spark study

March 21, 2023 · 5 min · 995 words · minyeamer

2023-02-19 Log

Collaborative Filtering

February 19, 2023 · 1 min · 210 words · minyeamer