Import Libraries
|
|
뉴스 검색 결과에서 네이버 뉴스 추출
네이버 뉴스 검색 결과 URL 분석
|
|
네이버 뉴스 검색 URL 불러오기
|
|
네이버 뉴스 기사 주제 가져오기
|
|
네이버 뉴스 기사 링크 가져오기
|
|
단일 뉴스 페이지 분석
ConnectionError
|
|
|
|
- 브라우저를 거치지 않고 HTML 코드를 요청하면
ConnectionError
발생 - 사용자임을 알리는 헤더 추가
|
|
기사 제목 / 발행 날짜 추출
|
|
Pandas Timestamp
|
|
기사 본문 추출
|
|
기사 발행 언론사 추출
|
|
여러 뉴스 데이터 수집
각 기사들의 데이터를 수집해 리스트에 추가
|
|
데이터에 대한 DataFrame 생성
|
|
여러 페이지의 뉴스 데이터 수집
각각의 페이지에 해당하는 쿼리 리스트 생성
|
|
각각의 페이지에 대한 반복문 실행
|
|
날짜 지정하여 크롤링
네이버 뉴스 날짜 지정 검색 결과 URL 분석
|
|
날짜에 해당하는 쿼리 생성
|
|
기사 정렬 순서 지정하여 크롤링
네이버 뉴스 기사 정렬 순서 검색 결과 URL 분석
|
|
정렬 순서에 해당하는 쿼리 생성
|
|
데이터를 엑셀 파일로 저장
|
|