데이터 크롤링이란?


데이터 크롤링이란?

데이터 크롤링이란? 데이터 크롤링(Data Crawling)은 웹 페이지를 체계적으로 브라우징 하는 컴퓨터 프로그램을 통해, 인터넷상에서 웹사이트의 정보를 수집하는 과정을 말합니다.

수집된 데이터는 웹 콘텐츠 분석, 가격 비교, 경쟁 연구, 소셜 미디어 트렌드 분석 등 다양한 목적으로 활용됩니다. 크롤링 과정은 크게 다음과 같습니다. 1.

URL 리스트 생성 크롤링을 시작하기 위해, 크롤러는 어떤 웹페이지에서 시작할지 URL 리스트를 생성합니다. 2. 웹페이지 요청 크롤러는 생성된 URL 리스트에 따라 해당 웹페이지에 접속합니다. 3.

웹페이지 다운로드 웹페이지에 접속하면, 그 페이지의 HTML 소스 코드를 다운로드합니다. 4. 데이터 추출 다운로드한 웹페이지에서 필요한 정보를 추출합니다.

이 과정은 '파싱(Parsing)'이라고도 하며, HTML 태그를 분석하여 원하는 데이터를 찾아내는 과정을 말합니다. 5. 데이터 저장 추출한 데이터는 데이터베이스나 파일에 저장됩니다. 6.

추가...


#IT #데이터관리 #데이터저장 #데이터활용 #빅데이터 #인터넷 #코딩

원문링크 : 데이터 크롤링이란?