데이터분석

[23.06.30] 웹 크롤링 - 21(1)

gmwoo 2023. 6. 30. 15:24

1. HTML 구조

* <!Doctype htmlp : HTML5 문서를 선언하는 구문
* <html></html> : HTML 문서의 시작과 끝
* <head></head> : CSS, JavaScript, meta, title 정보들을 설정
* <body>=/body> : 실제 홈페이지 화면에 나타나는 부분

 

2. 용어

html head body div p a b br

 

3. BeautifulSoup 모듈 정의

* 홈페이지 내 데이터를 쉽게 추출할 수 있도록 도와주는 파이썬 외부 라이브러리

* 웹 문서 내 수많은 html 태그들을 파서(parser)를 활용해 사용하기 편한 파이썬 객체로 만들어 제공


 

 

반응형