728x90

교육생 4

[인공지능 데브코스 TIL] 0831 웹 스크래핑 기초 (4): Seaborn, WordCloud

프로그래머스 인공지능 데브코스 2주차 강의를 정리한 글입니다. Seaborn 데이터 시각화 라이브러리 matplotlib 기반 # seaborn 불러오기 import seaborn as sns sns.lineplot(x,y): 꺾은 선 그래프 sns.barplot(x,y): 막대 그래프 for categorical data matplotlib의 속성을 변경해서 그래프 만지기 # matplotlib 불러오기 import matplotlib.pyplot as plt plt.title(): 제목 추가 plt.xlabel(), plt.ylabel(): 축에 설명 추가 plt.xlim(), plt.ylim(): 축의 범위 지정 plt.figure(figsize = (x, y)): 그래프 크기 지정 실습1: lin..

[인공지능 데브코스 TIL] 0830 웹 스크래핑 기초 (3): Selenium

프로그래머스 인공지능 데브코스 2주차 강의를 정리한 글입니다. 동적 웹 페이지 정적 웹 사이트: HTML 내용이 고정 동적 웹 사이트: HTML 내용이 변함 ex) 피드를 새로고침할 때마다 새로운 글이 올라오는 것 응답이 된 후 렌더링이 될 때 까지의 지연시간 존재 → request 이후 바로 parsing을 하면 안될 수 있다 -데이터 처리가 완전히 되지 않은 상태에서 request하면 불완전한 데이터 받을 수 있다. → 임의로 시간을 지연한 후 데이터 처리가 끝난 후 정보를 가져오는 비동기처리가 필요하다. → 키보드 입력, 마우스 클릭 등을 할 수 있도록 웹 브라우저를 파이썬으로 조작하는 Selenium활용! Selenium Selenum: 웹 브라우저를 조작하는 라이브러리 WebDriver: 웹 브..

[인공지능 데브코스 TIL] 0829 웹 스크래핑 기초 (2): BeautifulSoup4

프로그래머스 인공지능 데브코스 2주차 강의를 정리한 글입니다. DOM (Document Object Model) 웹 문서 (html)를 로드한 후, 파싱을 진행한 문서를 DOM이라고 한다. 각 노드를 객체로 생각하면 문서를 더욱 편리하게 관리할 수 있다 브라우저가 HTML을 DOM으로 바꾸는 이유 원하는 요소를 동적으로 변경해줄 수 있다. 원하는 요소를 쉽게 찾을 수 있다. → 우리는 파이썬으로 html을 파싱해줄 수 있는 HTML parser가 필요하다! Beautiful Soup HTML 코드를 분석해주는 HTML parser import requests res = requests.get("http://www.example.com") # Beautiful Soup 불러오기 from bs4 import..

[인공지능 데브코스 TIL] 0828 웹 스크래핑 기초 (1): HTTP 요청 주고받기

프로그래머스 인공지능 데브코스 2주차 강의를 정리한 글입니다. HTTP HTTP(HyperText Transfer Protocol): 웹 상에서 정보를 주고받기 위한 약속 HTTP 요청(request): 클라이언트가 서버에게 정보 요청 HTTP 응답(response): 서버가 클라이언트에게 응답 HTML HTML(HyperText Markup Language) 태그로 감싼 요소의 집합으로 이루어져 있다. → 우리가 원하는 내용이 HTML 문서에 어디에 있는지, 어떤 태그로 묶여있는지를 관찰해야한다. Head: 문서에 대한 정보(제목, 언어 등) Body: 문서의 내용(글, 이미지, 동영상 등) 웹 스크래핑과 웹 크롤링 웹 스크래핑: 특정한 목적으로 특정한 웹 페이지들로부터 원하는 정보를 추출하는 것 ex..

728x90