티스토리 뷰
이번 시간에는 Java로 Jsoup 라이브러리를 적용하고 간단하게 사용하는 방법에 대해서 알아보도록 하겠습니다.
Jsoup이란?
Jsoup은 HTML 파싱 Java 라이브러리입니다. DOM, CSS 및 jquery와 같은 방법을 사용하여 데이터를 추출하고 조작하는 매우 편리한 API를 제공합니다.
주로 정적인 웹 페이지를 파싱하고자 하는 경우, 간단하게 HTML을 가져와 파싱을 할 수 있는 라이브러리입니다.
한번 적용해 봅시다. 이 곳 에서 각자 환경에 맞게 적용을 하겠습니다. 역시나 저는 gradle을 사용하기 때문에 제 project build.gradle 파일에 아래와 같이 적어주겠습니다.
dependencies {
compile group: 'org.jsoup', name: 'jsoup', version: '1.11.3'
}
그럼 이제 코드 상에서 Jsoup을 사용할 준비가 된 것입니다. 그럼 이제 간단하게 실습을 해보죠. 아래와 같이 간단한 테스트 코드를 작성해보겠습니다.
public void testJsoup() throws IOException {
String homeUrl = "https://www.google.com/";
Document doc = Jsoup.connect(homeUrl).get();
System.out.println(doc.toString());
}
그럼 google.com의 html 소스가 아래와 같이 출력 될 것입니다. 이번시간에는 여기까지만 해보고 다음시간에 좀 더 구체적인 실습을 해보도록 하겠습니다.
끝으로
이 글이 도움이 되었다면, Google 광고 한번씩 클릭 부탁 드립니다. 🙏🙏🙏
광고 클릭은 많은 힘이 됩니다!
반응형
'프로그래밍 > 크롤링' 카테고리의 다른 글
[Selenium] Invisible(display:none) 상태인 Element의 text 가져오는 방법 (0) | 2020.07.28 |
---|---|
(크롤링) Selenium "unexpected alert open” 오류 발생 시 해결법 (0) | 2020.02.15 |
(크롤링) Selenium iframe 파싱 방법 (0) | 2020.02.13 |
(크롤링) Java Selenium 사용시에 브라우저 전시 안되게 하는 방법 (크롬 드라이버(브라우저)숨기기) (0) | 2019.11.06 |
[크롤링] Java Selenium 사용법 (0) | 2019.11.06 |
공지사항
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday
TAG
- 스프링부트
- 자전거
- 자전거 여행
- 인텔리제이
- 이펙티브
- git
- 일본 자전거 여행
- 배낭여행
- 텐트
- JavaFX Window Close
- JavaFX Table View
- 배낭 여행
- TableView
- windows
- 일본 여행
- effective java
- JavaFX 테이블뷰
- springboot
- 자바
- 일본 배낭여행
- intelij
- java
- 이펙티브자바
- effectivejava
- 이펙티브 자바
- Java UI
- JavaFX 종료
- JavaFX
- 일본여행
- 방통대 과제물
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
글 보관함