Recent Posts
Recent Comments
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- 10814
- 액션바 필요없숴
- 나이순 정렬
- pwable.kr
- cmd2
- Couldn't read row 0
- tlqkf
- 6566
- 페니빙
- Make sure the Cursor is initialized correctly before accessing data for it.
- java.lang.IllegalStateException
- 포너블
- 파이썬
- kotlin
- 블록체인
- 코틀린
- Docker
- 쏘큩
- UNIQUE constraint failed
- 애너그램 그룹
- pwnable.kr
- 클라우드가 뭐야
- 클라우드란?
- SQLiteConstraintException
- col -1 from CursorWindow
- 백준
- python
- Drive-By-Download
- cmd1
- pwnable
Archives
- Today
- Total
푸르미르
[유사 프로젝트 코드 리뷰] 딥러닝 기반 영상 속 유해 언어 실시간 차단 시스템 -2 본문
오늘은 코드리뷰 두번째 시간
https://github.com/LEEMINJOO/Beeeep--/blob/master/crawling.py
오늘 대강 리뷰할 코드는
crawling.py
crawling함수를 갖고 있는 코드다.
임포트한 목록을 보면 selenium 라이브러리 안에 내장되어있는 webdriver을 사용한 것을 알 수 있다.
webdriver.Chrome()함수를 통해 드라이버를 로드한 후, get(url)함수를 통해 해당 url을 브라우저에 나타내는 과정을 거친 것을 알 수 있다.
F12키를 눌러줘면 url 사이트의 요소의 정보들을 알 수 있는 창이 나타난다.
예시로 아래의 네이버 사진을 덧붙이겠다.
이것을 이용하여 알게된 요소들의 클래스를 find_elements 로 시작하는 함수를 통해 click을 시키거나 입력을 하는 등의 행위를 진행할 수 있게 된다.
여기서는 아래의 url의 요소들을 갖고 진행하는 것으로 보인다.
목적을 달성하기 위한 행위를 크롤링 루프를 통해 시킨다.
crawling함수는 get_data.py에서 text를 갖고올 때 사용된다.
'AI' 카테고리의 다른 글
[Error]유니코드 인코딩 문제로 인해 json파일이 저장되지 않을 때 (0) | 2021.10.24 |
---|---|
pip 버그 (0) | 2021.10.23 |
[유사 프로젝트 코드 리뷰] 딥러닝 기반 영상 속 유해 언어 실시간 차단 시스템 -1 (0) | 2021.09.20 |
SystemError: java.nio.file.InvalidPathException 해결방법 (0) | 2021.08.03 |