많고 많은 프로그래밍 언어 중 파이썬을 선택하며, 배워나가야 할 방향을 결정했다.

일단 따라해보는 거다.

많은 예제를 보고 고수가 말한대로, 시연해준대로 그대로 따라해보며 하나하나 깨우쳐나가는게 맞다고 생각했다.

 

자격증 시험공부를 할 때 과년도 기출문제를 먼저보고 이론을 보는 것과

이론을 보고 기출문제를 보는 것은 큰차이가 있다고 생각한다.

 

파이썬이 물론 유저 친화적인 언어임에는 분명하나, 명령어들을 공부하듯이 외워봤자 정작 프로그램에 응용하는 것은 별개의 문제이기에

무작정 따라해보고 필요하면 관련 내용을 찾아보기로 생각했다. 

 

동영상이나 웹사이트를 보고 공부하는 것이 불편하거나, 그와는 별개로 바이블이 필요하다면 기초 참고서가 필요하다면

WikiDocs에서 관련 책자를 구매할 수 있으니 참고하도록 하자.

 

 

관련된 자료들을 앉은자리에서 손쉽게 접근할 수 있어서 여러모로 유용한 사이트이다. 

 

인터넷에 jump2phthon pdf 등의 검색어를 사용하여 접근해봤자 오래된 버전의 pdf파일만 돌아다니니 현재의 버전과 맞지 않거나

그곳의 예제를 사용해도 작동되지 않는 경우가 허다하니 공식사이트의 자료를 참고하도록 하자.

 

 

 

예시로 점프투파이썬을 클릭하였을 때 나오는 화면이다.

 

실제 구매하는 책의 내용을 그대로 무료로 볼 수 있으니 참고하도록 하자. 물론 구매를 하면 저자에게 도움이 된다는 것은 잘알고 있으리라 생각한다.

 


 

 

 

 

첫 과제는 크롤링이다.

 

크롤링의 정의는 다음과 같다.

 

크롤링(crawling) 혹은 스크레이핑(scraping)은 웹 페이지를 그대로 가져와서 거기서 데이터를 추출해 내는 행위다. 크롤링하는 소프트웨어는 크롤러(crawler)라고 부른다. - 출처 : 나무위키

 

정확하게는 스크레이핑이 되겠다.

 

기본적으로 해당과제를 수행하기 위해서는 포털사이트의 구조를 알아야 하기에 html 자바스크립트 등의 정보도 알아야겠지만, 

그런거 필요없이 무작정 따라하기부터 해보며 이해가 안되서 필요한 것들이 생기면 틈틈히 공부를 하는게 시간을 줄이고 효율적인

학습이 될것이라 생각한다.

 

 

우선가장 먼저해야할 것은 폴더 설정이다.

 

 

visual studio code 를 실행하여 폴더열기를 누른 후 임의의 폴더를 지정한다.

 

 

"DAY1"이라는 이름을 가진 폴더를 지정했다.

 

 

 

다음은 터미널을 열어서 python -venv 이름을 입력한다.

필자는 levelup이라는 이름을 설정하여 python -m venv leveluo 을 입력하였다.

 

 

해당내용을 입력 후 약간의 시간이 지나면

 

설정했던 폴더 아래에 지정한이름의 가상환경이 설정된 것을 볼 수 있다.

 

 

다음은 터미널로 이동하여 설정한 폴더로 이동하도록 한다.

명령어는 cd 이름\scripts 이며 엔터를 친 후 activate를 입력하도록 한다.

\표시는 역슬러쉬를 말한다.

 

여기서 바로 실행이 되는 사람이 있을 것이고 

이런 밑도 끝도 없는 글이 뜨는 사람이 있을 것이다.

 

이는 powershell이 기본겂으로 설정되어 있어 발생하는 오류이니 아래와 같이 따라해보도록 하자

 

1. Ctrl + Shift + P

2. Terminal: Select Default Shell

3. command prompt

4. Ctrl + Shift + `

 

그런다음 다시 위의 내용인

폴더이동과 activate를 입력한다.

 

정상적으로 작업이 수행되었다면 디렉토리 위치 앞에 (이름)이 붙게된다.

 

이상태에서 셀레니움을 설치해주도록 하자

설치하는 방법은 명령어 입력으로  pip install selenium 이다.

 

그리고 기다리면 설치가 알아서 완료된다.

 

 

 

다음 할일은 크롬드라이버를 설치하는 것이다. 

 

https://chromedriver.chromium.org/downloads 해당페이지에서 자신의 크롬브라우저 버전에 맞는 드라이버를 설치하도록 하자.

본인의 크롬브라우저 버전을 모른다면 우측상단에서 확인할 수 있으니 이미지파일을 참고하도록 하자.

 

 

필자는 87버전이므로 해당 버전을 선택하여 윈도우용으로 다운로드 받았다.

버전정보는 모든 숫자가 일치해야 하는 것이아니라 앞에 있는 두숫자만 일치하면 된다.

 

 

 

다운로드가 완료되었다면 해당 프로그램파일을 바로 드래그앤 드랍하여 내가 설정한 폴더로 넣어주도록 하자

실제로는 압축을 풀어서 드래그앤드랍하여야 한다. 압축파일상태로 넣으면 오류가 나니 참고하도록 하자.

 

정상적으로 이동을 하였다면 아래의 그림과 같이 크롬드라이버가 추가되어있는 모습을 볼 수 있다.

 

이 후 뉴파일 버튼을 클릭하여 Google.py라는 파일을 생성하도록 하자.

 

만들어진 google.py에 셀레니움 파일의 예제를 입력해보도록 한다.

참고로 해당내용은 셀레니움 공식홈페이지에서 가져온 예제에서 변경한것이니 참고하도록 하자.

2. Getting Started — Selenium Python Bindings 2 documentation (selenium-python.readthedocs.io)

from selenium import webdriver

from selenium.webdriver.common.keys import Keys

 

driver = webdriver.Chrome()

driver.get("http://www.google.com")

 

위와 같이 입력하고 우측상단의 실행버튼을 눌러보면 구글 홈페이지가 크롬으로 실행되는 것을 확인할 수 있다.

 

 

이제 본격적인 코딩을 해볼 준비가 끝났다.

생각보다 따라하는건 쉽지만 정리하는 것은 시간이 오래 걸리는 것 같다.

 

열심히하자.

 

'파이썬 공부' 카테고리의 다른 글

파이썬 - 크롤링 2  (0) 2021.01.12
파이썬에 입문하며  (0) 2021.01.07

+ Recent posts