메뉴 건너뛰기

자료실

DATA

1. 파이썬 설치 윈도우

 

2. 패키지 실행 

 

curl https://bootstrap.pypa.io/get-pip.py -o get-pip.py.

pip install openpyxl

pip install numpy 

pip install selenium

pip install requests

 

 

from selenium import webdriver as wd 
from selenium.webdriver.common.by import By
import openpyxl as excel
import time
import numpy as np
driver = wd.Chrome(executable_path="chromedriver.exe")
session_id = driver.session_id
 
url = "사이트url"
driver.get(url)
driver.execute_script("로그인페이지 이동")
elem = driver.find_element_by_id("아이디")
elem = driver.find_element_by_id("비번")
elem.send_keys("아이디값")
elem.send_keys("비번값")
driver.execute_script('로그인 처리하는 js')
 
wb = excel.Workbook()
sheet = wb.active
 
num = 1
sheet['A'+str(num)] = '값1'
sheet['B'+str(num)] = '값2'
sheet['C'+str(num)] = '값3'
sheet['D'+str(num)] = '값4'
 
sheet['E'+str(num)] = '값5'
sheet['F'+str(num)] = '값6'
sheet['G'+str(num)] = '값7'
sheet['H'+str(num)] = '값8'
sheet['I'+str(num)] = '값9'
 
sheet['J'+str(num)] = '값10'
sheet['K'+str(num)] = '값11'
sheet['L'+str(num)] = '값12'
sheet['M'+str(num)] = '값13'
sheet['N'+str(num)] = '값14'
 
for i in range(1,66):
    driver.execute_script('페이징처리하는값')
    roomslist = driver.find_element_by_id('리스트아이디')
    roomslist_li = roomslist.find_elements_by_tag_name("li")
    for val in roomslist_li:
        num += 1
        val.click()
        time.sleep(1)
        main = driver.find_elements_by_class_name("클레스이름")
 
        if(len(main) > 0):
            sheet['C'+str(num)] = main[0].text + main[1].text
 
        if(len(main) > 3):
            sheet['D'+str(num)] = main[2].text + main[3].text
 
        sheet['A'+str(num)] = driver.find_element_by_id("id1").text
        sheet['B'+str(num)] = driver.find_element_by_id("id1").text
        
        sheet['E'+str(num)] = driver.find_element_by_id("id1").text
        sheet['F'+str(num)] = driver.find_element_by_id("id1").text
        sheet['G'+str(num)] = driver.find_element_by_id("id1").text
        sheet['H'+str(num)] = driver.find_element_by_id("id1").text
        sheet['I'+str(num)] = driver.find_element_by_id("id1").text
        
        sheet['J'+str(num)] = driver.find_element_by_id("id1").text
        sheet['K'+str(num)] = driver.find_element_by_id("id1").text
        sheet['L'+str(num)] = driver.find_element_by_id("id1").text
        sheet['M'+str(num)] = driver.find_element_by_id("id1").text
        sheet['N'+str(num)] = driver.find_element_by_id("id1").text
        
        driver.execute_script('window.history.back()')
        time.sleep(1)
#테스트로 브레이크 처리했고 나중에 실코드에서는 풀어서 씀
        break
 
wb.save('info20201207.xlsx')
번호 제목 글쓴이 날짜 조회 수
49 리액트 안드로이드 배포 2021 01.13 키스토어 파일을 보관을 생활화 합시다 소프터 2021.01.13 0
48 우분투 라라벨 설치 소프터 2021.01.04 1
47 우분투 18.04 도커(Docker) 설치 방법 소프터 2021.01.04 1
46 aws 대략가격 참고만 하세요 소프터 2020.12.28 6
45 [php] 비메오사용 정리 1 세팅 소프터 2020.12.22 0
44 [php ]두날짜 사이에 기간을 배열로 반환 하는 함수 소프터 2020.12.11 3
43 개인정보 보안관리 솔루션 가이드 소프터 2020.12.09 1
» 셀레리움을 이용한 로그인과 데이터 크롤링예제 윈도우 10 소프터 2020.12.07 4
41 파이어베이스 웹푸시 소프터 2020.11.28 26
40 리액트 웹뷰 멀티 팝업설정 소프터 2020.10.16 22
39 리액트 네이티브 스플레쉬 정리 소프터 2020.08.27 9
38 chrome 80 SameSite cookie CORS 보안 변경사항 php 대응 소프터 2020.07.22 237
37 phpMyAdmin 접속이 localhost 가 아닐경우 설정법. 소프터 2020.07.16 9
36 [디장고] ubuntu 18.04 웹서버에 올리는법 소프터 2020.07.02 55
35 [장고] mysql 연결하기 우분투 18.04 소프터 2020.07.02 1
34 우분투에서 타임존 변경 소프터 2020.06.18 1
33 react-native-permissions NSBluetoothAlwaysUsageDescription 권한을 요청할떄 소프터 2020.06.10 10
32 리액트 블루투스 모듈 ios 에서 pod spec 소프터 2020.06.10 1
31 xcode 캐시 지우는법 소프터 2020.06.10 2
30 [REACT NATIVE] 패키지명, 번들명 변경하기 PACKAGE, BUNDLE [ANDROID, IOS] [1] 소프터 2020.05.29 470