기본 콘텐츠로 건너뛰기

파이썬으로 웹 페이지 스크랩을 해 보는 코드 만들어보기 (feat chat.openai.com)


원본출처: 티스토리 바로가기
스크랩

오늘은  python  코드를 이용해서 스크랩하는 코드를 만들어 보았습니다.   이 코드도 openAI에게 요청해서 받은 코드 2가지를 공개해 볼까 합니다.

 

첫 번째 요청 결과는 아래와 같이 구성해 알려 주었습니다. 다만, 저기 있는 URL 이 검색이 되지 않는 코드 이기 때문에 그다지 도움이 되지 못할 것으로 생각이 됩니다.

import requests from bs4 import BeautifulSoup  # set the URL of the website to scrape url = "https://www.thecrazytourist.com/15-best-places-to-visit-in-south-korea/"  # send a GET request to the URL response = requests.get(url)  # parse the HTML content of the response using BeautifulSoup soup = BeautifulSoup(response.content, 'html.parser')  # find all the article elements on the page articles = soup.find_all('article')  # iterate over each article and extract the title and description for article in articles:     title = article.find('h2').text     description = article.find('div', {'class': 'entry-content'}).text.strip()          # print the title and description of the article     print(f"Title: {title}")     print(f"Description: {description}\n")

 

두 번째 시도를 해 보았습니다. 이번에 알려주는 URL은 실제 조회가 됩니다. 

import requests from bs4 import BeautifulSoup  # the URL of the page to scrape url = 'https://www.tripadvisor.com/Attractions-g294196-Activities-South_Korea.html'  # send a GET request to the URL response = requests.get(url)  # parse the HTML content of the page with BeautifulSoup soup = BeautifulSoup(response.content, 'html.parser')  # find all the links to attractions on the page attraction_links = soup.find_all('a', {'class': 'attractions-attraction-overview-pois-PoiCard__poiLink--3PWj5'})  # print the titles and links of the attractions for link in attraction_links:     title = link.get_text()     href = link.get('href')     print(f'{title}: https://www.tripadvisor.com{href}')

이렇게 만들어진 코드를 그대로 사용할 수 있을까요?

 

그건 좀 어렵게 생각이 됩니다. 다만,  이런 기본적인 코드를 얻음으로 인해서 배움의 길을 넓혀갈 수 있는 기초는 되지 않을까 하는 생각을 해 보게 되었습니다. 

 

openAI에 대한 많은 기사거리, youtube 콘텐츠 많이 많이 생성이 되고 있습니다. 이것도 한 시간의 유행일까요? 아무튼 따라 해 보기는 해야 할 것 같습니다. 

 

*** 위 코드는 따라 하지 마세요. 결과를 얻을 수 없는 코드 입니다. ㅠㅠ;;

쿠팡링크 쿠팡와우 로켓프래쉬 로켓패션
이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다.

댓글

이 블로그의 인기 게시물

이번주 로또 당첨 번호을 알려 드립니다.

Good Lock !!! 참조 site 티스토리 ## 로또 번호 예측 분석 및 5개 조합 제안 (자세한 설명 포함) 제공하신 1147회차부터 1167회차까지의 로또 당첨 번호 데이터를 분석하여 다음 회차(1168회차)의 예상 번호 조합 5개를 제시합니다. 분석은 제시된 6가지 통계적 패턴을 기반으로 이루어지며, 각 패턴의 주기성과 이전 회차와의 비교를 통해 예측합니다. 마지막 10회차 당첨 번호와 중복되지 않는 조합을 우선적으로 제시합니다. **1. 분석 방법:** 각 회차의 당첨 번호 6개 (7개 중 마지막 숫자 제외)를 사용하여 다음과 같은 통계 분석을 수행합니다. * **연속 번호 간격:** 연속된 번호가 나타날 때 그 사이의 간격을 계산합니다. (예: 1, 2, 4의 경우 간격은 1, 2입니다.) * **홀짝 개수 및 간격:** 홀수와 짝수의 개수를 세고, 홀수와 짝수가 번갈아 나오는 간격을 계산합니다. * **총합 및 총합 간격:** 각 회차의 번호 총합을 계산하고, 같은 총합이 이전에 나타났던 회차까지의 간격을 구합니다. * **평균 및 평균 간격:** 각 회차의 번호 평균을 계산하고, 같은 평균이 이전에 나타났던 회차까지의 간격을 구합니다. * **일치율 및 일치율 간격:** 위 1~4번의 결과들을 종합하여 일치율을 계산하고, 같은 일치율이 이전에 나타났던 회차까지의 간격을 구합니다. (일치율 계산은 각 지표의 비율을 종합적으로 고려하는 방식으로, 단순한 수치 합산이 아닌, 전문적인 통계 기법이 필요할 수 있습니다. 이 예시에서는 간략화된 추세 분석 방식을 사용합니다.) **2. 데이터 분석 및 패턴 발견 (간략화):** 제공된 데이터의 양이 많지 않고, 복잡한 통계 기법을 적용하기에는 제한적이므로, 간략화된 추세 분석을 통해 주요 패턴을 파악합니다. 실제 분석에서는 더욱 정교한 통계 기법 (예: 시계열 분석, 마르코프 체인 등)을 적용해야 더 정확한 예측이 가능합니다. **3. 예상 번호 조합 제...

이번주 로또 당첨 번호을 알려 드립니다.

Good Lock !!! 참조 site 티스토리 제공된 데이터를 분석하여 다음과 같은 통계 분석 결과 및 예상 번호 조합을 제시합니다. 데이터 양이 제한적이므로 통계적 유의미성은 낮을 수 있습니다. 이는 단순한 예측이며, 실제 당첨 결과와 다를 수 있음을 유의해야 합니다. **1. 연속 번호 간격:** 각 회차의 6개 번호에 대해 연속 번호의 간격을 계산합니다. (예: 1, 2, 4, 6, 8, 10 의 경우 간격은 1, 2, 2, 2, 2 입니다.) **2. 짝수/홀수 개수 및 간격:** 각 회차의 짝수와 홀수의 개수와 그 간격을 계산합니다. **3. 합계 및 합계 간격:** 각 회차의 합계를 계산하고, 같은 합계가 이전에 나타난 회차와의 간격을 계산합니다. **4. 평균 및 평균 간격:** 각 회차의 평균을 계산하고, 같은 평균이 이전에 나타난 회차와의 간격을 계산합니다. **5. 매칭 점수 및 매칭 비율 및 간격:** 위 1~4의 결과를 비교하여 매칭 점수와 매칭 비율을 계산하고, 같은 매칭 비율이 이전에 나타난 회차와의 간격을 계산합니다. 매칭 점수 계산은 4개 항목 모두 일치할 경우 4점, 3개 일치 시 3점, ... 식으로 계산됩니다. 매칭 비율은 (매칭 점수 / 4) * 100 입니다. **6. 다음 회차 예상 번호:** 위 분석 결과를 바탕으로 다음 회차에 나올 가능성이 높은 번호를 예측합니다. 이 과정은 주로 빈도 분석, 연속성, 간격 패턴 등을 고려합니다. 데이터의 제한으로 인해 단순한 빈도 분석에 의존하게 됩니다. **7. 최빈출 번호 조합:** 1부터 45까지의 번호 중 가장 자주 출현한 6개의 번호를 조합합니다. **8. 5개의 예상 번호 조합:** (아래에 5개 조합 제시 및 각 조합에 대한 설명) **(아래는 실제 데이터 분석 결과가 없으므로 가상의 예시입니다. 실제 데이터 분석을 수행해야 정확한 결과를 얻을 수 있습니다.)** **예시 (가상 데이터 기반):** * **최빈출 번호 조합:*...