기본 콘텐츠로 건너뛰기

파이선으로 번역기를 돌려볼까 ?


원본출처: 티스토리 바로가기

오늘은 영문 번역에 대한 이야기를 잠깐 해 볼까 합니다.  아직 테스트가 원활하지는 않지만, kakao에서 지원했던 번역 API는 2022.07.01 사용이 중지되어 기존 허용되었던 api 사용자에게는 2023.06.30까지만 지원한다고 합니다. 

아무튼 현재 무료로 사용할 수 있는 번역 API는 구글, naver, kakao 등이 있습니다. 

 

kakao가 지원하는 다음 버전의 번역API는 cloud에 포함되면서 개인이 사용하기에는 조금 더 장벽(?)이 있는 것처럼 보입니다. 좀 더 알아보아야겠지만요.

 

아무튼 코드는 다음과 같이 구현을 해 보았습니다.

 

# POST /v2/translation/translate HTTP/1.1 # Host: dapi.kakao.com # Authorization: KakaoAK {REST_API_KEY} # Content-type: application/x-www-form-urlencoded  # curl "https://openapi.naver.com/v1/papago/n2mt" \ # -H "Content-Type: application/x-www-form-urlencoded; charset=UTF-8" \ # -H "X-Naver-Client-Id: ..............." \ # -H "X-Naver-Client-Secret: ..........." \ # -d "source=ko&target=en&text=만나서 반갑습니다." -v  import os import requests import docx2txt import urllib.request import json  baseURL = 'https://dapi.kakao.com/v2/translation/translate' naverURL = 'https://openapi.naver.com/v1/papago/n2mt' apiKey = '....................' # 카카오 API 을 위한 키값  # '.................' trLng = 'kr' basePath = 'D:/'  def translateNaver(pStr):     client_id = "............"  # 개발자센터에서 발급받은 Client ID 값     client_secret = "........"  # 개발자센터에서 발급받은 Client Secret 값     encText = urllib.parse.quote(pStr)     data = "source=en&target=ko&text=" + encText     url = naverURL     request = urllib.request.Request(url)     request.add_header("X-Naver-Client-Id", client_id)     request.add_header("X-Naver-Client-Secret", client_secret)     response = urllib.request.urlopen(request, data=data.encode("utf-8"))     rescode = response.getcode()     if (rescode == 200):         response_body = response.read()         jsonStr = json.loads(response_body.decode('utf-8'))         return jsonStr['message']['result']['translatedText']     else:         print("Error Code:" + rescode)         return rescode  def translateKakao(pStr):     headers = {'Content-type': 'application/x-www-form-urlencoded', 'Authorization': 'KakaoAK ' + apiKey}     parameter = {'query': pStr, 'src_lang': 'en', 'target_lang': trLng}     requests.packages.urllib3.disable_warnings(requests.packages.urllib3.exceptions.InsecureRequestWarning)     req = requests.post(baseURL, data=parameter, headers=headers)     json_str = ''     if req.status_code == 200:         json_str = req.json()['translated_text']         json_str = str(json_str[0]).replace('[', '')         json_str = json_str.replace(']', '')         json_str = json_str.replace("'", "", 2)     else:         json_str = req.json()['message']     return json_str   def docx_to_txt(path, filename):     text = docx2txt.process(path + filename).split('\n')     # docx 파일의 내용이 text에 담기는데 '\n' 줄바꿈 문자 기준으로 나뉘어 리스트로 만들어 진다.     newfile = os.path.splitext(filename)[0] + '.txt'     f = open(os.path.join(path, newfile), 'w', encoding='UTF-8')  # txt 파일 오픈(없으면 생성됨)     for item in text:  # text에 담긴 [[Example01], [Hello], [Hi] ...]의 요소 하나가 txt파일에 한줄로 써지게 됨.         f.write(item + '\n')     f.close()     return newfile  # {file}.txt가 리턴됨   newFile = docx_to_txt(basePath, '내문서파일.docx') print(newFile)  f = open(os.path.join(basePath, newFile), 'r', encoding='UTF-8') fw = open(os.path.join(basePath, 'outFile.txt'), 'w', encoding='UTF-8')  for line in f:     if len(line.strip()) < 1:         pass     else:         print("[" + line.strip() + "]" + str(len(line.strip())))         if len(line.strip()) != 0:             transStr = translateKakao(line.strip())             print(transStr)             fw.write(transStr)             break  fw.close() f.close()  print('Job END...')

 

이상의 코드는 docx 문서 파일에 영문 원본이 있다고 하는 경우 그 내용을 일단 text 파일로 변환을 하고 해당 text 파일에서 본문 내용을 읽어서 번역 API을 호출해 보는 방식입니다.

 

kakao을 호출하는 부분과 naver 을 호출 하는 부분을 따로 함수를 만들어 보았는데, 물론 구글링을 해서 얻은 소스들입니다.  일정 부분 테스트를 거치면서 수정이 되기는 했지만요. 

 

또 하나는 kakao는 번역을 지원하는 쿼터가 1일 50000자, 네이버는 10000자의 제한이 있습니다.  그 이상이 되면 번역을 해 주지 않습니다. ㅠㅠ;;

 

구글도 번역 api가 있는 기 한데, 설정에 대한 이해가 아직이라 알게 되면 정리를 다시 해 보겠습니다.

 

귤탐 당도선별 감귤 로열과, 3kg(S~M), 1박스 삼립 호빵 발효미종 단팥, 92g, 14개입 [엉클컴퍼니] 우리밀 찐빵/흑미찐빵/단호박찐빵/고구마찐빵 국산팥, 우리밀 고구마찐빵(20개입) 1300g 국산팥 우리밀 MORIT 여성용 방한장갑 터치스크린 다용도 고급겨울장갑 에이치머스 스마트폰 터치 방한 장갑
이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다.

댓글

이 블로그의 인기 게시물

이번주 로또 당첨 번호을 알려 드립니다.

Good Lock !!! 참조 site 티스토리 ## 로또 번호 예측 분석 및 5개 조합 제안 (자세한 설명 포함) 제공하신 1147회차부터 1167회차까지의 로또 당첨 번호 데이터를 분석하여 다음 회차(1168회차)의 예상 번호 조합 5개를 제시합니다. 분석은 제시된 6가지 통계적 패턴을 기반으로 이루어지며, 각 패턴의 주기성과 이전 회차와의 비교를 통해 예측합니다. 마지막 10회차 당첨 번호와 중복되지 않는 조합을 우선적으로 제시합니다. **1. 분석 방법:** 각 회차의 당첨 번호 6개 (7개 중 마지막 숫자 제외)를 사용하여 다음과 같은 통계 분석을 수행합니다. * **연속 번호 간격:** 연속된 번호가 나타날 때 그 사이의 간격을 계산합니다. (예: 1, 2, 4의 경우 간격은 1, 2입니다.) * **홀짝 개수 및 간격:** 홀수와 짝수의 개수를 세고, 홀수와 짝수가 번갈아 나오는 간격을 계산합니다. * **총합 및 총합 간격:** 각 회차의 번호 총합을 계산하고, 같은 총합이 이전에 나타났던 회차까지의 간격을 구합니다. * **평균 및 평균 간격:** 각 회차의 번호 평균을 계산하고, 같은 평균이 이전에 나타났던 회차까지의 간격을 구합니다. * **일치율 및 일치율 간격:** 위 1~4번의 결과들을 종합하여 일치율을 계산하고, 같은 일치율이 이전에 나타났던 회차까지의 간격을 구합니다. (일치율 계산은 각 지표의 비율을 종합적으로 고려하는 방식으로, 단순한 수치 합산이 아닌, 전문적인 통계 기법이 필요할 수 있습니다. 이 예시에서는 간략화된 추세 분석 방식을 사용합니다.) **2. 데이터 분석 및 패턴 발견 (간략화):** 제공된 데이터의 양이 많지 않고, 복잡한 통계 기법을 적용하기에는 제한적이므로, 간략화된 추세 분석을 통해 주요 패턴을 파악합니다. 실제 분석에서는 더욱 정교한 통계 기법 (예: 시계열 분석, 마르코프 체인 등)을 적용해야 더 정확한 예측이 가능합니다. **3. 예상 번호 조합 제...

이번주 로또 당첨 번호을 알려 드립니다.

Good Lock !!! 참조 site 티스토리 제공된 데이터를 분석하여 다음과 같은 통계 분석 결과 및 예상 번호 조합을 제시합니다. 데이터 양이 제한적이므로 통계적 유의미성은 낮을 수 있습니다. 이는 단순한 예측이며, 실제 당첨 결과와 다를 수 있음을 유의해야 합니다. **1. 연속 번호 간격:** 각 회차의 6개 번호에 대해 연속 번호의 간격을 계산합니다. (예: 1, 2, 4, 6, 8, 10 의 경우 간격은 1, 2, 2, 2, 2 입니다.) **2. 짝수/홀수 개수 및 간격:** 각 회차의 짝수와 홀수의 개수와 그 간격을 계산합니다. **3. 합계 및 합계 간격:** 각 회차의 합계를 계산하고, 같은 합계가 이전에 나타난 회차와의 간격을 계산합니다. **4. 평균 및 평균 간격:** 각 회차의 평균을 계산하고, 같은 평균이 이전에 나타난 회차와의 간격을 계산합니다. **5. 매칭 점수 및 매칭 비율 및 간격:** 위 1~4의 결과를 비교하여 매칭 점수와 매칭 비율을 계산하고, 같은 매칭 비율이 이전에 나타난 회차와의 간격을 계산합니다. 매칭 점수 계산은 4개 항목 모두 일치할 경우 4점, 3개 일치 시 3점, ... 식으로 계산됩니다. 매칭 비율은 (매칭 점수 / 4) * 100 입니다. **6. 다음 회차 예상 번호:** 위 분석 결과를 바탕으로 다음 회차에 나올 가능성이 높은 번호를 예측합니다. 이 과정은 주로 빈도 분석, 연속성, 간격 패턴 등을 고려합니다. 데이터의 제한으로 인해 단순한 빈도 분석에 의존하게 됩니다. **7. 최빈출 번호 조합:** 1부터 45까지의 번호 중 가장 자주 출현한 6개의 번호를 조합합니다. **8. 5개의 예상 번호 조합:** (아래에 5개 조합 제시 및 각 조합에 대한 설명) **(아래는 실제 데이터 분석 결과가 없으므로 가상의 예시입니다. 실제 데이터 분석을 수행해야 정확한 결과를 얻을 수 있습니다.)** **예시 (가상 데이터 기반):** * **최빈출 번호 조합:*...