2026/05/07

오늘의 이야기

 



OpenAI gpt-oss-20b 실행 가이드


open ai gpt oss 20b



 


 


OpenAI가 공개한 gpt-oss-20b 모델은 오픈 웨이트 기반으로 강력한 추론과 에이전트형 작업을 지원합니다. 소비자용 하드웨어에서도 실행 가능하며, 다양한 프레임워크에서 활용할 수 있습니다. 아래는 Hugging Face 페이지 내용을 바탕으로 정리한 실행 가이드입니다.


모델 특징



  • Apache 2.0 라이선스 → 자유로운 연구 및 상업적 활용 가능

  • 추론 수준 조정 가능 (Low / Medium / High)

  • 체인 오브 쏘트(Chain-of-thought) 접근 가능 → 디버깅 및 신뢰성 강화

  • 에이전트 기능: 함수 호출, 웹 브라우징, Python 실행, 구조화된 출력

  • MXFP4 양자화 → 16GB 메모리에서도 실행 가능

  • 파인튜닝 지원 → 개인화된 모델 학습 가능


환경 준비


필수 라이브러리 설치:

pip install -U transformers kernels torch

실행 방법


1. Transformers 활용


from transformers import pipeline
import torch

model_id = "openai/gpt-oss-20b"
pipe = pipeline(
"text-generation",
model=model_id,
torch_dtype="auto",
device_map="auto",
)

messages = [{"role": "user", "content": "Explain quantum mechanics clearly."}]
outputs = pipe(messages, max_new_tokens=256)
print(outputs[0]["generated_text"][-1])

서버 실행:


transformers serve
transformers chat localhost:8000 --model-name-or-path openai/gpt-oss-20b

2. vLLM 활용


uv pip install --pre vllm==0.10.1+gptoss \
--extra-index-url https://wheels.vllm.ai/gpt-oss \
--extra-index-url https://download.pytorch.org/whl/nightly/cu128 \
--index-strategy unsafe-best-match

vllm serve openai/gpt-oss-20b

3. Ollama 활용 (소비자용 PC)


ollama pull gpt-oss:20b
ollama run gpt-oss:20b

4. LM Studio 활용


lms get openai/gpt-oss-20b

5. Hugging Face CLI 다운로드


huggingface-cli download openai/gpt-oss-20b --include "original/*" --local-dir gpt-oss-20b/
pip install gpt-oss
python -m gpt_oss.chat model/

추론 수준 설정


시스템 프롬프트에 Reasoning: low, Reasoning: medium, Reasoning: high를 지정하여 응답 속도와 깊이를 조정할 수 있습니다.


활용 예시



  • 대화형 챗봇

  • 코드 실행 및 디버깅

  • 웹 브라우징 기반 에이전트

  • 교육 및 연구용 분석 도구


마무리


gpt-oss-20b는 연구자와 개발자에게 강력한 오픈 모델을 제공합니다. 소비자용 하드웨어에서도 실행 가능하므로, 개인 프로젝트부터 상업적 서비스까지 폭넓게 활용할 수 있습니다.





댓글 없음:

댓글 쓰기

오늘의 이야기

#스하리1000명프로젝트 오늘 내가 만든앱 하나 알려주고 싶어, 이 앱은 알림수집기 라고 이름을 붙였는 데, 내 폰에 표시 되는 알림을 읽어서 내가 지정한 단어가 들어 있고, 지출기록을 남겨야 하는 알림이 있으면 수집하고, 카카오톡으로 친구에게...