본문 바로가기

LLM2

Step-Back Prompt Engineering https://arxiv.org/pdf/2310.06117.pdf # 개요 LLM (Large Language Model) 의 상승세와 함께 LLM을 활용한 Application에 대한 관심도가 증가하고 있다. 이와 함께 등장한 하나의 중요한 키워드가 Prompt Engineering 이다. 여기에서 "프롬프트"는 LLM에게 특정 작업을 수행하도록 요청하는 "자연어 텍스트" 라고 정의할 수 있다. 이 프롬프트를 어떻게 설계하느냐가 LLM 모델의 출력 품질에 결정적인 영향을 끼지며 효과적인 프롬프트 설계는, 모델이 사용자의 의도를 정확하게 파악하고, 맥락에 맞는 유용한 답변을 생성할 수 있도록 한다. 위 그림은 프롬프트가 무엇인지 이해하기 제일 쉬운 사진이라고 생각된다. 사용자의 질문은 프롬프트가 되며 L.. 2024. 4. 9.
Parameter Efficient Fine-Tuning(PEFT) 개요 LLM 을 새롭게 원하는 도메인의 데이터를 사용하여 학습하고자 할 때 가장 큰 문제는 GPU의 VRAM 용량입니다. LLM은 성능을 위해서 이름 그대로 큰 모델을 사용하게 되는게 일반적이다보니 이 모델을 그대로 VRAM에 올려서 fine-tuning을 하려면 최소한 24G 이상의 VRAM이 필요하게 됩니다. 문제는 이렇게 큰 모델 전체의 파라미터들을 재학습하기 위해서는 VRAM 도 VRAM 이지만 학습 시간도 오래 걸릴 뿐 아니라 생각보다 데이터의 량, 상태 등에 따라서 수렴도 어렵다는 문제가 있습니다. 이러한 문제들을 해결하기 위해서 최근에 많은 방법들이 발표되고 있지만 이런 연구들의 가장 기반이 되는 Parameter Efficient Fine-Tuning(PEFT)에 대해서 먼저 알아보려고 합.. 2024. 1. 18.