IT 활용/AI 활용

ChatGPT 대안 - 흥미로운 LLM 모델 6가지

&+&& 2023. 7. 11. 00:05

현재 전 세계적으로 가장 대표적인 LLM 모델은 ChatGPT이지만, ChatGPT가 유일한 대규모 언어 모델은 아니며 사용 목적에 따라 다른 LLM이 더 효과적일 수 있습니다. 이번 글에서는 ChatGPT 외에 다른 LLM 모델에는 어떤 것이 있으며 각각 어떤 특징이 있는지 살펴보겠습니다.

 

LLM 성능 평가

ChatGPT가 대부분의 벤치마크에서 최상위권의 LLM 모델이자 서비스인 것은 맞지만 LLM 모델의 범위가  넓고 사용 방식도 다양하기 때문에 LLM 모델이 생성하는 답변의 품질을 정량적으로 측정하기는 어렵습니다. 이러한 경우에 참고할 수 있는 자료로 허깅 페이스(Hugging Face)의 오픈 LLM 리더보드와 같은 순위가 있으나 이 역시 참고할 수 있는 자료일 뿐입니다.

따라서, 사용자 입장에서는 다양한 모델들을 테스트해 보고 사용 목적에 적합한 LLM을 선택하는 것이 가장 중요합니다. 아래에 소개하는 여러 LLM 모델 서비스들은 사용하는 방법도 어렵지 않으니 한 번 사용해 보시고 본인의 목적에 가장 적합한 LLM을 찾아보시기 바랍니다.

 

구글 바드(Google Bard)

구글 바드는 2023년 구글 연례 개발자회의에서 공개되었으며 5300억 개의 파라미터로 이루어진 최신 대규모 언어 모델 PaLM2를 탑재한 LLM 서비스입니다. 바드는 챗GPT에는 없는 기능을 공개시점부터 탑재하면서 이목을 끌었으며 구글이 강조한 특징적인 기능은 아래와 같습니다.

  1. 인터넷 검색 기능을 갖추고 있습니다. 이 기능은 기존에 학습한 지식만으로 답변이 어려운 경우 또는 답변의 품질을 향상하기 위해 바드가 추가적으로 인터넷에서 최신 자료를 찾아서 답변을 작성하는 기능입니다. 지금은 챗GPT에서도 베타 버전으로 인터넷 브라우징을 지원하고 있지만 초기 버전의 챗GPT에서는 기존 자료를 사용한 답변만이 가능했습니다.
  2. 바드는 텍스트 기반 입력만 지원하는 챗GPT와는 달리 음성 입력을 통한 질문 기능을 사용할 수 있습니다.
  3. 바드의 답변을 바로 외부로 전송하는 것이 가능합니다. 이를 통해 바드는 생성한 응답을 간단하게 구글 독스 또는 메일 등으로 내보낼 수 있으며 이를 통해 답변을 다른 방식으로 활용하는 것이 좀 더 편리합니다. 챗GPT는 이러한 기능을 제공하지 않기 때문에 생성된 답변(TEXT)을 복사 & 붙여 넣기 방식으로 이동해야 합니다.
  4. 1번의 인터넷 검색 기능을 활용한 웹 페이지 요약 기능을 갖추고 있습니다. LLM에서 많이 활용되는 방식인 자료 요약 작업을 인터넷 검색 기능을 활용하여 웹 페이지 요약에 바로 활용할 수 있습니다.
  5. 바드는 한가지 질문 및 명령어에 대해 여러 개의 응답을 생성해서 제시하는 것이 가능합니다. 특히나 이는 창의성이 요구되는 분야에서 활용도가 높으며 다른 초안 보기를 선택해 바드의 여러 답변들 중 선호하는 답변을 선택하는 것이 가능합니다.
  6. 일반적인 LLM의 코드 생성 기능에서 나아가 좀 더 높은 수준의 코드 설명 기능을 제공합니다. 이는 인공지능이 생성해 주는 코드 주석이라고 할 수 있으며 이를 통해 사용자는 코드가 어떻게 작동하는지 좀 더 쉽게 파악이 가능합니다.

구글 바드를 사용해 보고 싶다면 아래 링크를 통해 간단한 회원 가입 절차 진행 후 사용해 보실 수 있습니다.

 

‎Google의 AI 실험 버전인 Bard 사용해 보기

Bard는 창의적이고 유용한 파트너로서, 상상력을 마음껏 발휘하고 생산성을 높이며 아이디어를 실현하도록 도와줍니다.

bard.google.com

 

메타 라마(META llama)

다음으로는 페이스북으로 잘 알려진 메타가 공개한 LLM 모델인 라마가 있습니다. 라마는 오픈AI의 챗GPT나 구글의 바드와는 다르게 오픈소스로 공개되어서 누구나 라마를 베이스로 특정 응용 분야에 맞게 튜닝된 모델을 생성할 수 있습니다. 라마 자체 성능으로는 챗GPT나 바드보다는 부족하지만 전 세계의 개발자들이 다양한 방식으로 라마를 개선하면서 앞서 얘기한 허깅페이스의 LLM 리더보드 상위권 모델 중 상당수는 라마를 베이스로 하고 있습니다. 아래의 알파카(Alpaca), 비쿠나(Vicuna), 과나코(guanaco)는 모두 라마를 기반으로 합니다.

알파카(Alpaca)

스탠포드 대학에서 메타의 라마 7B(7B는 7 billion으로 70억 개의 파라미터를 의미) 모델을 베이스로 하여 챗GPT와 유사한 방식의 훈련을 거친 모델로 알파카 7B가 만들어졌습니다. 알파카는 LLM 중 상대적으로 가벼운 모델이면서 여러 용도로 활용이 많이 되는 모델입니다.

Beomi라는 분이 이를 바탕으로 한국어를 추가 학습시킨 KoAlpaca 모델을 만들기도 했습니다. KoAlpaca를 활용한 채팅 서비스는 아래의 링크에서 살펴볼 수 있습니다.

 

HuggingChat

Model: beomi/KoAlpaca-Polyglot-12.8B · Generated content may be inaccurate or false.

chat.koalpaca.com

비쿠나(Vicuna)

비쿠나는 LMSYS.org에서 라마를 기반으로 만들어 졌으며 7만 개의 대화로 구성된 학습 세트로 훈련된 모델로 13B(130억 개)와 7B(70억 개) 두 가지 모델로 제공됩니다. 오픈소스 모델들 중 채팅을 통한 상호 작용에 있어 가장 경쟁력이 높은 모델로 평가됩니다. 일부 성능 비교 자료에서는 비쿠나 13B 모델은 구글의 바드와 거의 동일한 성능 점수를 보여줍니다.

 

과나코(guanaco)

허깅페이스 LLM 리더보드에서 2위를 차지하고 있는 LLM 모델이 과나코입니다. 이는 라마의 13B 모델을 기반으로 워싱턴 대학교 연구진들에 의해 만들어 졌습니다. 과나코는 QLoRA라는 새로운 미세 조정 방식의 튜닝이 적용되어 있으며 개발진은 훨씬 적은 자원으로 동등한 수준의 학습 결과를 얻을 수 있다고 밝히고 있습니다. 과나코는 탁월한 다국어 지원 능력과 저렴한 비용(시간과 돈)으로 학습시킬 수 있는 것이 특징입니다.

 

팔콘(TII Falcon)

UAE의 기술혁신연구소(Technology Innovation Institute)에서 개발된 모델로 라마를 기반 모델로 하지 않으면서 아파치 2.0 라이선스를 따르는 오픈 소스 LLM 모델입니다. 아파치 2.0 라이선스에 따라 모델의 활용에 있어 가장 개방적이고 제약이 적은 모델입니다. 팔콘은 40b와 7b 모델이 공개되었으며 이 중 40b 모델은 LLM 리더보드 1위를 차지하고 있는 모델입니다.

 

Falcon LLM

Falcon LLM, a foundational large language model (LLM) with 40 billion parameters

falconllm.tii.ae

 

앤트로픽 클로드(Anthropic Claude)

앤트로픽에서 개발된 클로드는 기업의 텍스트 기반 업무 처리 지원을 염두에 두고 개발된 LLM 모델을 기반으로한 챗봇 AI 서비스입니다. 클로드의 가장 큰 특징은 한 번에 프롬프트에 입력할 수 있는 토큰의 개수입니다. 클로드는 무려 10만 토큰을 한 번에 입력할 수 있는 엄청난 규모를 보여줍니다.

ChatGPT의 기본 토큰 한도는 4096 토큰이었지만, 이제 최대 8000 토큰과 32000 토큰까지 사용할 수 있는 서비스가 출시되었습니다. 클로드는 ChatGPT의 3배에 달하는 토큰을 사용할 수 있어 이론적으로 많은 양의 콘텐츠와 상세한 지침을 입력하는 데 훨씬 더 뛰어난 성능을 가진 AI 서비스입니다. 물론 이는 토큰 크기만을 고려한 것이며, 지금까지의 사용자 평가는 ChatGPT보다 더 나은 품질의 답변을 생성하기 어렵다는 의견이 대부분입니다.

 

Anthropic

An AI safety and research company that's working to build reliable, interpretable, and steerable AI systems.

www.anthropic.com

 

오늘은 다양한 LLM 모델과 관련 서비스들에 대해 살펴보았습니다. 개인적으로는 구글의 바드가 프로그래밍 분야에 특화된 서비스를 좀 더 강화했으면 좋겠다는 생각이 듭니다.