생성형 AI란?
생성형 AI(Generative AI)는 사용자의 요청을 이해하고 새로운 콘텐츠를 생성해내는 인공지능 기술을 의미한다. 이는 딥러닝의 하위 개념으로, 텍스트, 이미지, 오디오, 비디오 등 다양한 유형의 데이터를 생성할 수 있는 능력을 갖추고 있다. 이러한 특징 때문에 '생성형 AI'라는 이름이 붙었다.
ChatGPT란?
생성형 AI 하면 가장 먼저 떠오르는 서비스가 바로 ChatGPT일 것이다. ChatGPT는 OpenAI가 개발한 GPT-3.5 및 GPT-4 기반의 인공지능 챗봇으로, 인간과 자연스럽게 대화를 나누며 질문에 답하고 정보를 제공하는 역할을 한다.
처음 등장했을 때는 거대 언어 모델(LLM)로서 주로 텍스트 기반 학습을 수행했지만, 최근에는 멀티모달 학습을 통해 텍스트뿐만 아니라 이미지, 음성, 비디오까지 생성할 수 있는 모델로 발전했다.
Multimodal이란?
멀티모달 AI는 텍스트, 이미지, 오디오, 비디오 등 다양한 형태의 데이터를 동시에 학습하고 처리할 수 있는 인공지능 기술이다. 이를 통해 서로 다른 데이터 유형 간의 관계를 학습하며, 보다 정교한 응용이 가능하다.
예시) CLIP
CLIP은 OpenAI에서 개발한 언어-이미지 멀티모달 모델로, 대규모 웹 언어-이미지 병렬 데이터셋을 학습하여 텍스트와 이미지 간의 상호작용을 이해하는 방식으로 설계되었다.
- 텍스트 입력 → 관련된 이미지 검색 가능
- 이미지 입력 → 해당 이미지에 적합한 텍스트 설명 생성 가능
CLIP은 이미지 검색, 자동 캡션 생성, 콘텐츠 분석 등의 다양한 응용 분야에서 활용되고 있다.
+ Form Factor
이제는 '형태(Form Factor)'의 경쟁 시대라고도 불린다.
폼팩터(Form Factor)란 제품의 외형, 크기, 물리적 배열을 의미하며, AI 기술이 발전함에 따라 하드웨어와의 결합이 더욱 중요해지고 있다.
특히, 생성형 AI의 발전과 함께 음성 인식, 컴퓨터 비전 등 컴퓨터 센싱 기술이 고도화되면서, 기존 스마트폰 중심의 환경을 넘어 다양한 형태의 AI 디바이스가 등장할 가능성이 높아졌다. 즉, AI의 활용 방식이 기존의 스마트폰 중심에서 벗어나 개인 맞춤형 AI 비서와 같은 형태로 진화할 수도 있다.
이제는 곧 누구나 자비스(J.A.R.V.I.S)를 가지는 시대가 열릴지도 모른다.
생성형 AI의 서비스
ChatGPT 말고 생성형 AI 서비스는 뭐가 있을까?
Cluade
Anthropic에서 개발한 AI 언어 모델이며, ChatGPT랑 유사하지만 개발 철학과 학습 방법에 있다
Claude는 안전하고 윤리적인 AI를 목표로 한다. 상대적으로 긴 문맥도 이해가 가능하며 대화를 이어서 학습한 다음 답변을 내놓기 때문에 비교적 논리적인 답변이 가능하다. ChatGPT보다 코딩을 못한다고 나오는데 GPT-4랑 비교했을때 개인적으로 Claude가 코딩을 더 잘했던거같다. 하지만, ChatGPT와의 쓰다보면 차이점이 있기 때문에 두개를 번갈아가면서 사용하는 것을 추천한다
Perplexity
자연어 예측 텍스트를 사용하여 질문에 답변하며, 2022년에 출시되었다. 실시간 웹 검색을 결합한 혁신적인 앤서 엔진이라고한다(Perplexilty 말로는)
무료버전은 OpenAI GPT 3.5 모델을 기반으로 한 자체 모델을 사용하고 Pro 버전은 GPT-4,Claude 3, Mistral Large 모델을 사용하고 있다. 좋은 점은 어떤 웹 페이지를 기반으로 이러한 결과를 도출했는지 보여주기 때문에 explainable하다는 점이다. 예전에 강의들을때 강사님께서 이거를 자주 사용하신다고 하셨다.또한, SK 에이닷 경우 이 모델을 기반으로 서비스를 제공하고 있다고 하는데 그만큼 성능이 좋다는 것 아닐까..? 써보지는 않았지만, 한번 써보고 추후에 후기를 남겨놓도록 하겠다
Midjourney
미드저니는 2022년에 개발된 인공지능 기반 이미지 생성 서비스이다. 사용자가 텍스트로 입력한 프롬프트를 바탕으로 예술적이고 고품질의 이미지를 자동으로 생성하는 서비스이다. 이 서비스는 디지털 콘텐츠 제작자, 마케터 등 다양한 분야에서 창의적인 작업을 지원하는 강력한 도구로 자리 잡았다고 한다. 미드저니를 써보지 않았지만 예전에 ChatGPT의 이미지생성 모델인 Dalle 3보다 더 고급진 이미지를 잘 만들어내는거 같다
Gamma
AI 기술을 활용하여 사용자가 손쉽게 프레젠테이션, 문제, 웹페이지등을 생성할 수 있도록 돕는 웹 기반 도구이다
단순히 프롬프트 하나로 ppt를 만드는게 신기한거같다. 전에는 자주 애용했었지만, 개인적으로 결국 틀을 다시 잡고 해야되는 번거로움이 생겨서 이제는 그냥 gpt로 내용을 수정해서 ppt를 만든다. 하지만 빠르게 간단한 Ppt를 만들고 싶다면 해당 ai 서비스를 추천한다
이번 글에서는 생성형 AI의 개념과 대표적인 서비스를 소개했다.
생성형 AI는 단순한 텍스트 생성에서 벗어나 이미지, 음성, 영상 등 멀티모달 데이터를 처리하는 방향으로 발전하고 있다. 또한, AI 하드웨어 디바이스와의 결합을 통해 우리가 AI를 활용하는 방식도 변화하고 있다.
이러한 변화를 두려워하기보다는, 하나씩 차근차근 배워 나가면서 AI 기술을 능동적으로 활용하는 것이 중요하다. 앞으로도 다양한 생성형 AI 기술을 직접 사용해보며 경험을 쌓아 나갈 예정이다.
'개발공부' 카테고리의 다른 글
크롤링(1)기본 구조와 HTML (0) | 2025.03.28 |
---|