생성형 ai 개발 아키테처

태그클라우드 이동

ai개발자과정 정보처리기사 정보처리기사 요약 AI개발자 오블완 생성형 ai 아키텍처 크롤링 정보처리기사 5과목 SQL 생성형 AI 라쏘회귀 경사하강법 볼록함수 인공지능 앙상블 알고리즘 그리드서치 엑스트라 트리 티스토리챌린지 정보처리기사 정리 회귀 알고리즘 pandas 프로그래머스 랜덤서치 생성형AI 마크다운 파이썬 소프트웨어 설계 정보처리기사 4과목 AI 릿지회귀

2023년 1월 1일

08:00 AM

Buffering ...

최근 글 👑

생성형 ai 개발 아키테처

2025. 7. 28. 15:21ㆍ개발공부/인공지능

728x90

급부상하는 LLM

초기 접근 방식의 한계

1950~60년대
- Symbolic(기호) 추론과 Rule 기반 시스템에 주로 의존
- 매우 취약하고 능력에 한계가 많음
1980년대
- Rule‑기반 프로그래밍으로는 인간 지능의 다양성과 견고함을 재현 불가를 인식
  - (Expert System: Prolog, LISP)
- 기계학습 기반 접근 등장 → 컴퓨터 비전·음성 인식 분야에서 일정 진전
- 그러나 AGI(인공 일반 지능) 달성 목표는 요원함

딥러닝의 부상

2000년대 초반
- 딥러닝 신경망(deep learning neural network) 등장 (Geoffrey Hinton 등, 2006년 제안)
2010년대
- 충분한 데이터와 컴퓨팅 파워를 갖춘 심층 신경망을 활용
- 이미지 분류·물체 인식, 컴퓨터 비전·음성 인식 등에서 놀라운 성과 달성

남은 과제 및 새로운 학습 기법

지도 학습의 한계
- 레이블이 달린 대규모 데이터셋 확보가 어려움
자가 지도 학습(Self‑Supervised Learning)
- 레이블 없이도 데이터 자체에서 특성을 학습
- 튼튼한 표현(embedding) 모델 구축 가능
Auto‑Regressive 학습
- 텍스트 시퀀스에서 “다음 단어 예측”을 통해 언어 모델 훈련

신경 언어 모델링의 발전

Neural Language Modeling 기법의 등장
자연어 처리(NLP)에 딥러닝을 활용할 수 있는 토대 마련

2013년: word2vec

Google에서 제안
비지도 학습 방식으로 레이블 없이 대량 텍스트 데이터를 학습
Shallow Neural Network를 이용한 효율적 단어 임베딩 학습
단점: 문맥 의존성 부족 (각 단어별로 고정된 벡터)

2018년: ELMo

University of Washington에서 제안
LSTM 기반으로 양방향 문맥(context)을 고려한 단어 표현 학습
문맥 따라 변하는 임베딩 제공

2018년 후반: BERT

Google 제안 (“Attention Is All You Need” 이론 기반)
Bidirectional Encoder Representations from Transformers
Masking 기반 언어 모델링
- 입력 문장에서 일부 토큰(masked token)을 가리고, 이를 예측하도록 학습
사전 학습(Pre‑training) + 파인튜닝(Fine‑tuning) 방식 도입
다양한 NLP 태스크에서 획기적 성능 향상

2020년 이후: 초거대 언어 모델(LLM)의 등장

GPT‑3 (OpenAI, 1750억 파라미터)
- Zero‑/Few‑Shot 학습 능력
- 모델 크기의 중요성 부각
이후 수천억 ~ 조 단위 파라미터 LLM 등장
- 예: PaLM (Google, 2022년 5400억 파라미터)

PLM에서 LLM으로의 전환: 질적 변화

LLM의 새로운 능력
- Few‑shot 학습, 시퀀스 연결, 지시사항 수행 등 소형 모델에서 불가능했던 기능을 수행
임계점 기반 성능 폭발
- 모델 규모가 일정 임계값을 넘으면 갑자기 나타나는 비선형적 성능 향상
- 단순한 점진적 확장으로 설명되지 않는 ‘임계 현상’
AI 패러다임의 전환
- 작은 문제 해결용 특화 시스템에서 ▶ 다재다능한 범용(General‑Purpose) 모델로 이동
파인튜닝 없이 범용성 발휘
- 별도 파인튜닝 없이도 다양한 문제를 놀랍도록 해결하는 범용 AI 시스템으로 기능

생성형 AI와 LLM의 차이

생성형 AI
- 텍스트, 이미지, 비디오 등 다양한 유형의 콘텐츠를 생성하는 AI 시스템을 포괄하는 더 넓은 개념
LLM (Large Language Model)
- 자연 언어 데이터를 처리하고 이해하도록 설계된 특정 범위의 딥러닝 모델
현재
- 두 개념 간의 실질적 차이는 거의 없음
관계
- 생성형 AI 애플리케이션은 LLM을 핵심으로 하는 통합 애플리케이션

생성형 AI 애플리케이션 유형

대화형 에이전트 및 챗봇
코드 완성형 프로그래밍 어시스턴트
언어 번역
텍스트 요약 및 생성

생성형 AI 애플리케이션 3계층

스택의 세 가지 주요 계층:

인프라 계층
모델 계층
애플리케이션 계층

1. 인프라 계층

생성형 AI 애플리케이션을 개발·학습·배포하기 위해 반드시 갖춰야 할 기본 데이터·컴퓨팅·도구 자원을 다룹니다.

1.1 데이터 저장 및 관리

훈련 데이터
- Petabyte 단위로 저장·관리·접근이 효율적이어야 함
- 분산 파일 시스템(예: Amazon S3, Google Cloud Storage) 활용
데이터 레이크 (Data Lake)
- 로그·이미지·텍스트 등 이질적 소스의 원천 데이터를 중앙에 집중 저장
- 수집 → 정리 → 처리 → 분석 파이프라인 구성
견고한 데이터 관리 플랫폼
- 대규모 학습 데이터로부터 안정적 이점을 얻기 위해 필수
- 버전 관리·메타데이터 관리·접근 제어 기능 포함

1.2 벡터 데이터베이스

임베딩 저장·검색
- LLM이 생성한 단어·문서 임베딩을 숫자 벡터로 저장
주요 제품
- Pinecone, Weaviate, Milvus, Chroma 등
기능
- 수십억 개 벡터 색인(Indexing) 및 효율적 유사도 검색(Cosine similarity)
- RAG(Retrieval‑Augmented Generation) 등 외부 벡터 DB와 연동

1.3 컴퓨팅 인프라

대규모 분산 연산 자원
- 수천~만 대 GPU/TPU 클러스터 또는 클라우드 인스턴스
- 예: GPT‑3 학습 시 10,000개 이상의 GPU, 총 3,640 petaflop/s·days
인프라 고려 사항
- 네트워크 대역폭, 스토리지 I/O, 전력 및 냉각 리소스
- 온프레미스 vs. 클라우드 선택(비용·유연성·운영 편의성)

2. 모델 계층

2‑1. 올바른 LLM 선택

모델 기능:
- Open vs. Closed, 제공하는 고유 기능 고려
계산 효율성:
- 선택한 LLM을 학습·배포할 때 필요한 컴퓨팅 자원 판단
문제 적합성:
- 해결하려는 과제와 도메인에 적합한 모델 판단 (예: 창의적 텍스트 생성용 GPT vs. T5 계열)

2‑2. LLM 파인튜닝

전이 학습(Transfer Learning)
- 한 작업에서 학습한 지식을 다른 작업에 재사용
추가 데이터 셋 활용
- 특화된 도메인·태스크를 위한 소규모 레이블 데이터로 미세 조정
성능 향상
- 파인튜닝을 통해 대화 시스템, 검색·QA 등 특정 영역에서 성능 개선
치명적 망각 방지
- Gradient Clipping, 특정 레이어만 선택적 파인튜닝으로 이전 지식 유지

2‑3. LLM 통합

데이터 변환(Data Wrangling)
- 애플리케이션 코드의 입력(텍스트·그 외 포맷)을 토크나이저/임베더블로 변환
모델 아키텍처 연결
- 입력 토큰에 self‑attention 등 각 요소 적용
- 다양한 구조(예: Mixture of Experts) 활용
확장 확산(Scalable Deployment)
- SGoME(Sparsely Gated Mixture of Experts) 같은 기술로 여러 전문가 모델 병렬화

3. 애플리케이션 계층

3‑1. 애플리케이션 개발 프레임워크

LangChain 등 LLM API 중심 프레임워크
- 여러 구성 요소(chain)를 연결해 최종 사용자 워크플로우 구성
- 1. 입력 템플릿 생성 → 2) LLM에 전달 → 3) 결과 파싱·처리 → 출력

3‑2. 자율 에이전트(Agents)

일반 에이전트
- 계산기, 파일 시스템, 웹 API 등 외부 도구(tool) 사용
자율 에이전트(Autonomous Agent)
- 목표 이해 → 계획 수립 → 단계별 실행 → 외부 도구·환경과 상호작용
- 예: AutoGPT, AgentGPT

3‑3. 애플리케이션 구축 & 운영

프레임워크 인터페이스 → LLM 기능 통합
비즈니스 로직 → 사용자 요청 처리, 후처리
운영 관리
- 인증·권한 관리, 보안, 모니터링, 개인정보 보호 등

728x90

'개발공부 > 인공지능' 카테고리의 다른 글

LSTM과 GRU (0)	2025.09.11
Flask (0)	2025.07.28
트리의 앙상블 (0)	2025.06.09
그리드서치와 랜덤서치 (0)	2025.06.09
교차검증 (0)	2025.06.09

관련글

댓글 0

티스토리툴바