Q.
"RAG (검색 증강 생성 Retrieval-Augmented Generation)"이 중요한 이유!!
실시간 최신 정보와 지식의 흐름을 인공지능의 답변으로 녹여낼 수 있는 방법은 현재 "RAG (검색 증강 생성 Retrieval-Augmented Generation)"를 활용하는 방법이라고 하는데요.
- Microsoft Azure AI Search + OpenAI Service
Azure Cognitive Search로 내부 문서를 인덱싱·검색하고, OpenAI 모델과 결합해 RAG 구조를 구현할 수 있습니다.
- AWS Kendra + Bedrock
Kendra는 기업 문서 검색에 특화된 서비스이고, Bedrock은 LLM을 제공해 RAG 파이프라인을 쉽게 구성할 수 있습니다.
- Google Vertex AI + Generative AI App Builder
Google Cloud의 벡터 검색과 LLM을 결합해 RAG 기반 애플리케이션을 만들 수 있습니다.
- OpenAI API + 벡터 DB (Pinecone, Weaviate 등)
OpenAI 모델에 검색된 문서를 주입하는 방식으로 RAG를 구현합니다.
기업 내부의 실시간 변화되는 데이터를 RAG 기능으로 활용하거나, 그에 더하여 외부 검색의 경우도, 빅테크가 제공하는 검색·인덱싱 서비스를 검색 API로 활용하여 복합적으로 활용할 수 있다고 하는데요. 이 경우 상당히 복잡한 작업이 개발자들과 함께 이루어져야 한다고 합니다.
인공지능(AI)를 활용하여 새롭게 추가되거나 삭제 및 변형 되는 데이터나 검색 자료 등을 "오류(할루시네이션)"를 최대한 줄이면서 AI 추론적 전문성을 최대한 끌어올릴 수 있는 방법으로 RAG가 활용되는 것이 글로벌 기업들이나 한국의 유수 기업들도 활용하고 있는 경우가 많다고 합니다.
물론 소규모 스타트업들은 오픈소스 프레임워크(LangChain, Haystack으로 자체 구축)을 하는 경우도 있다고 하는데요.
지속적으로 변화되는 유동적 데이터 관리와 인공지능을 함께 활용하기 위한 이러한 노력들을 실제 활용하는 기업과 그렇지 못한 기업들 간의 차이는 과연 어떻게 나타날 수 있을까요?
자사 기업의 데이터 변동과, 세상의 실시간 정보와 지식 및 다양한 소식들을 오류율을 최대한 줄이면서 인공지능과 접목하여 최대한 효율적으로 활용하기 위한 이러한 노력들이 앞으로 어떤 세상을 만들어갈 수 있을 것이며, 그것을 활용하지 못하는 기업들에게는 어떤 어려움이 전개될 수 있을까요?