<aside>
💬 목차
</aside>
📰 쉬운 기사 생성
개요
우리 프로젝트는 새벽 5시에 다양한 신문사의 RSS 피드를 수집하여 최신 기사들을 기반으로 쉽게 이해할 수 있는 기사로 번역하는 시스템을 구축하는 것을 목표로 합니다. 이를 위해 RAG, CSE(검색엔진), LangChain 기술을 활용합니다. 이 시스템은 최신 정보를 제공하면서도 사실 관계 오류와 맥락 이해의 한계를 개선하여 높은 품질의 공정한 정보를 제공하는 것을 목표로 합니다.
프로세스 요약
- 데이터 수집: 새벽 5시에 다양한 신문사의 RSS 피드를 수집합니다.
- 기사 번역: 수집된 최신 기사를 RAG, CSE, LangChain을 통해 쉽게 이해할 수 있는 기사로 번역합니다.
- 협업 필터링 추천 시스템: 프로세스 종료 후, 협업 필터링 추천 시스템을 통해 10가지로 세분화된 유형에 대한 선호도를 조사합니다. (현재는 스켈레톤 데이터로 구성되어 있음)
기술 상세
RAG(Recursively Augmented Generation)
RAG는 사용자 질문을 벡터 형태로 변환하고, 외부 지식 베이스에서 관련 정보를 검색하여 답변을 생성하는 기술입니다. 이를 통해 최신 정보와 정확한 사실 관계를 바탕으로 기사의 품질을 보장합니다.
도입 이유
- 사실 관계 오류와 맥락 이해의 한계를 개선하기 위해 도입
- 최신 정보와 정확한 사실 관계 필요
- 생성물의 품질과 공정성 보장 및 인간-AI 협업 방식 정립
- 생성 AI 기술의 혜택을 안전하고 효과적으로 제공하기 위한 방법 모색
프로세스
- 질문 인코딩: 사용자의 질문을 벡터 형태로 변환
- 지식 검색: 외부 지식 베이스(Wikipedia, 뉴스 기사 등)에서 관련 정보 검색
- 답변 생성: 검색된 지식을 이용해 답변 생성