1. 의미 분석 에이전트 (Semantic Intelligence Agent)

다중 문장 분해 및 하이브리드 RAG 기반 핵심 의미(Claim/Entity) 자동 추출 파이프라인

분석 대상 (Input)

  • 비정형 텍스트: 뉴스 기사, SNS 게시물, 커뮤니티 리뷰
  • 사전 지식: 브랜드, 제품, 정책 등 도메인 개체 정보
  • 근거 DB: 팩트체크용 공식 가이드라인 및 문서
Semantic Core Logic
Step 1
복합 의미 분해 및 인식
  • 다중 문장 분해(Multi-Sentence Decomposition)를 통해 긴 본문에서 복합적인 의미를 개별 단위로 분리
  • Transformer 모델을 활용하여 약어, 변형, 신조어, 오타 패턴까지 문맥 기반으로 정확히 인식
[분해 예시] 입력: "A사 신제품 배터리 광탈이고 발열도 심함 ㅉㅉ"
결과: [주장1: 배터리 소모 빠름], [주장2: 발열 현상 존재] 분리
Step 2
핵심 Claim 및 Entity 추출
  • 문장 내에서 브랜드, 제품명, 정책, 주요 이슈 등 도메인 특화 개체(Entity)를 자동으로 식별
  • 단순 키워드를 넘어 화자가 말하고자 하는 '핵심 주장(Claim)'과 '주요 토픽(Topic)'을 구조화하여 추출
[추출 예시] 분석: "A사 B모델 가격 인상 논란"
결과: [Entity: A사, B모델], [Claim: 가격이 인상되었다] 추출
Step 3
Hybrid RAG 기반 근거 매칭
  • 추출된 주장(Claim)의 사실 여부를 검증하기 위해 내부 공식 문서/DB와 자동 매칭 시도
  • Vector 검색과 키워드 검색을 결합한 Hybrid RAG 기술을 적용하고 최적의 문서로 자동 재정렬(Re-ranking)
[매칭 예시] 주장: "C브랜드 성분에서 발암물질 검출"
결과: 공식 성분 분석표 및 안전성 검사 결과 문서 자동 매칭 및 반박 근거 도출
구조화된 지식 데이터
  • 의미와 근거가 결합된 Feature
  • 감성/토픽 및 위험 탐지 에이전트로 전송
단순 의견 (무관)
  • 주장이나 Entity가 없는 일상 대화
  • 통계 데이터베이스 적재 후 분석 제외

표면적 키워드 분석의 한계 극복

단순히 특정 단어가 몇 번 언급되었는지를 세는 것이 아니라, 신조어나 오타가 섞인 복잡한 문장에서 진짜 '의미'와 '주장'을 추출하여 분석 데이터의 차원을 높입니다.

파편화된 정보의 구조화 및 자산화

비정형 텍스트 속에 흩어져 있는 브랜드명, 제품명, 이슈 등 도메인 특화 개체(Entity)를 자동으로 식별하고 연결하여, 추후 다양한 관점의 딥다이브 분석을 가능하게 합니다.

팩트체크 및 반박 논리 자동화의 초석

온라인상에 퍼지는 수많은 주장에 대해 기업이 보유한 공식 문서(지식 베이스)를 자동으로 매칭(Hybrid RAG)함으로써, 허위 정보에 대한 즉각적이고 논리적인 대응 체계를 마련합니다.