- Agentic OCR 방식으로 비정형 문서 대응력과 운영 효율 동시 강화

사이냅소프트가 시각 언어 모델(VLM)과 AI 에이전트 기술을 결합한 차세대 OCR 솔루션 ‘사이냅 OCR IX’를 출시하며, 비정형 문서 중심의 도큐먼트 AI 전환(AX)을 본격화한다.
사이냅 OCR IX는 기존 정형 서식 중심 OCR의 한계를 넘어, 문서 유형과 처리 조건에 따라 최적의 인식 엔진을 자동 선택하는 ‘Agentic OCR’ 개념을 적용한 것이 특징이다. TTA 인증 기준 한글 인식률 99.3%를 유지하면서도 비정형 문서 대응력과 환각 방지 기술을 동시에 확보했다.
AI 에이전트가 엔진을 선택하는 Agentic OCR 구조
사이냅 OCR IX의 핵심은 AI 에이전트가 문서 유형과 처리량을 분석해 VLM, KVT(Key Value Trainer), FormMaker 중 가장 적합한 엔진을 자동으로 선택하는 구조다. 이를 통해 도입 초기부터 운영 단계까지 성능과 비용 효율을 함께 최적화할 수 있다.
VLM은 사전 학습 없이 신규 양식을 즉시 처리할 수 있어 도입 기간을 크게 단축하며, 비정형 문서에서도 문맥을 이해해 필요한 정보를 정확히 추출한다. 여기에 기존 사이냅 OCR의 텍스트 인식 기술을 결합해 VLM 단독 사용 시 발생할 수 있는 환각 현상과 오인식을 최소화했다.
데이터 축적 후 KVT 전환, 표준 서식은 초고속 처리
운영 과정에서 데이터가 충분히 축적되면 KVT로 전환해 처리 속도를 높이고 운영 비용을 절감할 수 있다. 주민등록증, 운전면허증 등 표준화된 서식은 FormMaker를 활용해 초고속 처리가 가능하다.
이 같은 다중 엔진 전략을 통해 사이냅 OCR IX는 세금계산서, 거래명세서, 견적서 등 비정형 비즈니스 문서부터 각종 표준 서식까지 폭넓게 대응하는 실질적인 도큐먼트 AI 솔루션을 완성했다.
사이냅소프트 전경헌 대표는 “사이냅 OCR IX는 25년간 축적한 문서 처리 기술에 AI 에이전트 개념을 결합해 도입부터 운영까지 최적의 성능을 제공하는 솔루션”이라며 “200건 이상의 구축 실적으로 입증된 인식 정확도에 VLM의 유연성을 더해, 기업 업무 환경에 가장 최적화된 도큐먼트 AI 모델을 구현했다”고 밝혔다.
#사이냅소프트 #사이냅OCRIX #OCR #AgenticOCR #도큐먼트AI #문서AI #AI에이전트 #비정형문서 #기업AI #업무자동화