산업
업스테이지, 차세대 광학문자인식 모델 출시
    최현석 기자
    입력 2024.10.17 10:21
DP 기능설명 이미지
[업스테이지 제공]

(서울=연합뉴스) 최현석 기자 = 업스테이지는 정확하고 빠르게 문서를 분석해 대규모 언어 모델(LLM)로 처리할 수 있는 차세대 OCR(광학문자인식) 모델 '도큐먼트 파스(Document Parse)'를 출시했다고 17일 밝혔다.

이 모델은 OCR 기술에서 명확한 인식이 어려웠던 여러 열의 레이아웃이나 테이블 등을 포함한 복잡한 형태의 문서에서도 각 구조와 텍스트 정보를 정확히 분석해 데이터 자산화를 가능하게 한다고 회사가 설명했다. 어떤 형식의 문서도 HTML과 같은 구조화한 텍스트 형식으로 전환해 기업이나 기관에서 실제 LLM 활용 시 바로 적용할 수 있다.

업스테이지는 도큐먼트 파스를 통해 RAG(검색 증강 생성) 시스템 성능과 LLM의 응답 정확도를 결정하는 핵심 요소인 데이터 전처리 과정에서 정확성뿐만 아니라 속도와 사용성 측면에서도 가장 진보한 형태의 문서 처리 기술을 선보인 것이라고 강조했다.

또 문서 구조 분석 벤치마크인 DP-Bench(벤치) 테스트 결과 도큐먼트 파스가 레이아웃 및 테이블 구조, 콘텐츠 분석 등 정확성을 측정하는 모든 지표에서 AWS와 MS를 포함한 빅테크 5개 사의 관련 서비스에 비해 5% 이상 높은 점수를 받았다고 전했다.

도큐먼트 파스는 속도 면에서 1분에 100장을 처리해 같은 기준을 적용한 AWS Texttract(텍스트랙트)의 10배, LamaParse(라마파스)의 5배 성능을 보였다.

업스테이지 김성훈 대표는 "도큐먼트 파스는 각 기업이 가진 기존 문서를 가장 정확하게 자산화시켜 LLM을 실제 업무에 즉각 효율적으로 적용할 수 있도록 만드는 최적의 도구"라며 "다양한 비즈니스에서 활용돼 업무 혁신을 현실화할 것"이라고 말했다.

harrison@yna.co.kr

    #스테
    #파스
    #문서
    #이지
    #차세대
    #모델
    #출시
    #광학
    #인식
    #문자
이 기사, 어떠셨나요?
  • 기뻐요
  • 기뻐요
  • 0
  • 응원해요
  • 응원해요
  • 0
  • 실망이에요
  • 실망이에요
  • 0
  • 슬퍼요
  • 슬퍼요
  • 0
댓글
    최신순
    추천순
    답글순
등록된 댓글이 없습니다.
    0/500
산업 주요뉴스
  • 1
  • HS효성 더클래스, 앰버서더 이태훈 프로와 '고객 초청 골프 클래스' 성료
  • HS효성 더클래스, 앰버서더 이태훈 프로와 '고객 초청 골프 클래스' 성료
  • 2
  • 방통위, 대량문자 전송자격인증제 유예기간 1개월 연장
  • 방통위, 대량문자 전송자격인증제 유예기간 1개월 연장
  • 3
  • 대리운전 후 음주운전?…울주 CCTV관제센터에 포착·검거
  • 대리운전 후 음주운전?…울주 CCTV관제센터에 포착·검거
  • 4
  • [일지] 대한항공-아시아나 합병, 산은 결정부터 EU 승인까지
  • [일지] 대한항공-아시아나 합병, 산은 결정부터 EU 승인까지
  • 5
  • GTX-A 수서∼동탄 승객 일평균 1만4천명 육박…7개월간 80%↑
  • GTX-A 수서∼동탄 승객 일평균 1만4천명 육박…7개월간 80%↑
  • 6
  • 금호폴리켐, 에코바디스 ESG 평가 '플래티넘' 등급
  • 금호폴리켐, 에코바디스 ESG 평가 '플래티넘' 등급
  • 7
  • 롯데카드·홈플러스, MBK ‘인수 후 악몽’ 고려아연으로 이어지나
  • 롯데카드·홈플러스, MBK ‘인수 후 악몽’ 고려아연으로 이어지나
  • 8
  • '벼랑 끝' 롯데, 신동빈 내논 카드…CEO 21명 교체
  • '벼랑 끝' 롯데, 신동빈 내논 카드…CEO 21명 교체
  • 9
  • 중기중앙회-산업안전상생재단, '산업안전상생 컨퍼런스' 개최
  • 중기중앙회-산업안전상생재단, '산업안전상생 컨퍼런스' 개최
  • 10
  • 강원도, 재난 피해 소상공인 적극 지원…이자 지원만 37억원
  • 강원도, 재난 피해 소상공인 적극 지원…이자 지원만 37억원