Products

  • KOMORAN

  • KOMORAN – Java 기반의 한국어 형태소 분석기

    소개

    KOMORAN은 Shineware의 기술로만 연구 및 개발된 한국어 형태소 분석기로서 Java Library 형태(jar)로 제공됩니다. KOMORAN 3.0은 기존 KOMORAN 2.0 대비 속도, 정확도가 개선되었으며 타 형태소 분석기와 달리 여러 어절을 하나의 품사로 분석 가능함으로써 형태소 분석기의 적용 분야에 따라 공백이 포함된 고유명사(영화 제목, 음식점명, 노래 제목, 전문 용어 등)를 더 정확하게 분석할 수 있습니다.

    특징

    Pure Java
    100% Java로만 개발되었기 때문에 자바가 설치된 환경이라면 어디서든지 사용 가능합니다.
    외부 라이브러리 독립적
    자체 제작한 Library들만을 사용하여 외부 Library와의 의존성 문제가 없습니다.
    경량화
    자소 단위 처리, TRIE 사전 등으로 약 50MB 메모리 상에서도 동작 가능합니다.
    Easy to Use
    Library 적용 후 소스 코드 내 1줄만 추가하여 형태소 분석기를 사용할 수 있습니다.
    사전 관리 용이
    일반 텍스트 파일의 형태로 구성되어 가독성이 높으며 바로 편집이 가능합니다.
    새로운 분석 결과
    타 형태소 분석기와 달리 공백이 포함된 형태소 단위로 분석이 가능합니다.

    License

    Apache License 2.0

    Download

    Source Code
    shineware/komoran-3.0 @ Github
    Star Fork Download

    KOMORAN Demo

    분석을 원하시는 문장을 입력하시고 모델을 선택하시면 KOMORAN의 형태소 분석 결과를 보실 수 있습니다.
    (예. ‘밀리언 달러 베이비랑 바람과 함께 사라지다랑 뭐가 더 재밌었어?’ 등)




    Full 버전 (Wikipedia 적용)
    Light 버전 (일반)


    분석 결과가 여기에 나타납니다.

    서버 부하가 생길 경우 IP가 차단 당할 수 있으니, 체험용으로만 사용해주시고 다량의 시험이 필요하신 경우에는 저희에게 연락주세요.