KOMORAN @ Shineware

KOMORAN – Java 기반의 한국어 형태소 분석기

소개

KOMORAN은 Shineware의 기술로만 연구 및 개발된 한국어 형태소 분석기로서 Java Library 형태(jar)로 제공됩니다. KOMORAN 3.0은 기존 KOMORAN 2.0 대비 속도, 정확도가 개선되었으며 타 형태소 분석기와 달리 여러 어절을 하나의 품사로 분석 가능함으로써 형태소 분석기의 적용 분야에 따라 공백이 포함된 고유명사(영화 제목, 음식점명, 노래 제목, 전문 용어 등)를 더 정확하게 분석할 수 있습니다.

특징

Pure Java: 100% Java로만 개발되었기 때문에 자바가 설치된 환경이라면 어디서든지 사용 가능합니다.
외부 라이브러리 독립적: 자체 제작한 Library들만을 사용하여 외부 Library와의 의존성 문제가 없습니다.
경량화: 자소 단위 처리, TRIE 사전 등으로 약 50MB 메모리 상에서도 동작 가능합니다.
Easy to Use: Library 적용 후 소스 코드 내 1줄만 추가하여 형태소 분석기를 사용할 수 있습니다.
사전 관리 용이: 일반 텍스트 파일의 형태로 구성되어 가독성이 높으며 바로 편집이 가능합니다.
새로운 분석 결과: 타 형태소 분석기와 달리 공백이 포함된 형태소 단위로 분석이 가능합니다.

Source Code: shineware/komoran-3.0 @ Github; Star Fork Download

KOMORAN Demo

분석을 원하시는 문장을 입력하시고 모델을 선택하시면 KOMORAN의 형태소 분석 결과를 보실 수 있습니다.
(예. ‘밀리언 달러 베이비랑 바람과 함께 사라지다랑 뭐가 더 재밌었어?’ 등)

입력 문장

적용 모델

Full 버전 (Wikipedia 적용)
Light 버전 (일반)

분석 결과

분석 결과가 여기에 나타납니다.

서버 부하가 생길 경우 IP가 차단 당할 수 있으니, 체험용으로만 사용해주시고 다량의 시험이 필요하신 경우에는 저희에게 연락주세요.

Products

KOMORAN – Java 기반의 한국어 형태소 분석기

소개

특징

License

Download

KOMORAN Demo

입력 문장

적용 모델

분석 결과