HOME / 제품소개 / Package 제품군
 

Package 구성

1) moHANA ver 1.0 + inHANA + dicHANA ( 1 tag displayed)

2) moHANA ver 1.0 + inHANA + dicHANA ( No tag displayed)

 

제품설명

특허를 보유한 moHANA는 다음과 같은 기능과 특성이 있습니다.(출원번호 : 10-2007-0024439)

 

 분석의 정확성

가. 규칙에 의한 복합명사/ 복합용언 처리

 무한대로 만들어지는 명사/동사 결합형을 모두를 사전에서 처리하지 않고, 규칙화하여 처리하므로,

  사전 관리가 용이하다.

 형태소 분석을 가능한 최소의 단위로 분석하게 되므로 의미 자질(semantic feature) 추출이 용이하다.

     

나. 띄어쓰기 오류 어절 처리

  UCC성의 문서에서 빈번하게 발생하는 띄어쓰기 오류 수정을 위해, 이를 해결하기 위한 방법으로

   별도의 솔루션 없이 moHANA 내에서 띄어쓰기 오류를 해결할 수 있는 기능을 제공한다.

  띄어쓰기 오류인 어절도 형태소 분석이 가능하므로, 의미자질(semantic feature) 추출이 용이하다.

  

 구성의 유연성

 

가. 사전 태그들의 자유로운 확장

 사용자들의 목적에 맞게 품사 또는 태그를 자유로이 확장하거나 축소할 수 있도록 구성되어 있다.

 이들 tag들을 문서 분류, 의미 feature 추출 및 machine learling에 필요한 정보로서 활용 가능하다.

  

나. Tag Order

: N-best로 분석된 형태소 분석 결과 중에, 우선적으로 분석되어야 할 tag들을 지정할 수 있는 기능 제공.

  

사용자 의도 및 대상 데이터의 특성에 적합하도록 형태소 분석 결과 및 사전 customizing할 수 있는 tool.

 

가. User.DICT

 사용자들이 원하는 형태소를 직접 추가하여 사용자 사전을 튜닝 가능

 

나. Stopword.DICT

 사용자가 직접 불용어 처리 가능

 언어 표현뿐 아니라, 지정한 tag로 불용어 처리 가능

 

다. preAnalUser.DICT

 사용자에 필요한 적합하게 기분석될 어절들을 사용자가 처리 가능

 

라. index.DICT

 색인규칙 처리

 문서의 특성에 따라 사용자가 색인어 추출 형태를 정의해서 처리 가능

 

 색인어 추출기

 분석 데이터의 특성에 적절하게 형태소에 부여된 형태/통사/의미/화용적 자질(feature)를 가진 tag를

   이용하여 사용자의 요구대로 색인어 추출이 가능.

 

 색인규칙 처리를 문서의 특성에 따라 사용자가 색인어 추출 형태를 정의해서 처리할 수 있는 tool 제공      

 

Package 구성

moHANA ver 1.0 + seHANA ver 1.0 + dicHANA_SE

 

제품설명

특허를 보유한 seHANA는 다음과 같은 기능과 특성이 있습니다.(출원번호 : 10-2010-0061629)

 

문서의 성향 분석. (positive/ neutral/ negative) 제공

 문장 (sentence), 문단 (paragraph), 문서 (document) 단위로 분리하여 “positive/ neutral/ negative”

   분석 기능 제공

 문서에 대해서 문장분리, 토큰 분리, 정밀한 형태소 분석기 moHANA의 분석 결과, tag들, 명사구(Noun Phrase), 동사구(Verb Phrase) 등을 검토 수행.

   

Sentiment의 opinion weight 분석 제공

 positive/ neutral/ negative 의 성향을 수치화하여 제공

 

문서 내에 있는 중심문과 평가적 표현을 NLP 기술로 자동으로 추출하여 제공

 평가의 강도, 의미의 반전 등을 반영하여 평가값에 반영하며, 가장 적절한 평가적 표현 추출

 언어적 표현뿐만 아니라, 이모티콘 등과 같은 감성 표현 추출

 

P/N/NEU 문법 사전을 간편하고 쉽게 사용자가 customizing할 수 있는 tool 제공

 

P/N/NEU 문법 사전을 간편하고 쉽게 사용자가 customizing할 수 있는 tool 제공

 

Package 구성

moHANA ver 1.0 + doclHANA ver 1.0 + dicHANA_MO ver 1.0

 

제품설명

특허를 보유한 doclHANA는 다음과 같은 기능과 특성이 있습니다.(출원번호 : 10-2011-101055)

 

단순히 문서에 나타나는 형태소 또는 단어들의 빈도수와 이들 형태소들간의 관계를 찾아낼 뿐만 아니라,

형태소가 가지고 있는 의미적 자질(semantic feature)을 이용하여 문서의 의미적 특성을 찾아내고,

이를 이용하여 문서를 분류해 주는 100% 자동화된 시스템

 

가. 자동 문서 분류(Clustering)

 100% 자동으로 카테고리 분류 및 카테고리명 자동 부여

 선택된 카테고리의 문서를 재분류하면서 세부 속성, 즉 중심 키워드추출 가능

 

나. 신규 문서 분류 시스템

 새로이 들어오는 문서에 대한 카테고리를 자동으로 분류해 주는 시스템

 

다. doclHANA의 장점

 자동화 된 시스템

 비용 절감 의 효과

 

Package 구성

moHANA ver 1.0 + taHANA ver 1.0

 

제품설명

5차원 태그 사용

 기본적으로 moHANA에 있는 tag set 사용하여 보다 정확한 tag를 지정.

 

필요에 따른 차원 축소 가능

 사전 태그 변경 시, 변경이 거의 이루어지지 않는 1차원만 사용한다든지 하도록 설정 가능하다.

 

참조) package 제품 이외에 각각의 솔루션 별도 판매 가능

 

 

제품문의 : ihd@kwenc.kr