HOME / 제품소개 / HANA 제품군
 

 

  moHANA : morphology analyzer

특허(출원번호 : 10-2007-0024439)

다차원 해석 사전을 기반으로 한 한국어 형태소 분석기

태그정보 사전- 기존 형태소 해석기의 일차원적인 품사 정보와 달리 어류 태그정보, 형태적 정보, 통사적 정보, 의미적 정보 및 화용 정보의 5 차원 벡터 정보로 작성된다.

어휘 사전 - 어휘와 그 어휘가 가질 수 있는 태그정보를 우선 순위에 기반하여 순서열로 가진다.

문법 사전 - 특수 문법 연산자를 이용하여 태그정보 사전에 정의된 각각의 태그가 연결 가능한지 여부를 규정하는 문법이 구축되어 있다. 형태소가 가지는 태그정보를 다차원으로 정의하고 이에 따른 문법 규칙의 표현을 통해 보다 자세한 형태소 분석 및 새로운 형태소 태그의 삽입과 삭제의 용이함을 얻을 수 있다.

 

  dicHANA : dictionary managing tool

사용자들이 직접 HANA 제품군의 사전을 커스터마이징(customizing) 할 수 있는 솔루션

사용자들이 원하는 품사 또는 태그(tag)를 10개까지 추가하여 사전을 커스터마이징(customizing) 할 수 있다.

 

  inHANA : Indexer lexicon

형태소 분석한 결과를 사용자의 목적에 따라 색인어를 추출하고 색인어 형태를 가공할 수 있는 솔루션

 

  taHANA : 품사 태거

 문서의 특성에 따라 형태소들에 정확한 태그(tag)를 지정해 주는 솔루션

 

  seHANA : sentiment analyzer.

특허(출원번호 : 10-2010-0061629)

문서들의 의미적인 분석을 해 주는 솔루션.

이 중에 "P/N Classifier"는 분석 대상 문서의 감성적인 부분을 분류해 내어, 대상 문서의 내용이"긍정(positive)"인가 "부정(negative)"를 분류해 주는 솔류션이다.

모든 문서가 "긍/부정"의 의미를 가지지 않으므로, "긍정"도 "부정"도 아닌 "중립(Neutral)"적인 의미를 가진 문서도 분류해 낸다.

 

  doclHANA : Document clustering Analysis

특허(출원번호 : 10-2011-101055)

단순히 문서에 나타나는 형태소 또는 단어들의 빈도수와 이들 형태소들 간의 관계를 찾아낼 뿐만 아니라, 형태소가 가지고 있는 의미적 자질(semantic feature)을 이용하여 문서의 의미적 특성을 찾아내고, 이를 이용하여 100% 자동으로 카테고리 분류 및 카테고리명을 부여할 뿐만 아니라, 중심 키워드 추출해 주는 솔루션

또한 새로이 들어오는 신규 문서에 대해서도 카테고리에 자동으로 적절한 카테고리를 찾아주는 기능도 있다.

이 제품은 정형화된 문서뿐만 아니라, UCC성 문서들과 같이 비정형화된 문서들을 정형화해주어 정보로서 가치 있는 결과 도출 가능하므로, 특히 빅데이터를 활용하는 기반을 마련한 제품이다.

 

  worHANA : 핵심 키워드 추출기

특허(출원번호 : 10-2011-101055)

 

  개발 예정 제품군

paHAHA : parser

graHAHA : grammar checker

spaHANA : space checker

speHANA : speller

 

HANA 제품군의 저작물은

특허법과 컴퓨터프로그램보호법에 의하여 저작권을 보호받고  있습니다.

 

 

제품문의 : ihd@kwenc.kr