¢ß¿öµå¿öÁî(Wordwords)´Â 10³â
ÀÌ»ó ¡®Á¤º¸ °Ë»ö¡¯°ú
¡®ÀÚ¿¬¾î ó¸®(Natural
Language Process)¡¯
ºÐ¾ß¿Í °ü·ÃµÈ ÀÛ¾÷µéÀ»
Çб³¿Í field¿¡¼
¿¬±¸ °³¹ßÇØ¿Ô´ø
±¹¾îÇÐÀ» Àü°øÇÑ
1¸í°ú ÄÄÇ»ÅÍ °øÇÐÀ»
Àü°øÇÑ 2¸íÀÇ °³¹ßÀÚµéÀÌ
¸¸µç ȸ»çÀÔ´Ï´Ù.
±×
µ¿¾È ½ÇÁ¦ field¿¡¼
Çб³¿¡¼ üÇèÇϰí
°æÇèÇÑ ÀÚ¿¬¾î 󸮿¡
´ëÇØ ¿¬±¸ °³¹ßÀ»
ÇØ¿À¸é¼, ±× µ¿¾È¿¡
ºÐ¼® ´ë»ó ¹®¼µéÀ»
Á¤È®ÇÏ°Ô »ç¿ëÀÚÀÇ
Àǵµ¿¡ ¸Â°Ô ºÐ¼®Çϰųª
°¡°øÇϱ⿡ ¸¹Àº
¾î·Á¿òÀÌ ÀÖÀ½À»
´À³¢´Ù°¡, ÀÌ¿¡ ´ëÇÑ
ºÒ¸¸µéÀ» ÀúÈñ ½º½º·Î
ÇØ°áÇÏÀÚ´Â °Í¿¡
ÀDZâÅõÇÕÇÏ¿© ÇÔ²²
¢ß¿öµå¿öÁ ¼³¸³Çϰí,
¿¬±¸ °³¹ßÀ» ½ÃÀÛÇϰÔ
µÇ¾ú½À´Ï´Ù.
¾î¼¸é
±× µ¿¾ÈÀÇ ÀÌÀüÀÇ
¾ð¾î 󸮸¦ ÇÏ´Â
¹æ½Ä¿¡¼ Á¶±Ý ¹þ¾î³
¢ß¿öµå¿öÁî(Wordwords)¸¸ÀÇ
°íÀ¯ÇÑ ¾ð¾î¿¡ ´ëÇØ
´Ù¸¥ ½Ã°¢À¸·Î Á¢±ÙÇÏ¿©
ÀÏ¹Ý ¾ð¾îÀÇ Æ¯Â¡¿¡
¸Â´Â ±×·¡¼ º¸´Ù
Á¤È®ÇÏ°Ô ¹®¼µéÀ»
ºÐ¼®ÇØ ³¾ ¼ö ÀÖ´Â
¹æ¾ÈµéÀ» ¿¬±¸ °³¹ßÇϰí
ÀÖ½À´Ï´Ù.
ÀÌ¿¡
¸ðµç ¾ð¾î·Î µÇ¾î
ÀÖ´Â µ¥ÀÌÅÍÀÇ Ã³¸®¸¦
À§Çؼ´Â ±× ±âº»ÀÌ
µÇ´Â ÇüÅÂ¼Ò ºÐ¼®±âÀÎ
moHANA(Hangul Morphological
Analyzer)¸¦ °³¹ßÇÏ¿´°í,
2008³â 9¿ù¿¡ ƯÇã
È®Á¤À» ¹ÞÀº °ÍÀ»
°è±â·Î, À̸¦ ±âº»À¸·Î
ÇÑ Ç°»ç ŰÅ(tagger)ÀÎ
taHANA, »öÀξî(index)
lexiconÀÎ inHANA,
¹®¼ÀÇ ÀÇ¹Ì ºÐ¼®À»
ÇØ ÁÖ´Â seHANA(Sentimental
Hangul Analyzer)
µîµî, HANA(Hangel
Analyzer) Á¦Ç°±º
µéÀÌ °³¹ß ¿Ï·áµÇ¾úÀ¸¸ç,
ÀúÈñ Á¦Ç° °í°´ºÐµé²²¼
ÀúÈñ ¾ð¾î󸮿¡ °ü·ÃµÈ ¹®Á¦µéÀ» °¡´ÉÇÑ »ç¿ëÀÚµéÀÌ º¸´Ù ½±°Ô ±×¸®°í Á÷Á¢ ÇØ°áÇÒ ¼ö ÀÖµµ·Ï, »çÀü
¹× ¹®¹ý ÀÛ¼º toolµéÀÎ
dicHANAµéÀ» °³¹ßÇÏ¿´½À´Ï´Ù.
ÀÌ¿Í
ÇÔ²² Á¦°øµÇ´Â ¢ß¿öµå¿öÁîÀÇ
±¸¼º¿øµéÀÌ ½×¾Æ¿Â
Know-How ¹× ±â¼úÀÌ
°í°´ ¿©·¯ºÐÀÇ ¼º°ø°ú
¹ßÀü¿¡ Ãʼ®ÀÌ µÇ¸®¶ó
È®½ÅÇÕ´Ï´Ù. ¾Æ¹«ÂÉ·Ï
¿©·¯ºÐÀÇ ÇϽðíÀÚ
ÇÏ´Â ÀÏ¿¡ ÀúÈñÀÇ
ÀÌ·± ³ë·ÂÀÌ º¸ÅÆÀÌ
µÇ±æ ¹Ù¶ó¸ç, ³ª¾Æ°¡
±ä¹ÐÇÑ Çù·Â°ü°è°¡
±¸ÃàµÉ ¼ö Àֱ⸦
¹Ù¶ø´Ï´Ù.
|