HOME / ȸ»ç¼Ò°³ / ´ëÇ¥Àλ縻
 

 

¢ß¿öµå¿öÁî(Wordwords)´Â 10³â ÀÌ»ó ¡®Á¤º¸ °Ë»ö¡¯°ú ¡®ÀÚ¿¬¾î ó¸®(Natural Language Process)¡¯ ºÐ¾ß¿Í °ü·ÃµÈ ÀÛ¾÷µéÀ» Çб³¿Í field¿¡¼­ ¿¬±¸ °³¹ßÇØ¿Ô´ø ±¹¾îÇÐÀ» Àü°øÇÑ 1¸í°ú ÄÄÇ»ÅÍ °øÇÐÀ» Àü°øÇÑ 2¸íÀÇ °³¹ßÀÚµéÀÌ ¸¸µç ȸ»çÀÔ´Ï´Ù.

±× µ¿¾È ½ÇÁ¦ field¿¡¼­ Çб³¿¡¼­ üÇèÇÏ°í °æÇèÇÑ ÀÚ¿¬¾î 󸮿¡ ´ëÇØ ¿¬±¸ °³¹ßÀ» ÇØ¿À¸é¼­, ±× µ¿¾È¿¡ ºÐ¼® ´ë»ó ¹®¼­µéÀ» Á¤È®ÇÏ°Ô »ç¿ëÀÚÀÇ Àǵµ¿¡ ¸Â°Ô ºÐ¼®Çϰųª °¡°øÇϱ⿡ ¸¹Àº ¾î·Á¿òÀÌ ÀÖÀ½À» ´À³¢´Ù°¡, ÀÌ¿¡ ´ëÇÑ ºÒ¸¸µéÀ» ÀúÈñ ½º½º·Î ÇØ°áÇÏÀÚ´Â °Í¿¡ ÀDZâÅõÇÕÇÏ¿© ÇÔ²² ¢ß¿öµå¿öÁ ¼³¸³Çϰí, ¿¬±¸ °³¹ßÀ» ½ÃÀÛÇÏ°Ô µÇ¾ú½À´Ï´Ù.

¾î¼¸é ±× µ¿¾ÈÀÇ ÀÌÀüÀÇ ¾ð¾î 󸮸¦ ÇÏ´Â ¹æ½Ä¿¡¼­ Á¶±Ý ¹þ¾î³­ ¢ß¿öµå¿öÁî(Wordwords)¸¸ÀÇ °íÀ¯ÇÑ ¾ð¾î¿¡ ´ëÇØ ´Ù¸¥ ½Ã°¢À¸·Î Á¢±ÙÇÏ¿© ÀÏ¹Ý ¾ð¾îÀÇ Æ¯Â¡¿¡ ¸Â´Â ±×·¡¼­ º¸´Ù Á¤È®ÇÏ°Ô ¹®¼­µéÀ» ºÐ¼®ÇØ ³¾ ¼ö ÀÖ´Â ¹æ¾ÈµéÀ» ¿¬±¸ °³¹ßÇϰí ÀÖ½À´Ï´Ù.

ÀÌ¿¡ ¸ðµç ¾ð¾î·Î µÇ¾î ÀÖ´Â µ¥ÀÌÅÍÀÇ Ã³¸®¸¦ À§Çؼ­´Â ±× ±âº»ÀÌ µÇ´Â ÇüÅÂ¼Ò ºÐ¼®±âÀÎ moHANA(Hangul Morphological Analyzer)¸¦ °³¹ßÇÏ¿´°í, 2008³â 9¿ù¿¡ ƯÇã È®Á¤À» ¹ÞÀº °ÍÀ» °è±â·Î, À̸¦ ±âº»À¸·Î ÇÑ Ç°»ç ŰÅ(tagger)ÀÎ taHANA, »öÀξî(index) lexiconÀÎ inHANA, ¹®¼­ÀÇ ÀÇ¹Ì ºÐ¼®À» ÇØ ÁÖ´Â seHANA(Sentimental Hangul Analyzer) µîµî, HANA(Hangel Analyzer) Á¦Ç°±º µéÀÌ °³¹ß ¿Ï·áµÇ¾úÀ¸¸ç, ÀúÈñ Á¦Ç° °í°´ºÐµé²²¼­ ÀúÈñ ¾ð¾î󸮿¡ °ü·ÃµÈ ¹®Á¦µéÀ» °¡´ÉÇÑ »ç¿ëÀÚµéÀÌ º¸´Ù ½±°Ô ±×¸®°í Á÷Á¢ ÇØ°áÇÒ ¼ö ÀÖµµ·Ï, »çÀü ¹× ¹®¹ý ÀÛ¼º toolµéÀÎ dicHANAµéÀ» °³¹ßÇÏ¿´½À´Ï´Ù.

 

ÀÌ¿Í ÇÔ²² Á¦°øµÇ´Â ¢ß¿öµå¿öÁîÀÇ ±¸¼º¿øµéÀÌ ½×¾Æ¿Â Know-How ¹× ±â¼úÀÌ °í°´ ¿©·¯ºÐÀÇ ¼º°ø°ú ¹ßÀü¿¡ Ãʼ®ÀÌ µÇ¸®¶ó È®½ÅÇÕ´Ï´Ù. ¾Æ¹«ÂÉ·Ï ¿©·¯ºÐÀÇ ÇϽðíÀÚ ÇÏ´Â ÀÏ¿¡ ÀúÈñÀÇ ÀÌ·± ³ë·ÂÀÌ º¸ÅÆÀÌ µÇ±æ ¹Ù¶ó¸ç, ³ª¾Æ°¡ ±ä¹ÐÇÑ Çù·Â°ü°è°¡ ±¸ÃàµÉ ¼ö Àֱ⸦ ¹Ù¶ø´Ï´Ù.