现在的位置: 首页 > 综合 > 正文

情感分析(Sentiment Analysis)的难题

2013年12月03日 ⁄ 综合 ⁄ 共 618字 ⁄ 字号 评论关闭

我们对在线文本进行文本挖掘的任务之一,就是进 行情感分析(SentimentAnalysis),即分析发贴人对某个对象的态度是正面还是负面。这个过程当然不是仅仅查找"好","坏"这些关键字那 么简单,有时候相似度很高的句子,却反映了截然不同的态度,譬如下面这两句话

"这瓶洗发水,适合头发很干的人用"
"用了这瓶洗发水,头发变得很干"

两个句子中的主要成分都差不多,"洗发水","头发","很干",但是第一句是褒义,第二句则很可能是贬义。对于后一句的处理还算简单,告诉计算机 程序头发"很干"不好,因此让头发"变得""很干"的洗发水,也就不是好的洗发水。而前一句呢,我们能够理解"适合头发很干的人用"是指使用该洗发水后, 能让头发变得不那么干燥点。但是假设我们告诉计算机,"某某产品适合XXX的人用"就是指用了某某产品后,XXX的人就会变得不那么XXX,那么当计算机 处理"这件衣服,适合漂亮女生穿",你猜它会怎么理解?(漂亮的女生穿了就会变得不那么漂亮)

还有一类问题是讽刺(反话)和幽默,国外的一个自然语言处理专家也在他的blog上感叹道,"Humor is hard"。在国内,很多褒义词受到论坛文化的影响,往贬义词发展的趋势,例如"我太崇拜你了","你太有才了"。

说到底,这些都是自然语言处理面对的一个挑战,即如何将生活经验、文化传统等表达为一种可以被计算机理解和利用的形式。

写到这儿,我同事的电脑刚刚蓝了一次屏,他跟我说,"这电脑也太稳定了吧"。

 

抱歉!评论已关闭.