现在的位置: 首页 > 综合 > 正文

ROC 曲线

2013年04月14日 ⁄ 综合 ⁄ 共 679字 ⁄ 字号 评论关闭

tt作为一个ML研究者如果你没听过 ROC curve 那你就不能称之为一个good student,^_^,开个玩笑。

假如用ROC来评价一个分类器最好不过了,什么准确率/召回率靠边站吧。

涉及到的到名词:TP/ FP   TN/FN  (突然意识到其实 true positive and false     true negative and false negative 只要是因为早期用在医疗上诊断良性与恶性,可能由此得名把)

                                TPR/FPR  (这个就不用说了把)

已FPR 为x轴  TPR为y轴 (为了使曲线在y=x上方 ,这样你看起来也比较方便对吧)划出roc曲线

当你的分类问题如果是以概率为临界值时,每选择一个一个临界值你就会得到一个分类结果(对应roc坐标中的一个点),当选择多个临界值的时候,你就会得到一系列的点。由此可以在roc坐标中划出一条曲线。这样就可以观察对于给定的临界值,你的FPR与TPR的关系。其实最理想的情况是你原本正确的都分对了,错误的当然也就同时都分对了。此点对对应的就是(0,1)。但实际问题并不完美,所以你需要根据roc曲线来确定你的最佳临界值。对于最佳临界值已有好多人研究过,可以google一大堆。基本上就是根据不同的需求得到不同的临界值。

骚年:抱着你小妾睡觉吧。(洗洗睡了,明天还要回家商量结婚,虽然没毕业,可年龄到了,为了让家中老父放下心头的石头,万事无阻,go++)

附上参考(比我说的明白多了,不过我为了自己印象深刻):http://zh.wikipedia.org/wiki/ROC%E6%9B%B2%E7%BA%BF

抱歉!评论已关闭.