现在的位置: 首页 > 综合 > 正文

一点总结

2013年10月13日 ⁄ 综合 ⁄ 共 1391字 ⁄ 字号 评论关闭

工作定了,论文也交了。回家彻底休息了几天,人忙惯了,真不敢长时间啥都不干,担心自己以前的知识忘记了,担心自己落后了。我现在重新体会“活到老,学到老”这句话。并不表示好学,有时候是一种生存危机,是一种不甘落后的紧迫感,让你根本停不下来。你要不停的充实自己,然后才有立脚的依靠吧。废话少说了,总结一下从流体力学硕士毕业后,在这几年关于模式识别和机器学习的学习过程中的一些心得。

 

无论是计算机视觉、模式识别或者机器学习等都是想借助于计算机实现自动控制和识别等功能。可无论是什么任务和功能,基本上都是分类,这个分类包含classify and clustering。

 

和人眼分类一样,我们需要具有区别性的特征features。这就是feature selection的重要性了。以我个人体验,feature的选择对一个分类器和一类问题的解决起到了至关重要的作用。我论文中是做车辆运动轨迹聚类建模分析的,这其中不可避免涉及到计算机视觉的知识和图像处理的知识。首先从分类器的输入说起,输入是车辆轨迹,可用什么来表示轨迹呢?图像视频中,表征一个目标运动的特征有很多,首先有表征目标的位置、速度、颜色、大小等信息,运动信息当然包括位置和速度,甚至加速度这些信息。用来表征一个运动目标的运动信息的大多只用位置和速度(一般跟踪器),如果你用光流法,也有颜色信息。这个特征是简单的特征选择问题。可不同图像和视频的大小不一样,你说的位置和速度可能就不具有可比性了,即使同意视频,不同位置的目标的运动信息都不具有可比性。此时,你如何选择特征,如果对特征进行合理利用。这其中涉及到摄像机标定和clustering中相似度选择的问题。

 

因此,在我的论文中,我是充分体会到了特征的重要性。同时我在使用中,均对不同的算法进行了不同数据的测试和验证。文本数据和我的轨迹数据得到的效果会很不同,你说此时如果你不分析数据的特征属性,你找谁说理去啊?

 

这些是feature selection的问题。所以在我尝试了几种模型后,我是彻底认同了没有免费午餐的真理,无论是选择哪种模型,你都要明白你的特征和你模型的缺点优点等。你几乎永远无法找到一种万能的模型来解决所有问题。

 

另外一个问题就是模型的选择了。同样是clustering问题,不同的模型会给你不同的结果。但是,千万别以为有些模型就一定比别的模型好。有些模型可能在理论上是很好,很优秀,可你让它实际跑跑再说吧,说不定会出现什么样的结果呢。有些模型你以为能够解决了你的什么问题,可事实上当你用时,你会发现原来它同时带来了其它问题。所以,当我看到有不少人因为看到概率图模型这几年热,都来扎堆时,我就在想,是他们也和当年我一样,像个没头苍蝇一样到处乱撞,完全自己开江山在组里一个人做这个方向?还是他们的导师也喜欢扎堆?其实这个模型很新,但是水很深,我了解到不少网友,在很有基础的实验室,后来发现这个东西对处理他们的问题没多大作用,就没再开展了。而他们停下来时,却有很多不明就里的人开始扎堆。

 

所以,在这以后,我决定要对各种模型加以了解。我要了解他们的优缺点,这样在我解决实际问题时,我能像用人一样,用其所长避其所短。所以,再啰嗦几句,你还是要不停地充实自己,不断学习各种新知识,并且思考,带着问题去思考和寻找解决问题的办法。所以,套用孔圣人的一句话吧,学而不思则罔,思而不学则殆。

 

 

抱歉!评论已关闭.