TLD取经之路（3）– 始于足下–tldDemo.m tldInit.m

现在的位置: 首页 > 综合 > 正文

RSS

TLD取经之路（3）– 始于足下–tldDemo.m tldInit.m

2018年02月21日 ⁄ 综合 ⁄ 共 4571字 ⁄ 字号小中大 ⁄ 评论关闭

matlab版源程序：http://download.csdn.net/detail/cv_richie/4982673

C程序：http://download.csdn.net/detail/cv_richie/4982678

晚点我会把我注释的版本发上来。

程序运行从run_TLD.m或者run_TLD_demo.m开始，后者的功能更全，可以实现源代码作者主页上那些视频里的效果。

0. run_TLD_demo.m

程序启动的接口，这里可以设置DEMO程序的运行参数，结构体opt传递整个程序中的各种参量

.source 是图像的数据源，可以从摄像头读取图像('camera=1')和文件中读取图像序列('camera=0')，

.name 截图保存位置

初始化了全局变量tld，包括opt中的参数以及tld跟踪监测的各种数据都靠他传递。

==========================================================

1. tldDemo.m

程序运行的主题，相当于C中的MAIN函数

首先进行初始化

tldInitSource选择数据源

figure(2); set(2,'KeyPressFcn', @handleKey); 打开图像并初始化键盘输入的指针

tldInitFirstFrame 加载第一帧，加载初始框（就是检测目标框，选择摄像头用鼠标框定，选择文件读入则由文本文件中保存的信息载入）

tld = tldInit(opt,tld); %%关键！！ % train initial detector 初始化detector 里面内容很多，另起介绍

===========================================================

2. tldInit.m

function tld = tldInit(opt,tld)

lk(0);

if ~isempty(tld);
    handle = tld.handle;
    tld = opt;
    tld.handle = handle;
else
    tld = opt;
end


% INITIALIZE DETECTOR =====================================================

% Scanning grid 创建扫描网格 tld.grid保存网格坐标 tld.scales保存网格尺度
[tld.grid tld.scales] = bb_scan(tld.source.bb,size(tld.source.im0.input),tld.model.min_win); %6*所有不同尺度下的网格数 1-4行为坐标 5尺度标号 6尺度下的网格列数标号

% Features 
tld.nGrid     = size(tld.grid,2);   %tld.nGrid保存网格数量
tld.features  = tldGenerateFeatures(tld.model.num_trees,tld.model.num_features,0);  %初始化FERN中的pixel comparison特征对tld.featrue.x为52*10 tld.feature.type='forest'

% Initialize Detector
fern(0); % cleanup 清除FERN分类器
fern(1,tld.source.im0.input,tld.grid,tld.features,tld.scales); % allocate structures 初始化ensemble分类器

% Temporal structures
tld.tmp.conf = zeros(1,tld.nGrid);
tld.tmp.patt = zeros(tld.model.num_trees,tld.nGrid);  %10*网格数

% RESULTS =================================================================

% Initialize Trajectory   初始化轨迹信息空间
tld.img             =   cell(1,length(tld.source.idx));  %CELL生成的是元胞
tld.snapshot     =   cell(1,length(tld.source.idx));
tld.dt                =   cell(1,length(tld.source.idx));
tld.bb               =   nan(4,length(tld.source.idx));  %nan生成的是空数组
tld.conf            =   nan(1,length(tld.source.idx));
tld.valid            =   nan(1,length(tld.source.idx));
tld.size              =   nan(1,length(tld.source.idx));
tld.trackerfailure = nan(1,length(tld.source.idx));
tld.draw    = zeros(2,0);
tld.pts     = zeros(2,0);
% Fill first fields
tld.img{1}  = tld.source.im0;
tld.bb(:,1) = tld.source.bb;
tld.conf(1) = 1;
tld.valid(1)= 1;
tld.size(1) = 1;

% TRAIN DETECTOR ==========================================================

% Initialize structures
tld.imgsize = size(tld.source.im0.input);  %tld.imgsize保存图像大小
tld.X       = cell(1,length(tld.source.idx)); % training data for fern 训练ensemble的样本
tld.Y       = cell(1,length(tld.source.idx)); 
tld.pEx     = cell(1,length(tld.source.idx)); % training data for NN 训练最近邻的样本
tld.nEx     = cell(1,length(tld.source.idx));
overlap     = bb_overlap(tld.source.bb,tld.grid); % bottleneck 返回与bb与每个网格的重叠比

% Target (display only)
tld.target = img_patch(tld.img{1}.input,tld.bb(:,1));%分割出目标区域的图像

% Generate Positive Examples产生正样本
[pX,pEx,bbP] = tldGeneratePositiveData(tld,overlap,tld.img{1},tld.p_par_init); %PX输出前十网格的特征，每行是一个网格，10列是一层随机；pex最大网格归一化图像 bbp最大网格的坐标
pY = ones(1,size(pX,2));%正样本的正标号
% disp(['# P patterns: ' num2str(size(pX,2))]);
% disp(['# P patches : ' num2str(size(pEx,2))]);

% Correct initial bbox
tld.bb(:,1) = bbP(1:4,:);%最大重叠度的网格 程序中把制定框转化为重叠度最大的网格

% Variance threshold
tld.var = var(pEx(:,1))/2; %方差分类器阈值为最大重叠度网格方差的的一半
% disp(['Variance : ' num2str(tld.var)]);

% Generate Negative Examples
[nX,nEx] = tldGenerateNegativeData(tld,overlap,tld.img{1});%重叠度小于0.2的网格中产生
% disp(['# N patterns: ' num2str(size(nX,2))]);
% disp(['# N patches : ' num2str(size(nEx,2))]);

% Split Negative Data to Training set and Validation set
[nX1,nX2,nEx1,nEx2] = tldSplitNegativeData(nX,nEx);%负样本随机平均分为两组
nY1  = zeros(1,size(nX1,2));%负样本的负标号

% Generate Apriori Negative Examples
%[anX,anEx] = tldGenerateAprioriData(tld);
%anY = zeros(1,size(anX,2));
% disp(['# apriori N patterns: ' num2str(size(anX,2))]);
% disp(['# apriori N patches : ' num2str(size(anEx,2))]);

tld.pEx{1}  = pEx; % save positive patches for later
tld.nEx{1}  = nEx; % save negative patches for later
tld.X{1}    = [pX nX1]; 
tld.Y{1}    = [pY nY1]; 
idx         = randperm(size(tld.X{1},2));
tld.X{1}    = tld.X{1}(:,idx);%随机化后的初始样本集
tld.Y{1}    = tld.Y{1}(:,idx);%随机化后的初始标号集

% Train using training set ------------------------------------------------

% Fern
bootstrap = 2;
fern(2,tld.X{1},tld.Y{1},tld.model.thr_fern,bootstrap);  %thr_fern为0.5训练初始随机厥分类器

% Nearest Neightbour 

tld.pex = [];
tld.nex = [];

tld = tldTrainNN(pEx,nEx1,tld);%训练初始NN分类器
tld.model.num_init = size(tld.pex,2);%训练后的正样本数

% Estimate thresholds on validation set  ----------------------------------

% Fern
conf_fern = fern(3,nX2);%输出为输入样本的分类结果即正样本可信度,可信度越高,分类效果不好,需要更新
tld.model.thr_fern = max(max(conf_fern)/tld.model.num_trees,tld.model.thr_fern);%该阈值影响后面的学习,越大则需要更新的样本越多

% Nearest neighbor
conf_nn = tldNN(nEx2,tld);
tld.model.thr_nn = max(tld.model.thr_nn,max(conf_nn));%该阈值越大，则需要被添加的模型正样本越多
tld.model.thr_nn_valid = max(tld.model.thr_nn_valid,tld.model.thr_nn);%跟踪时用到的有效性阈值

【上篇】TLD取经之路（4）– 始于足下–tldInit.m中涉及到的相关函数
【下篇】TLD取经之路（1）–VS2008,MATLB2010B与OPENCV2.2

作者: beggar

该日志由 beggar 于6年前发表在综合分类下，最后更新于 2018年02月21日.
转载请注明: TLD取经之路（3）– 始于足下–tldDemo.m tldInit.m | 学步园 +复制链接

抱歉!评论已关闭.

学步园

TLD取经之路（3）– 始于足下–tldDemo.m tldInit.m

作者: beggar

书签

最新文章New

本站推荐

返回首页