现在的位置: 首页 > 综合 > 正文

编译与链接

2014年11月19日 ⁄ 综合 ⁄ 共 6082字 ⁄ 字号 评论关闭

预处理器-编译器-汇编器-链接器

预处理器会处理相关的预处理指令,一般是以"#"开头的指令。如:#include "xx.h" #define等。

编译器把对应的*.cpp翻译成*.s文件(汇编语言);

汇编器则处理*.s生成对应的*.o文件(obj目标文件);

最后链接器把所有的*.o文件链接成一个可执行文件(?.exe)。

 

1.部件:

首先要知道部件(可以暂且狭义地理解为一个类)一般分为头文件(我喜欢称为接口,如:*.h)及实现文件(如:*.cpp)。

一般头文件会是放一些用来作声明的东东作为接口而存在的,而实现文件主要是实现的具体代码。

 

2.编译单个文件:

记住IDE在bulid文件时只编译实现文件(如*.cpp)来产生obj,在vc下你可以对某个?.cpp按下ctrl+f7单独编译它生成对应一个?.obj文件。在编译?.cpp时IDE会在?.cpp中按顺序处理用#include包括进来的头文件(如果该头文件中又#include有文件,同样会按顺序跟进处理各个头文件,如此递归。)

 

3.内部链接与外部链接:

内、外链接是比较基础的东东,但是也是新手最容易错的地方,所以这里有必要详细讨论一下。

内部链接(static)产生的符号只在本地?.obj中可见,而外部链接(extern)的符号是所有*.obj之间可见的。如:用inline的是内部链接,在文件头中直接声明的变量、不带inline的全局函数都是外部链接。

在文件头中类的内部声明的函数(不带函数体)是外部链接,而带函数体一般会是内部链接(因为IDE会尽量把它作为内联函数)。

认识内部链接与外部链接有什么作用呢?下面用vc6举个例子:

  1. // a.h  
  2. void Foo( ){ }  
  3. // t1.cpp  
  4. #include "a.h"  
  5. void Test1(){ Foo(); }  
  6. // t2.cpp  
  7. #include "a.h"  
  8. void Test2(){ Foo(); }  
  9. // main.cpp  
  10. int main(){ return 0; }  

好,用vc生成一个空的console程序(File - new - projects - win32 console application),并关掉预编译选项开关(projectàsettingàC/C++(Cagegory:Precompiled Headers)àNot using precompiled headers)。

(1)打开t1.cpp,按ctrl+f7编译生成t1.obj通过。

Compiling...

t1.cpp

 

t1.obj - 0 error(s), 0 warning(s)

(2)打开t2.cpp按ctrl+f7编译生成t2.obj通过。

Compiling...

t2.cpp

 

t2.obj - 0 error(s), 0 warning(s)

(3)按F7build链接时会发现:

Linking...

t2.obj : error LNK2005: "void __cdecl Foo(void)" (?Foo@@YAXXZ) already defined in t1.obj

Debug/main.exe : fatal error LNK1169: one or more multiply defined symbols found

Error executing link.exe.

 

main.exe - 2 error(s), 0 warning(s)

这是因为:

1.编译t1.cpp在处理到#include "a.h"中的Foo时看到的Foo函数原型定义是外部链接的,所以在t1.obj中记录Foo符号是外部的。

2.编译t2.cpp在处理到#include "a.h"中的Foo时看到的Foo函数原型定义是外部链接的,所以在t2.obj中记录Foo符号是外部的。

3.最后在链接 t1.obj及 t2.obj时, vc发现有两处地方(t1.obj和t2.obj中)定义了相同的外部符号(注意:是定义,外部符号可以多处声明但不可多处定义,因为外部符号是全局可见的,假设这时有t3.cpp声明用到了这个符号就不知道应该调用t1.obj中的还是t2.obj中的了),所以会报错。

解决的办法有几种:

a.将a.h中的定义改写为声明,而用另一个文件a.cpp来存放函数体。(提示:把上述程序改来试试)(函数体放在其它任何一个cpp中如t1.cpp也可以,不过良好的习惯是用对应cpp文件来存放)。

这时包括a.h的文件除了a.obj中有函数体代码外,其它包括a.h的cpp生成的obj文件都只有对应的符号而没有函数体,如t1.obj、t2.obj就只有符号,当最后链接时IDE会把

a.obj的Foo()函数体链接进exe文件中,并把t1.obj、t2.obj中的Foo符号转换成对应在函数体exe文件中的地址。

另外:当变量放在a.h中会变成全局变量的定义,如何让它变为声明呢?

例如:我们在a.h中加入:class CFoo{};CFoo* obj;

这时按f7进行build时出现:

Linking...

t2.obj : error LNK2005: "class CFoo * obj" (?obj@@3PAVCFoo@@A) already defined in t1.obj

一个好办法就是在a.cpp中定义此变量CFoo* obj,然后拷贝此定义到a.h文件中并在前面加上extern:extern CFoo* obj,如此就可通过了。当然extern也可以在任何调用此变量的位置之前声明,不过强烈建议不要这么作,因为到处作用extern,会导致接口不统一。良好的习惯是接口一般就放到对应的头文件。

b.将a.h中的定义修改成内部链接,即加上inline关键字,这时每个t1.obj和t2.obj都存放有一份Foo函数体,但它们不是外部符号,所以不会被别的obj文件引用到,故不存在冲突。(提示:把上述程序改来试试)

在上述代码中的a.h的void Foo()前添加inline修饰符,作个实验来验证“vc是把是否是外部符号的标志记录在obj文件中的”(有点绕口)。

(2)选t1.cpp按ctrl+f7单独编译,并把编译后的t1.obj修改成t1.obj_inline。

(3)选t2.cpp按ctrl+f7单独编译,并把编译后的t2.obj修改成t2.obj_inline

(4)把除了t1.obj_inline及t2.obj_inline外的其它编译生成的文件删除。

(5)修改a.h内容为:void Foo( ){ },使之变为非内联函数作测试

(6) rebuild all所有文件。这时提示:

Linking...

t2.obj : error LNK2005: "void __cdecl Foo(void)" (?Foo@@YAXXZ) already defined in t1.obj

Debug/cle.exe : fatal error LNK1169: one or more multiply defined symbols found

(7)好,看看工程目录下的debug目录中会看到新生成的obj文件。

下面我们来手工链接看看,

打开菜单中的project - setting - Link,拷贝Project options下的所有内容,如下:

kernel32.lib user32.lib gdi32.lib winspool.lib comdlg32.lib advapi32.lib shell32.lib ole32.lib oleaut32.lib uuid.lib odbc32.lib odbccp32.lib kernel32.lib user32.lib gdi32.lib winspool.lib comdlg32.lib advapi32.lib shell32.lib ole32.lib oleaut32.lib uuid.lib
odbc32.lib odbccp32.lib /nologo /subsystem:console /incremental:yes /pdb:"Debug/cle.pdb" /debug /machine:I386 /out:"Debug/cle.exe" /pdbtype:sept

把它修改成:

Link.exe kernel32.lib user32.lib gdi32.lib winspool.lib comdlg32.lib advapi32.lib shell32.lib ole32.lib oleaut32.lib uuid.lib odbc32.lib odbccp32.lib kernel32.lib user32.lib gdi32.lib winspool.lib comdlg32.lib advapi32.lib shell32.lib ole32.lib
oleaut32.lib uuid.lib odbc32.lib odbccp32.lib /nologo /subsystem:console /incremental:yes /pdb:"Debug/cle.pdb" /debug /machine:I386 /out:"Debug/cle.exe" /pdbtype:sept Debug/t1.obj Debug/t2.obj Debug/main.obj

Pause

注意前面多了Link.exe,后面多了Debug/t1.obj Debug/t2.obj Debug/main.obj以及最后一个pause批处理命令,然后把它另存到工程目录(此目录下会看到debug目录)下起名为link.bat,运行它,就会看到:

t2.obj : error LNK2005: "void __cdecl Foo(void)" (?Foo@@YAXXZ) already defined in t1.obj

Debug/cle.exe : fatal error LNK1169: one or more multiply defined symbols found

很好,我们链接原来的obj文件得到的效果跟在vc中用rebuild all出来的效果一样。那么现在如果我们把备份出来的t1.obj_inline覆盖t1.obj而t2.obj_inline覆盖t2.obj再手动链接应该会是不会出错的,因为原t1.obj_inline及t2.obj_inline中存放的是内部链接符号。好,运行Link.bat,果然不出所料,链接成功了,看看debug目录下多出了一个exe文件。这就说明了内或外符号在obj有标志标识!(提示:上述为什么不用vc的F7(build)链接呢,因为文件时间改变了,build会重新生成新的obj,所以我们用手动链接保证obj不变)【注obj信息可用dumpbin.exe查看】

 

4.#include规则:

有很多人不知道#include文件该放在何处?

1).增强部件自身的完整性:

为了保证部件完整,部件的cpp实现文件(如test.cpp)中第一个#include的应当是它自身对应的头文件(如test.h)。

(除非你用预编译头文件,预编译头必须放在第一个)。这样就保证了该部件头文件(test.h)所必须依赖的其它接口(如a.h等)要放到它对应的文件头中(test.h),而不是在cpp中(test.cpp)把所依赖的其它头文件(a.h等)移到其自身对应的头文件(test.h等)之前(因为这样强迫其它包括此部件的头文件(test.h)的文件(b.cpp)也必须再写一遍include(即b.cpp若要#include "test.h"也必须#include "a.h")”。另外我们一般会尽量减少文件头之间的依赖关系,看下面:

2).减少部件之间的依赖性

在1的基础上尽量把#include到的文件放在cpp中包括。

这就要求我们一般不要在头文件中直接引用其它变量的实现,而是把此引用搬到实现文件中。

例如:

  1. // foo.h  
  2. class CFoo{  
  3.     void Foo(){}  
  4. };  
  5.   
  6. // test.h  
  7. #include "foo.h"  
  8. class CTest{  
  9.     CFoo* m_pFoo;  
  10. public:  
  11.     CTest() : m_pFoo(NULL){}  
  12.     void Test(){ if(m_pFoo){ m_pFoo->Foo();} }  
  13.     // ...........  
  14. };  
  15.   
  16. // test.cpp  
  17. #include "test.h"  
  18. // .....  

 

如上文件test.h中我们其实可以#include "foo.h"移到test.cpp文件中。因为CFoo* m_pFoo我们只想在部件CTest中用到,而将来想用到CTest部件而包括test.h的其它部件没有必要见到foo.h接口,所以我们用前向声明修改原文件如下:

  1. // foo.h  
  2. class CFoo{  
  3. public:  
  4.     void Foo(){}  
  5. };  
  6. // test.h  
  7. class CFoo; // 引用性声明  
  8. class CTest{  
  9.     CFoo* m_pFoo;  
  10. public:  
  11.     CTest();  
  12.     void Test();  
  13.     //........  
  14. };  
  15. // test.cpp  
  16. #include "test.h" // 这里第一个放该部件自身对应的接口头文件  
  17. #include "foo.h" // 该部件用到了foo.h  
  18. CTest::CTest() : m_pFoo(0){   
  19.     m_pFoo = new CFoo;   
  20. }  
  21. void CTest::Test(){   
  22.     if(m_pFoo){   
  23.         m_pFoo->Foo();  
  24.     }  
  25. }  
  26. // main.cpp  
  27. #include "test.h" // 这里我们就不用见到#include "foo.h"了  
  28. CTest test;  
  29. void main(){  
  30.     test.Test();  
  31. }  

3).双重包含卫哨:

在文件头中包括其它头文件时(如:#include "xx.h")建议也加上包含卫哨:

  1. // test.h文件内容:  
  2. #ifndef __XX1_H_  
  3. #include "xx1.h"  
  4. #endif  
  5. #ifndef __XX2_H_  
  6. #include "xx2.h"  
  7. #endif  
  8. // ......  

虽然我们已经在xx.h文件中开头已经加过,但是因为编译器在打开#include文件也是需要时间的,如果在外部加上包含卫哨,对于很大的工程可以节省更多的编译时间。

 

5.待续(还有很多相关的东东,比如不同dll工程之间符号导出问题等等,有空再写)。

【上篇】
【下篇】

抱歉!评论已关闭.