_beginthreadex与CreateThread区别与联系

现在的位置: 首页 > 综合 > 正文

_beginthreadex与CreateThread区别与联系

2013年12月10日 ⁄ 综合 ⁄ 共 4686字 ⁄ 字号小中大 ⁄ 评论关闭

关于这两个函数的区别，可以参考《Windows 核心编程（第五版）》的第六章"线程基础"，这篇文章的思想多数来源于此，我只是作了一些整理。

线程对于初学者还说可能觉得很高深，这可以理解。对于某些有经验的程序员来说，可能觉得又太简单，我觉得如果认为线程很简单的人，都是没有理解线程，线程里面涉及的东西太多，包括内存，初始化，线程同步等。我打算以QA的形式来写这篇文章。

Q：为什么书上说要以_beginthreadex来替代CreateThread？

A：好了，一直用APICreateThread来创建线程的同志们要注意了，你可能会说我一直用这个API来创建线程，工作刚刚的，一点问题都没有。如果真是这样的话，我只能说是你运气太好了。在_beginthreadex的内部，它调用了CreateThread来创建线程，Windows始终用CreateThread来创建线程。在调用CreateThread之前，beginthreadex它做了很多初始化的工作，所以它比CreateThread创建的线程更加安全。

Q：为什么要用两个相同功能的函数来对待单线程和多线程序程序呢？

A：这里就有一定的历史原因了，标准C语言的库在是1970年左右发明的，而在那时候，线程的概念尚未出现在任何一个操作系统上。但是，线程毕竟是出现了，让我们来看看下面这个例子，来说明以前的CRT为什么不支持多线程：

BOOL fFailure = (system("NOTEPAD.EXE README.TXT") == -1);
      if (fFailure)
       {
            switch (errno)
              {
              case E2BIG:
                     // Argument list or environment too big       
                     break;
     
              case ENOENT: 
                     // Command interpreter cannot be found       
                     break;

               case ENOEXEC: 
                     // Command interpreter has bad format 
                     break;

               case ENOMEM: 
                     // Insufficient memory to run command
                     break;
              }
       }

假如代码是这种情况，当执行到"system"这个函数之后，if之前，操作系统把当时CPU时钟周期分配给另一个线程，而在另一个线程中正好使用了会设置errno（这是C语言的一个全局变量）的CRT函数，于是问题就出现了。

所以早期的CRT函数是没有考虑到多线程的，在多线程中还会出问题的CRT函数还有：strtok, _wcstok,strerror, _strerror, tmpnam, tmpfile, asctime, etc.为了保证C和C+多线程应用程序正常运行，必须创建一个数据结构，并使之与使用了C/C+运行库函数的每个线程相关联，然后在调用CRT函数时，那些函数必须知道去查找主调线程的数据块，从而避免影响到其他线程。

那么，当系统创建线程时，它怎么知道要分配这个数据块，又应该如何分配，它不知道，它也不知道你所调用的函数是否是线程安全，所以说，我们在创建新线程时，一定不要调用操作系统的CreateThread（WindowsAPI）函数，相反，我们始终应当调用CRT函数_beginthreadex，原型如下：

unsigned long _beginthreadex
                          (
                          void *security,
                          unsigned stack_size,
                          unsigned (*start_address)(void *),
                          void *arglist,
                          unsigned initflag, 
                          unsigned *thrdaddr
                          );

beginthreadex与CreateThread的对数列表是一样的，只是参数名与类型不同，因为CRT函数不应该依赖于Windows的数据类型，下面有一个宏，来将CreateThread函数替换成_beginthreadex:

typedef unsigned (__stdcall * PTHREAD_START) (void *);

#define chBEGINTHREADEX(psa, cbStack, pfnStartAddr, \ 
                          pvParam, fdwCreate, pdwThreadID) \
                          ((HANDLE) _beginthreadex( \
                          (void *) (psa), \
                           (unsigned) (cbStack), \
                          (PTHREAD_START) (pfnStartAddr),\
                           (void *) (pvParam),\
                           (unsigned) (fdwCreate), \
                          (unsigned *) (pdwThreadID)))

注意，_beginthreadex函数只存在于CRT库的多线程版本中，如果你的程序链接到一个CRT单线程版本中，那么程序在链接时就会报错，所以在用VS开发时，要注意这一点。

Q：为什么说_beginthreadex就要比CreateThread更好，你是怎么知道的？

A：由于Microsoft已经为CRT函数提供了源码，我们可以看到_beginthreadex到底比CreateThread多做了些什么事情，源码在ProgramFiles\Microsoft Visual Studio8\VC\crt\src\Threadex.c中，可以找到_beginthreadex的实现，这里是它的实现：

_beginthreadex的源码

_MCRTIMP uintptr_t __cdecl _beginthreadex (
        void *security,
        unsigned stacksize,
        unsigned (__CLR_OR_STD_CALL * initialcode) (void *),
        void * argument,
        unsigned createflag,
        unsigned *thrdaddr
       )

{
        _ptiddata ptd;                  
        uintptr_t thdl;                 
        unsigned long err = 0L;     
        unsigned dummyid;                  
        _VALIDATE_RETURN(initialcode != NULL, EINVAL, 0);    
        __set_flsgetvalue();

        if ( (ptd = (_ptiddata)_calloc_crt(1, sizeof(struct _tiddata))) == NULL )
                goto error_return;
     
        _initptd(ptd, _getptd()->ptlocinfo);

        ptd->_initaddr = (void *) initialcode;

        ptd->_initarg = argument;

        ptd->_thandle = (uintptr_t)(-1);

#if defined (_M_CEE) || defined (MRTDLL)

        if(!_getdomain(&(ptd->__initDomain)))
        {
            goto error_return;
        }

#endif  
     

        if ( thrdaddr == NULL )

                thrdaddr = &dummyid;
      
        if ( (thdl = (uintptr_t)

              CreateThread( (LPSECURITY_ATTRIBUTES)security,
                            stacksize,
                            _threadstartex,
                            (LPVOID)ptd,
                            createflag,
                            (LPDWORD)thrdaddr))
             == (uintptr_t)0 )
        {
                err = GetLastError();
                goto error_return;
        }
      
        return(thdl);
      
error_return:
       
        _free_crt(ptd);
     
        if ( err != 0L )
                _dosmaperr(err);
        return( (uintptr_t)0 );
}

我们要明确几点：

1）每个线程都有自己的专用的_tiddata内存块，它是从C/C++的堆是分配出来的。

2）传给_beginthreadex的线程处理函数地址（线程的回调函数地址）是存在_tiddata内存块中的。

3）_beginthreadex内部的确调用了CreateThread来创建线程，这（CreateThread）是操作系统创建线程的唯一方式。

4）退出线程时调用_endthreadex，它内部调用了APIExitThread，它会释放创建线程在堆上分配的内存_tiddata。

Q：我要怎么终止线程？

A：与_beginthreadex相对应的退出线程的函数是_endthreadex，CreateThread 对应ExitThread，一般情况下我们不要调用这两个函数来终止线程，最好是让线程走完它的线程处理函数，让它自生自灭。如果要调用的话，最好调用_endthreadex，但一般不推荐。

OK，目前为止你应该对谁更好些的问题有了深入的了解，但是为什么调用CreateThread的程序仍然可以经年累月的正常运行呢？当线程调用一个需要tiddata结构的CRT函数时（大多数CRT函数是线程安全的，并不需要该结构），首先CRT函数试图获取线程的数据块的地址（通过调用TlsGetValue），然后，如果返回NULL，说明调用线程没有相关联的tiddata块，那么CRT函数马上为调用线程分配并初始化一个tiddata块，并将该内存块关联到线程（通过TlsSetValue），这样，该CRT函数以及其他CRT函数都可以使用该线程的tiddata块了（此即所谓"前人栽树后人乘凉"了，^_）。

当然，如果说你的线程运行的时候一直没有问题是几乎不可能的。事实上，的确有一些问题需要说说。如果线程使用了CRT的signal函数，整个进程都会被中止，因为结构化异常处理体尚未准备好。同样，如果不调用_endthreadex来中止线程就会造成内存泄漏，如果使用_beginthreadex，当然会容易想到_endthreadex，但如果你习惯了使用CreateThread，是否还会想起_endthreadex，我表示极大的怀疑，而且CreateThread/_endthreadex的组合怎么看怎么让人别扭。
不要忘记开始的问题，接下来让我们再来看看效率问题。CRT库的多线程版本在某些函数里面放置了同步原语，比如malloc，为了保证堆不会被同时调用的malloc函数破坏，这不可避免地会对效率造成影响，C/C++的哲学我们不应忘记，"决不为自己没有用到的付出代价"，自然，我们无权要求单线程程序为多线程程序付出它们不该付出的代价，所以，开头的问题也有了答案。
上面所说的都是静态链接的CRT库，而CRT库的动态链接版本则被编写得更加通用，以便能够被任何运行的程序和DLL共享。正是基于这个原因，这个版本的库只存在多线程版本。因为CRT库是以DLL形式提供的，程序和DLL不需要包含CRT库的任何代码，自然尺寸也就更小。同时，如果Microsoft修正了CRT库DLL中的Bug，程序也就自然受益了。

总结

首先，如果你调用_beginthreadex，你会获得线程的句柄，句柄当然需要关闭，但_endthreadex并没有这么做。通常是调用_beginthreadex的线程（很可能是主线程）来调用CloseHandle关闭不再需要的新线程的句柄。其次，如果你使用CRT函数，你只需要使用_beginthreadex即可。如果不使用，那么你可以只使用CreateThread。同样，如果只有一个线程（主线程）使用CRT，你也可以使用CreateThread；如果新创建的线程不使用CRT，那么你也不需要_beginthreadex和多线程CRT。

【上篇】NND:Google AdSense推介将在中国停止
【下篇】WebKit中的设计模式(一),开篇

作者: impot

该日志由 impot 于10年前发表在综合分类下，最后更新于 2013年12月10日.
转载请注明: _beginthreadex与CreateThread区别与联系 | 学步园 +复制链接

抱歉!评论已关闭.

学步园

_beginthreadex与CreateThread区别与联系

总结

作者: impot

书签

最新文章New

本站推荐

返回首页