现在的位置: 首页 > 综合 > 正文

学习C的可变参数

2013年11月25日 ⁄ 综合 ⁄ 共 2938字 ⁄ 字号 评论关闭

1 使用:
一直以来习惯了使用printf函数,但是对于可变参数没有深入研究过,觉得可变参数是一个神奇的技术^0^。。。
工作闲下来的时候,想研究研究看可变参数的使用和原理。
目前C提供的可变参数的申明为
void function(const char *format, ...);
这样就可以在function中使用可变参数
C提供了几个宏用于使用可变参数
va_list
va_start
va_arg
va_end
其中
va_list用于定义一个变量获取可变参数指针
va_start用于将va_list定义的指针进行初始化
va_arg用于获取对应指针的真实类型数据
va_end用于清空va_list定义的指针

好了,光说不练假把式,来一个例子吧。嗯,什么样的例子比较好呢?
对了,在c的printf中不支持c++的std::string,就自己实现一个支持std::string的printf吧。
例子:

void Puts(const char *pstr)
{
    while(*pstr)
        putchar(*pstr++);
}

// Printf函数支持可变类型为
// %c->char
// %d->int
// %s->char*
// %S->std::string
// Bug:不支持'"'等转义符
//      处理%%等出现问题
void Printf(const char *_Format, )
{
    va_list arg_ptr;
    va_start(arg_ptr,_Format);
    const char *pWork = _Format;
    while(*pWork != '"0')
    {
        if(pWork == _Format)
        {
            if(*pWork != '%')
                putchar(*pWork);
        }
        else
        {
            if(*(pWork-1) == '%')
            {
                switch(*pWork)
                {
                case 'c':
                    {
                        char cvalue = va_arg(arg_ptr,char);
                        putchar(cvalue);
                        break;
                    }
                case 'd':
                    {
                        int ivalue = va_arg(arg_ptr,int);
                        char buffer[32];
                        _itoa(ivalue, buffer, 10);
                        Puts(buffer);
                        break;
                    }
                case 's':
                    {
                        char* psvalue = va_arg(arg_ptr,char*);
                        Puts(psvalue);
                        break;
                    }
                case 'S':
                    {
                        std::string pstringvalue = va_arg(arg_ptr,std::string);
                        Puts(pstringvalue.c_str());
                        break;
                    }
                default:
                    putchar('%');
                    putchar(*pWork);
                }
            }
            else if(*pWork != '%')
            {
                putchar(*pWork);
            }
        }
        pWork++;
    }
    va_end(arg_ptr);
}


调用代码:

std::string s = "abc";
Printf("%cyPrint %cunction %s:%d, Support C++ std::string %Sversion %d",'M','F',"Version",1, s, 2);


输出结果为:
MyPrint Function Version:1, Support C++ std::string abc...version 2

可变参数真是神奇的很啊。。。

2 原理:
我们来看看这几个宏到底干了什么
typedef char *  va_list;  // 这个仅仅是个重定义而已。。。

// 获取v的地址
#define _ADDRESSOF(v)   ( &(v) )  
// n的整数字节的大小,必须是sizeof(int)的整数倍。如sizeof(n)为5的话,_INTSIZEOF(n)为8(假设为32位机器的话)
#define _INTSIZEOF(n)   ( (sizeof(n) + sizeof(int) - 1) & ~(sizeof(int) - 1) )
// 给v的地址加上v的大小  
#define va_start(ap,v)  ( ap = (va_list)_ADDRESSOF(v) + _INTSIZEOF(v) )

// 给ap自增t的大小,并且获取原有ap的地址的数据,强制转型为t类型
// 这个相当于 ( *(t *)ap )
//            (ap += _INTSIZEOF(t))
// 这一个宏相当于完成两件事情
#define va_arg(ap,t)    ( *(t *)((ap += _INTSIZEOF(t)) - _INTSIZEOF(t)) )

// 给ap置0
#define va_end(ap)      ( ap = (va_list)0 )

我们有必要了解一下C函数的调用规则了,在调用一个函数之前,调用方会将这个函数参数push(修改ESP指针),并且push规则是先push最后一个参数,最后push第一个参数,因此ESP指针最后应该是指向第一个参数。可变参数就是利用了这一点,一旦获取到第一个参数的地址后,就能够通过地址向前查找所有的参数。(注意:x86上的堆栈是反向的,push会使ESP的值减少,而不是增加)
上面的宏就是帮助用户查找所有的可变参数。

问题:
printf以及Printf都不是类型安全的。调用方必须保证参数个数的正确,以及参数类型的正确,否则将会发生不可预期的错误。

3 探索
是否可以写一个没有固定参数的函数,比如
int f (...);
据ANSI C说不行,但是我的vc8可行。
问题是写出这样的函数,va_start就用不上了,因为它需要可变参之前的那个固定参数。
其实我们可以自己从ESP中获取相关参数。
例子:

// 获取第一个参数值的指针
// 函数在访问的过程中最重要的事情就是要确保堆栈的平衡,而在win32(vc8)的环境下保持平衡的办法是这样的:
// 1.让EBP保存ESP的值;
// push    ebp
// mov ebp, esp
// 2.在结束的时候调用
// mov esp,ebp
// pop ebp
// retn
// 下面这个宏将ebp(原esp)中的指针+8放入ap中
// 注意:给ebp加8是因为中间隔着一个ebp和一个函数返回地址
#define va_start_get_first_parameter(ap) \
    __asm mov eax, ebp \
    __asm add eax, 8 \
    __asm mov ap,eax


void NoFirstParameterPrintf()
{
    va_list arg_ptr;
    va_start_get_first_parameter(arg_ptr);

    int first = va_arg(arg_ptr,int);
    int second = va_arg(arg_ptr,int);
    int third = va_arg(arg_ptr,int);
    printf("First=%d"nSecond=%d"nThird=%d"n",first,second,third);
    
    va_end(arg_ptr);
}


调用代码:

NoFirstParameterPrintf(3, 5, 7);


输出结果:
First=3
Second=5
Third=7

这样完全是可以获取第一个参数的地址的。问题是,由于没有类型信息和类型个数等信息(类似于printf中的%c等信息),所以这样的例子貌似意义不是很大。

【上篇】
【下篇】

抱歉!评论已关闭.