现在的位置: 首页 > 综合 > 正文

格式化字符串——以C++的名义 (zt)

2013年10月07日 ⁄ 综合 ⁄ 共 3646字 ⁄ 字号 评论关闭

从第一堂C语言课上的那个printf开始,格式化字符串就成了我的梦魇。此后我还在很多地方遇到过它们:fprintf,sscanf以及CString的Format成员函数……。除了能记住%s(String的缩写)代表字符串,%d(Decimal的缩写)代表整数之外,每次用到格式化字符串的地方我都要求助于MSDN。

直到我看到C++的字符串格式化方式后,我决定从此抛弃C的那套格式化字符串的方法。

在C++里格式化字符串,用到的最多的类是:ostringstream以及它的宽字符版本wostringstream。

 

话不多说,如果要将一个整数n格式化成字符串以便输出之用

CString的方式是这样的:

CStringstr;

str.Format(_T("%d"), n);

ostringstream的方式:

ostringstreamost;

ost<<n;

string str = ost.str();

抛开效率不谈,起码不用再去记%d代表整数,%f代表浮点数,当然还有更复杂的格式控制输出的那些%(此处省略200字……)。

稍微复杂一点,如果要将整数以16进制的格式输出(这个恐怕是整数输出中最常用的功能了)

ostringstreamost;

ost<<hex<<showbase<<255;

 

把一个字节序列以16进制的方式输出,最常见的情况比如16进制的方式输出MAC地址:

ost<<hex<<setfill('0');

ost<<setw(2)<<(int)x;

一定是输出一个int,否则无效。

 

如果以16进制大写的格式输出:

ostringstreamost;

ost<<hex<<showbase<<uppercase<<255;

可有时候希望以32位整数的方式来输出的时候,在前面通常要补上多个0,这时可以这样做:

ostringstreamost;

// 也许有更好的写法

ost<<"0X"<<hex<<uppercase<<setw(8)<<setfill('0')<<255;

比起格式化字符串来输入的字母更多,但我觉得这种以人话写出来的方式比较好记:)

 

对于浮点数,最长用的格式化功能莫过于在小数点后保留X位的做法。

比如在小数点后保留6位:

ostringstreamost;

// 将输出1234.567800

ost<<fixed<<setprecision(6)<<1234.5678;

保留3位

// 将输出1234.568,已经替我们做好了四舍五入

ost<<fixed<<setprecision(3)<<1234.5678;

实现机制

   C++使用一种称为操控符的技术来控制格式化的输出。

 

经典的Hello World的C++版本大概是这样的:

std::cout<<"HelloWorld"<<endl;    这将在标准输出上输出Hello World后附带一个换行,并且刷新cout流。一个简单的endl包含了模板和运算符重载两个C++中极有分量的技术。

 

对endl的输出将引发下面这个重载了的<<运算符的调用(摘自VS2008的ostream文件):

_Myt& __CLR_OR_THIS_CALLoperator<<(_Myt& (__cdecl *_Pfn)(_Myt&))

   ...{    // call basic_ostreammanipulator

   _DEBUG_POINTER(_Pfn);

   return ((*_Pfn)(*this));

   }    而endl正好满足了这个重载的运算符的参数的格式:

_CRTIMP2_PURE inline basic_ostream<char,char_traits<char>>&

   __CLRCALL_OR_CDECL endl(basic_ostream<char,char_traits<char>>& _Ostr)

   ...{    // insert newline andflush byte stream

   _Ostr.put(' ');

   _Ostr.flush();

   return (_Ostr);

   }    这样:cout<<endl;就解释为在endl函数的内部对它的参数_Ostr,也就是cout输入一个换行符,然后刷新流。有点复杂吧:)

 

再来看个稍微复杂点的,看看语句ost<<setprecision(3)<<1234.5678;里的setprecision(3)到底是什么一个东东:

在iomanip.cpp里找到setprecision的函数定义:

_MRTIMP2 _Smanip<streamsize> __cdeclsetprecision(streamsizeprec)

   ...{    // manipulator to setprecision

   return (_Smanip<streamsize>(&spfun, prec));

   }    发现这个函数返回了一个_Smanip<streamsize>类型的对象。streamsize的类型是int,这里的prec肯定是传过来的3,那构造_Smanip<streamsize>对象时的另一个参数spfun是什么东西?

同样是在iomanip.cpp里,spfun函数定义如下:

static void__cdeclspfun(ios_base&iostr, streamsizeprec)

   ...{    // set precision

iostr.precision(prec);

   }        发现在这个函数的内部,对流iostr调用了precesion函数。

运算符<<有这样一个重载的版本:

template<class _Elem,

   class _Traits,

   class _Arg> inline

basic_ostream<_Elem, _Traits>&__CLRCALL_OR_CDECL operator<<(

basic_ostream<_Elem, _Traits>&_Ostr, const _Smanip<_Arg>& _Manip)

   ...{    // insert by callingfunction with output stream and argument

   (*_Manip._Pfun)(_Ostr, _Manip._Manarg);

   return (_Ostr);

   }    这样,第一个参数就是cout,而第二个参数就是setprecision函数返回的一个临时的_Smanip<streamsize>类型的对象。在<<运算符内部,如果(*_Manip._Pfun)(_Ostr,_Manip._Manarg);就是调用spfun函数并将cout和3传过去就好了!

    Go on!看看_Manip._Pfun到底是什么东西:

   // TEMPLATE STRUCT _Smanip

template<class _Arg>

struct _Smanip

   ...{    // store function pointerand argument value

   _Smanip(void (__cdecl *_Left)(ios_base&, _Arg), _Arg _Val)

       : _Pfun(_Left), _Manarg(_Val)

       ...{    // construct from functionpointer and argument value

       }

 

   void (__cdecl *_Pfun)(ios_base&, _Arg);    // the function pointer

   _Arg _Manarg;    // the argumentvalue

   };    既然当初在setprecision函数里,传递的是spfun,那么_Pfun就是spfun函数的指针啦。OK,大功告成!C++的表现力很强大吧!

 

虽然绕了这么大一个弯子只不过为了调用一下cout.precision(3),那为什么不这样写?

cout.precision(3);

cout<<1234.5678;

显然写成一条语句ost<<fixed<<setprecision(3)<<1234.5678;逻辑上更有意义

 

ostringstream使用时的一个小技巧:

当用ostringstream格式化完毕后,通过调用它的str成员函数可以得到格式化后的字符串:

ostringstreamost;

   // 格式化的工作

   ……

   string str = ost.str();

如果接下来要继续在这个流对象上进行其它的格式化工作,那么要先清空ostringstream的缓存,传递一个空字符串就好。

ost.str("");

 

这是个GUI盛行的年代,从标准输入显得已经不那么重要了,但是从文件读入依然是个很重要的操作,可我一直都是用WinAPI进行文件的读写的,以后也许会再写一片与格式化输入有关的文章。

抱歉!评论已关闭.