2007年8月30日星期四

gcc中格式化输出函数的研究

来源:http://www.linuxaid.com.cn/articles/3/1/311618806.shtml

By 书生


1.前言

  在gcc编程中,我们比较经常用到的字符格式化输出函数是printf的,实际上gcc继承了c语言处理字符具有强大功能的风格,它提供了一系列的格式化输出函数,主要存在两个库函数文件stdio.h/ stdarg.h中,具体函数如下:

#include
  printf, int printf(const char *format, ...);
  fprintf, int fprintf(FILE *stream, const char *format, ...);
  sprintf, int sprintf(char *str, const char *format, ...);
  snprintf, int snprintf(char *str, size_t size, const char *format, ...);

  #include
  vprintf, vprintf(const char *format, va_list ap);
  vfprintf, vfprintf(FILE *stream, const char *format, va_list ap);
  vsprintf, int vsprintf(char *str, const char *format, va_list ap);

  其中:

  printf和vprintf函数主要是向一个标准输出设备或标准的字符流输出格式化后的字符。

  Fprintf和vfprintf 函数主要是向一个给定的字符流设备输出格式化后的字符。

  而sprintf, snprintf, vsprintf 和vsnprintf函数则是将格式化后的结果赋值给一个字符串。

  虽然函数的功能上有差异,返回的值的类型也不尽相同,但是在建立匹配格式的语法上还是相同的,这几个函数都有一些共同特征,就是你要设计好模板和格式化的字串。这些函数格式化字符串的命令主要是通过模板字符串中跟在“%”后面的字符来控制的。

  如下一个例子中:

int pct = 37;
  char filename[] = "foo.txt";
  printf ("Processing of `%s' is %d%% finished.Please be patient.",filename, pct);

  显然,这个例子的打印结果就是如下:

Processing of `foo.txt' is 37% finished.Please be patient.

  如上例子我们可以看出一般格式化函数的语法特点就是包含格式化匹配的字符串,输出的字串和变量组合的结构。

2.参数详细介绍

  由于大部分函数在如何格式化字串部分的语法非常相似,我们先研究他们的共同特点,然后再应用不同的例子来分析其不同特点:此类函数一般的调用格式为:printf("<格式化字符串>", <参量表>);

   其中格式化字符串包括两部分内容: 一部分是正常字符, 这些字符将按原样输出; 另一部分是格式化规定字符, 以"%"开始, 后跟一个或几个规定字符,用来确定输出内容格式。参量表是需要输出的一系列参数, 其个数必须与格式化字符串所说明的输出参数个数一样多, 各参数之间用","分开, 且顺序一一对应, 否则将会出现意想不到的错误。

2.1 Gcc提供的格式化规定符如下:

  • %d
  • 十进制有符号整数

  • %i
  • 十进制有符号整数

    注:上面这两个函数在格式化输出时用途是相同的,但在输入时却是不一样的,%i可以接受任何形式的整数,而%d却不能。

  • %u
  • 十进制无符号整数

  • %f
  • 输出浮点数

  • %s
  • 输出字符串

  • %c
  • 输出单个字符

  • %p
  • 输出指针的值

  • %e %E
  • 指数形式的浮点数 ,其中:%e是以小写形式输出的 %E是以大写形式输出的

  • %x, %X
  • 无符号以十六进制表示的整数,其中:%x是以小写形式输出的 %X是以大写形式输出的

  • `%g', `%G'
  • 根据输出数据的大小需要决定用普通形式还是指数形式的输出方式,其中: %g是以小写形式输出的 %G是以大写形式输出的

  • %o
  • 无符号以八进制表示的整数

  • `%c
  • '输出单个字符

  • %n
  • 得到输出字符的个数,但是本参数不产生任何的输出效果。

  • `%m'
  • 输出错误时的相应的字符串提示。

  • `%%'
  • 输出正文字符中的“%”字符

  说明:

  1. 可 以在"%"和字母之间插进数字表示最大场宽。例如: %3d 表示输出3位整型数, 不够3位右对齐。%9.2f 表示输出场宽为9的浮点数, 其中小数位为2, 整数位为6,小数点占一位, 不够9位右对齐。%8s 表示输出8个字符的字符串, 不够8个字符右对齐。如果字符串的长度、或整型数位数超过说明的场宽, 将按其实际长度输出。但对浮点数, 若整数部分位数超过了说明的整数位宽度, 将按实际整数位输出;若小数部分位数超过了说明的小数位宽度, 则按说明的宽度以四舍五入输出。另外, 若想在输出值前加一些0, 就应在场宽项前加个0。例如: %04d 表示在输出一个小于4位的数值时, 将在前面补0使其总宽度为4位。如果用浮点数表示字符或整型量的输出格式, 小数点后的数字代表最大宽度,小数点前的数字代表最小宽度。
  2. 例如: %6.9s 表示显示一个长度不小于6且不大于9的字符串。若大于9, 则第9个字符以后的内容将被删除。

  3. 可以在"%"和字母之间加小写字母l, 表示输出的是长型数。
  4. 例如: %ld 表示输出long整数%lf 表示输出double浮点数

  5. 可以控制输出左对齐或右对齐, 即在"%"和字母之间加入一个"-" 号可
  6. 说明输出为左对齐, 否则为右对齐。例如: %-7d 表示输出7位整数左对齐%-10s表示输出10个字符左对齐

2.2 一些特殊规定字符

  • 换行
  • f 清屏并换页
  • 回车
  • Tab符
  • xhh 表示一个ASCII码用16进表示,其中hh是1到2个16进制数

3.格式化转换的具体细则

3.1 整数转换部分

   整数转换部分主要是'%d', '%i', '%o', '%u', '%x', 和 '%X'这几个参数命令的,由于参数的不同,可以输出不同格式的结果。如上表所列: '%d', '%i'是输出一个带符号的十进制的数,'%o', '%u', and '%x'是输出一个不带符号的数,而'%X是'%x''的大写形式。其中,针对这几种不同输出选择还有如下几个参数项:

  • '-’ 表示是左对齐,一般都是右对齐的。
  • '+’ 是对'%d', '%i'两个参数而言的,是指以'+’符号表示正数
  • ' ' 是对'%d', '%i'两个参数而言的,如果输出不是以'+’'-’开头的,那么用空格做开头。
  • '#' 是对'%o'参数而言的,将在输出的结果强制加上'0’为开头。
  • ''' 将输出的数字以LC_NUMERIC的分类法用’,’隔开。
  • '0' 将空格的地方用'0'填入。

  如果没有特别指明,被格式化的参数被默认当作整数处理,或者可以用以下的类型指定参数来进行修改,如下:

  • 'h' 指定传入参数是 short int 或unsigned short int类型的
  • 'l' 指定传入参数是 long int或unsigned long int类型的
  • 'q' 指定传入参数是 long long int类型的
  • 'Z' 指定传入参数是size_t.。

  为了方便理解给出一个例子:

  1. 对于如下的格式化匹配字串:
  2. "|%5d|%-5d|%+5d|%+-5d|% 5d|%05d|%5.0d|%5.2d|%d|"

    将产生类似如下的输出:

    | 0|0 | +0|+0 | 0|00000| | 00|0|
    | 1|1 | +1|+1 | 1|00001| 1| 01|1|
    | -1|-1 | -1|-1 | -1|-0001| -1| -01|-1|
    |100000|100000|+100000| 100000|100000|100000|100000|100000|
  3. 对于如下的格式化匹配字串:
  4. "|%5u|%5o|%5x|%5X|%#5o|%#5x|%#5X|%#10.8x|"

    将产生类似如下的输出:

    | 0| 0| 0| 0| 0| 0x0| 0X0|0x00000000|
    | 1| 1| 1| 1| 01| 0x1| 0X1|0x00000001|
    |100000|303240|186a0|186A0|0303240|0x186a0|0X186A0|0x000186a0|

3.2 浮点数的转换部分

  浮点数转换部分主要是'%f', '%e', '%E', '%g', 和 '%G' '这几个参数命令的,由于参数的不同,可以输出不同格式的结果。如上表所列: '%f'是输出一个比较固定形式的浮点数……其中,针对这几种不同输出选择还有如下几个参数项:

  • '-’ 表示是左对齐,一般都是右对齐的。
  • '+’ 是指以'+’符号表示正数
  • ' ' 如果输出不是以'+’'-’开头的,那么用空格做开头
  • '#' 是对'%g'和'%G’参数而言的,将在输出的结果强制加上'0’为开头。
  • ''' 将输出的数字以LC_NUMERIC的分类法用’,’隔开。
  • '0' 将空格的地方用“0'填入。

  如果没有特别指定,传入的被格式化的参数默认是double类型的,可以用'L’表示是一个long double类型的。

  如下例子可以看出浮点数格式化的字串:

  如下的格式字串:

"|%12.4f|%12.4e|%12.4g|"

  可能产生如下的输出:

| 0.0000| 0.0000e+00| 0|
  | 1.0000| 1.0000e+00| 1|
  | -1.0000| -1.0000e+00| -1|
  | 100.0000| 1.0000e+02| 100|
  | 1000.0000| 1.0000e+03| 1000|
  | 10000.0000| 1.0000e+04| 1e+04|
  | 12345.0000| 1.2345e+04| 1.234e+04|
  | 100000.0000| 1.0000e+05| 1e+05|
  | 123456.0000| 1.2346e+05| 1.234e+05|

3.3 其他格式的转换部分

  这部分的函数比较简单一些,具体如下:

  • '%c’是指输出一个单个的字符串,默认的输出的被格式化的参数是unsigned char类型的,可以用'-’表示左对齐的。没有的别的参数,比如:
  • printf ("%c%c%c%c%c", 'h', 'e', 'l', 'l', 'o');

    显示结果为: 'hello'

  • '%s’是输出一个字串,. 默认的输出的被格式化的参数是char * (or const char *). 类型的,可以用'-’表示左对齐的。没有的别的参数,比如:
  • printf ("%3s%-6s", "no", "where");

    显示结果: ' nowhere '.

      注: 如果你用这个参数来格式化输出一个指针类型的参数时,有可能会得到一个'(null)'的输出值。不过有时候用于指针为空的缘故程序运行时会产生“Segmentation fault”的错误,下面一个例子就会产生这样的错误:

    #include
    main()
    {
    char a;
    a = inet_addr("192.168.1.1");
    if(a!=-1){
    printf("ip:%s",a);/* 这里的%s可能会产生错误,应改用用%p比较好一些*/
    }
    }

  • '%m’是输出error信息的。如下例子:
  • fprintf (stderr, "can't open '%s': %m", filename);

    等于如下的输出命令:

    fprintf (stderr, "can't open '%s': %s", filename, strerror (errno));

  • “%p”是输出指针类型参数的,显然被格式化的输入蚕室必须是指针,可以用“-”来表示左对齐的。
  • “%n”是比较特殊的参数,它不对格式化输出影响,而是得到输出结果的字符长度,可以用类型指定参数'h' 和 'l'来分别指定输出的参数分别是short int *和 long int *类型的。如下面的例子:

  • int nchar;
    printf ("%d %s%n", 3, "bears", &nchar);

    输出结果:

    3 bears

    同时将7的值赋给变量nchar。

  • '%%'是输出“%”的字符。

4.函数具体介绍

4.1printf()函数

  printf()函数是格式化输出函数系列中比较有具有普遍特点的, 一般用于向标准输出设备按规定格式输出信息。在编写程序时经常会用到此函数。printf()函数的调用格式为:

  printf("<格式化字符串>", <参量表>);

#include
  #include
  int main()
  {
  char c, s[20], *p;
  int a=1234, *i;
  float f=3.141592653589;
  double x=0.12345678987654321;
  p="How do you do";
  strcpy(s, "Hello, Comrade");
  *i=12;
  c='x41';
  printf("a=%d", a); /*结果输出十进制整数a=1234*/
  printf("a=%6d", a); /*结果输出6位十进制数a= 1234*/
  printf("a=%06d", a); /*结果输出6位十进制数a=001234*/
  printf("a=%2d", a); /*a超过2位, 按实际值输出a=1234*/
  printf("*i=%4d", *i); /*输出4位十进制整数*i= 12*/
  printf("*i=%-4d", *i); /*输出左对齐4位十进制整数*i=12*/
  printf("i=%p", i); /*输出地址i=06E4*/
  printf("f=%f", f); /*输出浮点数f=3.141593*/
  printf("f=6.4f", f); /*输出6位其中小数点后4位的浮点数f=3.1416*/
  printf("x=%lf", x); /*输出长浮点数x=0.123457*/
  printf("x=%18.16lf", x);/*输出18位其中小数点后16位的长浮点数x=0.1234567898765432*/
  printf("c=%c", c); /*输出字符c=A*/
  printf("c=%x", c); /*输出字符的ASCII码值c=41*/
  printf("s[]=%s", s); /*输出数组字符串s[]=Hello, Comrade*/
  printf("s[]=%6.9s", s);/*输出最多9个字符的字符串s[]=Hello,Co*/
  printf("s=%p", s); /*输出数组字符串首字符地址s=FFBE*/
  printf("*p=%s", p); /* 输出指针字符串p=How do you do*/
  printf("p=%p", p); /*输出指针的值p=0194*/
  getch();
  retunr 0;
  }

  上面结果中的地址值在不同计算机上可能不同。

  例子中第一条语句#include的 含义是调用另一个文件stdio.h, 这是一个头文件, 其中包括全部标准输入输出库函数的数据类型定义和函数说明。对每个库函数便用的变量及函数类型都已作了定义与说明, 放在相应头文件"*.h"中, 用户用到这些函数时必须要用#include<*.h>或#include"*.h" 语句调用相应的头文件, 以供若没有用此语句说明, 则连接时将会出现错误。

4.2 fprintf()函数

  fprintf( ) 函数中格式化的规定与printf( ) 函数相同, 所不同的只是fprintf()函数是向文件中写入。而printf()是向屏幕输出。

  下面介绍一个例子, 运行后产后一个test.dat的文件。

#include
  main()
  {
  char *s="That's good news"}; /*定义字符串指针并初始化*/
  int i=617; /*定义整型变量并初始化*/
  FILE *fp; /*定义文件指针*/
  fp=fopne("test.dat", "w"); /*建立一个文字文件只写*/
  fputs("Your score of TOEFLis", fp);/*向所建文件写入一串字符*/
  fputc(':', fp); /*向所建文件写冒号:*/
  fprintf(fp, "%d", i); /*向所建文件写一整型数*/
  fprintf(fp, "%s", s); /*向所建文件写一字符串*/
  fclose(fp); /*关闭文件*/
  }

  用CAT命令显示TEST.DAT的内容如下所示:屏幕显示

Your score of TOEFL is: 617
  That's good news

4.3 sprintf() 函数

  sprintf(string, fmt, ...)传回的是string的类型的数组,并以空字符结尾。不过,该函数有可能超过为字符分配的长度。比较危险。下面是一个sprintf()的事例。

int
  //根据传进来的Mission数据结构,建立socket链接,取得文件的大小。
  get_size_of_url(struct Mission* pms)
  {
  int s;
  struct sockaddr_in sin;
  struct hostent* phe;
  char cmd[256];
  char msg_hdr[1000];
  char* p;
  //准备http中GET 方法的请求。
  sprintf(cmd,"GET %s HTTP/1.0", pms->url);
  //创建socket
  if((s=socket(PF_INET,SOCK_STREAM,0))<0)
  return -1;
  //取得远程主机的IP地址,失败函数返回-1
  if((phe = gethostbyname(pms->host)) == NULL)
  return -1;
  memset(&sin,0,sizeof(sin));
  memcpy(&sin.sin_addr,phe->h_addr,sizeof(struct in_addr));
  sin.sin_family=AF_INET;
  sin.sin_port=htons(pms->port);
  //跟远程机器建立连接,失败函数返回-1
  if(connect(s,(struct sockaddr*)&sin,sizeof(sin))==-1)
  return -1;
  //发送GET请求
  if(write(s,cmd,strlen(cmd))<0)
  return 0;
  //从链接描述符(连接管道)中读取传送过来的数据
  if(read(s, msg_hdr, 300)<0)
  return 0;
  close(s);
  printf("%s",msg_hdr);
  //读到该文件的大小
  if((p=strstr(msg_hdr,"Content-Length"))||(p=strstr(msg_hdr,"Content-length:")))
  p+=16;
  else
  return 0;
  //返回大小
  return atoi(p);
  }

  注:在大部份的Unix系统上,sprintf(string, fmt, ...)传回的是string的指标,然而,这方面Linux(遵循ANSI)传回的却是放入string内的字元数目.进行移植时,尤其是针对SunOS,需有警觉的心。

4.4 Snprintf()函数

  Snprintf()函数与Sprintf()函数极为相似,但是该函数多了size参数来表示最大的字符数目,该函数返回一个整数值表示被存储的字符的数目,如果返回-1则表示输出的字符空间不够。如下例子:

char *
  make_message (char *name, char *value)
  {
  /* 预分配100个字符空间. */
  int size = 100;
  char *buffer = (char *) xmalloc (size);
  while (1)
  {
  /* 输出格式化的字符到给定的空间中. */
  int nchars = snprintf (buffer, size,"value of %s is %s",name, value);
  /* 判断是否返回真值 */
  if (nchars < size)
  return buffer;
  /* 如果空间不够,加大预分配空间到2倍 */
  size *= 2;
  buffer = (char *) xrealloc (size, buffer);
  }
  }

4.5 asprintf()函数

  int asprintf (char **ptr, const char *template, ...)

  本函数跟sprintf()函数很类似,只是它将字符串的分配改成动态分配的形式,参数ptr是指一个char *对象的地址函数返回指向一个新建的指针。如下例子:

/* Construct a message describing the value of a variable whose name is name and whose value is value. */
  char *
  make_message (char *name, char *value)
  {
  char *result;
  asprintf (&result, "value of %s is %s", name, value);
  return result;
  }

4.6 Vprintf()函数

  int vprintf (const char *template, va_list ap)

  本函数跟printf函数很类似,只是将参数的数目可变的,变成了一个指针的列表。

4.7 Vfprintf()函数

  int vfprintf (FILE *stream, const char *template, va_list ap)

  本函数跟fprintf函数很类似,只是将参数的数目可变的,变成了一个指针的列表。

4.8 vfprintf()函数

  int vsprintf (char *s, const char *template, va_list ap)

  本函数跟sprintf函数很类似,只是将参数的数目可变的,变成了一个指针的列表。

4.9 vsnprintf()函数

  int vsnprintf (char *s, size_t size, const char *template, va_list ap)

  本函数跟snprintf函数很类似,只是将参数的数目可变的,变成了一个指针的列表。

4.10 vasprintf()函数

  int vasprintf (char **ptr, const char *template, va_list ap)

  本函数跟asprintf函数很类似,只是将参数的数目可变的,变成了一个指针的列表。

  当然,在GCC中还有别的格式化输出函数,以及格式化输入函数,我将在以后的文章中一一介绍(^_^.......)

没有评论: