C语言的语法风格与代码书写规范指南

内容摘要
C代码:




#include <stdio.h>
int main(void)
{
printf("That is Right Style\n");
return 0;
}


在一个标准的C语言程序中,最特殊的莫过于main函数了,而说到底它就是一个
文章正文

C代码:

#include <stdio.h>
int main(void)
{
 printf("That is Right Style\n");
 return 0;
}

在一个标准的C语言程序中,最特殊的莫过于main函数了,而说到底它就是一个函数而已,仅仅因为它地位特殊拥有第一执行权力,换句话说,难道因为一个人是省长它就不是人类了?所以函数该有的它都应该有,那么函数还有什么呢?

函数大体上分为内联函数(C99)(内联函数并非C++专属,C语言亦有,具体见前方链接)和非内联的普通函数,它们之间有一个很明显的特点(一般情况下),那就是不写原型直接在main函数上方定义,即使不加'inline'关键字,也能被编译器默认为内联函数,但之后带来的某些并发问题就不是编译器考虑的了。

普通函数正确的形式应该为声明与定义分离,声明就是一个函数原型,函数原型应该有一个函数名字,一个参数列表,一个返回值类型和一个分号。定义就是函数的内在,花括号内的就是函数的定义:

//...
int function(int arg_1, float arg_2);
//...
int main(int argc, char* argv[])
{
 int output = function(11, 22.0);
 printf("%d\n",output);
 return 0;
}

int function(int arg_1, float arg_2)
{
 int return_value = arg_1;
 float temp_float = arg_2;
 return return_value;
} 

 
依上所述,当非必要时,在自己编写函数的时候请注意在开头(main函数之前)写上你的函数的原型,并且在末尾(main函数之后)写上你的函数定义,这是一个很好的习惯以及规范。所谓代码整洁之道,就是如此。

函数的另一种分类是,有返回值和无返回值,返回值的类型可以是内建(build-in)的也可以是自己定义的(struct, union之类),无返回值则是void。

为什么我们十分谴责void main()这种写法?因为这完全是中国式教育延伸出来的谭式写法,main函数的返回值看似无用,实际上是由操作系统接收,在Windows操作系统下也许无甚"大碍"(实际上有),当你使用Linux的过程中你会清晰的发现一个C语言程序的main返回值关系到一个系统是否能正常,高效的运行,这里稍微提一句,0在Linux程序管道通信间代表着无错可行的意思。所以请扔掉void main这种写法。
为什么我们对 main()这种省略返回值的写法置有微词?能发明这种写法的人,必定是了解了,在C语言中,如果一个函数不显式声明自己的返回值,那么会被缺省认为是int,但这一步是由编译器掌控,然而C语言设计之初便是让我们对一切尽可能的掌握,而一切不确定因子我们都不应该让它存在。其次有一个原则,能自己做的就不要让编译器做。

为什么我们对参数放空置有不满(int main())?在C语言中,一个函数的参数列表有三种合法形态:

 int function();
 int function(void);
 int function(int arg_n);
 int function(int arg_n, ...);

第一种代表拥有未知个参数,第二种代表没有参数,第三种代表有一个参数,第四种代表拥有未知个参数,并且第一个参数类型为int,未知参数在C语言中有一个解决方案就是,可变长的参数列表,具体参考C标准库,在此我们解释的依据就是,我们要将一切都掌控在自己的手中,我们不在括号内填写参数,代表着我们认为一开始的意思是它为空,正因此我们就应该明确说明它为void,而不该让它成为一个未知参数长度的函数,如此在你不小心传入参数的时候,编译器也无法发现错误。

int main(int argc, char* argv[]) 和 int main(void)才是我们该写的C语言标准形式
对于缩进,除了编译器提供的符号缩进之外,我们可以自己给自己一个规范(请少用或者不用Tab),比如每一块代码相教上一个代码块有4格的缩进。
对于学习C语言,请使用.c文件以及C语言编译器练习以及编写C程序,请不要再使用C++的文件编写C语言程序,并且自圆其说为了效率而使用C++的特性在C语言中,我们是祖国的下一代,是祖国的未来,请不要让自己毁在当下,珍爱编程,远离清华大学出版社。

之所以如此叙述,并不是因为情绪,而是当真如此,下方代码:

 /*file: test.c*/
 #include <stdio.h>
 #define SIZES 5
 int main(void)
 {
  int* c_pointer = malloc(SIZES * sizeof(int));
  /*发生了一些事情*/
  free(c_pointer);
  return 0;
 }

这是一段标准的C语言程序,但是它能在C++个编译器下编译运行吗?换句话说当你将文件扩展名由.c改为.cpp之后,它能编译通过吗?答案是不能。

为什么?答案是C++并不支持void*隐式转换为其他类型的指针,但是C语言允许。还有许许多多C于C++不相同的地方,兴许有人说C++是C的超集,但我并不这么认为,一门语言的出现便有它的意义所在,关键在于我们如何发挥它的最大优势,而不是通过混淆概念来增强实用性。

程序式子的写法

一个人活在世界上,时时刻刻都注意着自己的言行举止,而写程序也是如此,对于一个规范的能让别人读懂的程序而言,我们应该尽可能减少阻碍因子,例如:

 int main(void)
 {int complex_int=100;
 int i,j,k,x;
 for(int temp=0;temp<complex_int;++temp){k=temp;
 x=k+complex_int;}
 printf(complex_int="%d is k=%d x=%d\n",complex_int,k,x);
 return 0;}

对于上述的代码,我总是在班级里的同学手下出现,但这段代码除了让别人困惑以外,自己在调试的时候也是十分不方便,每每遇到问题了,即便IDE提示了在某处错误,你也找不到问题所在,经常有人来问我哪里错了,大部分情况都是少了分号,括号,或者作用域超过,原因在哪?

要是一开始将代码写清楚了,这种情况简直是凤毛麟角,想遇上都难。对于一个代码而言,我们应该注意让其变得清晰。

等号两边使用空格:

 int complex_int = 100;

使用多个变量的声明定义,或者函数声明定义,函数使用时,注意用空格分开变量:

 int i, j, k, x;//但是十分不建议这么声明难以理解意义的变量
 printf("complex_int = %d is k = %d x = %d\n", complex_int, k, x);
 void present(int arg_1, double arg_2);

对于一个清晰的程序而言,我们要让每一个步骤清晰且有意义,这就要求我们在编写程序的时候尽量能让代码看起来结构化,或者整体化。尽量让每个程序式子为一行,如果有特别的需要让多个式子写在同一行,可以使用,操作符进行组合,但是会让程序更难理解,日后调试的时候也更难发现错误。

 /*Style 1*/ 
 for(int temp = 0;temp < complex_int;++temp)
 {
  k = temp;
  x = k + complex_int;
 }
 /*Style 2*/
 for(int temp = 0;temp < complex_int;++temp){
  k = temp;
  x = k + complex_int;
 }

对于上方的代码,是C语言代码花括号的两种风格,最好能选择其中一种作为自己的编程风格,这样能让你的程序看起来更加清晰,混合使用的利弊并不好说,关键还是看个人风格。

对于作用域而言,在C语言中有一个经常被使用的特例,当一个条件语句,或者循环只有一条语句的时候,我们常常省略了花括号{},而是仅仅使用一个分号作为结尾,这在很多情况下让代码不再啰嗦:

 if(pointo_int == NULL)
  fprintf(stderr, "The pointer is NULL!\n");
 else
 {
  printf("%d\n",*pointo_int);
  pointo_int = pointo_int->next;
 }

在这段代码中if语句下方的代码并没有使用{}运算符进行指明,但是根据语法,该语句的确是属于if语句的作用范围内,如果我们此时写上了{}反而会令代码看起来过于啰嗦。但是有的时候,这条特性并不是那么的有趣,当使用嵌套功能的时候,还是建议使用{}进行显式的范围规定,而不是使用默认的作用域:

 for(int i = 0;i< 10;++i)
  for(int k = 0;k < 10;++k)
   while(flag != 1)
    set_value(arr[i][k]);

这段代码,看起来十分简洁,但是确实是一个很大的隐患,当我们要调试这段代码的时候,总是需要修改它的构造,而这就带来了潜在的隐患。所以建议在使用嵌套的时候,无论什么情况,都能使用{}进行包装。

综上所述,在开始编写一个标准C语言程序的时候,请先把下面这些东西写上:

 #include <stdio.h>

 int main(void)
 {
  return 0;
 }


C代码规范

命名

只要提到代码规范,就不得不说的一个问题。
在一些小的演示程序中,也许费尽心思去构思一个 命名 是一件十分傻的行为,但是只要程序上升到你需要严正设计,思考,复查的层次,你就需要好好考虑 命名 这个问题。
函数命名:

C语言中,我们可以让下划线或者词汇帮助我们表达函数功能:

前缀:

  • set 可以表示设置一个参数为某值
  • get 可以表示获取某一个参数的值
  • is 可以表示询问是否是这种情况

后缀:

  • max/min 可以表示某种操作的最大(小)次数
  • cnt 可以表示当前的操作次数
  • key 某种关键值
   size_t get_counts();
   size_t retry_max();
   int is_empty();

需要注意的只是,不要让命名过于赘述其义,只简单保留动作以及目的即可,详细功能可以通过文档来进行进一步的解释。
结构体命名:

由于结构体的 标签,不会污染命名,即标签不在命名搜索范围之内,所以可以放心使用:

有人习惯使用 typedef, 而有人喜欢使用 struct tag obj,后者比较多,但是前者也不失为一种好方法,仁者见仁智者见智。

  /*方法1*/
  struct inetaddr_4{
    int port;
    char * name;
  };
  struct inetaddr_4 *addr_info;
  /*方法2*/
  typedef struct _addr{
    int port;
    char * name;
  }inetaddr_4;
  inetaddr_4 *addr_info_2; 

 
两者同处一个文件内亦不会发生编译错误。
变量命名

  • 所有字符都使用小写
  • 含义多的可以用 _ 进行辅助
  • 以 = 为标准进行对齐
  • 类型, 变量名左对齐。

等号左右两端,最少有一个空格。

  int main(void)
  {
   int   counts = 0;
   inetaddr_4 *addr = NULL;

   return 0;
  }

为了防止指针声明定义时候出错,将 * 紧贴着变量名总不会出错。

  inetaddr_4 *addr, object, *addr_2;

其中 addr 和 addr_2 是指针,而 object 则是一个栈上的完整对象,并不是指针。

全局变量能少用就少用,必须要用的情况下,可以考虑添加前缀 g_

  int g_counts;

#define 命名

  • 所有字符都是用大写,并用 _ 进行分割。
  • 如果多于一个语句,使用 do{...}while(0) 进行包裹,防止 ; 错误。
  #define SWAP(x, y)  \
  do{      \
   x = x + y;  \
   y = x - y;   \
   x = x - y;   \
  }while(0)

当然这个交换宏实际上有一点缺陷,在大后方会提出。此处是代码规范,就不重复强调。

enum 命名

  • 所有字符都是用大写,并用 _ 进行分割
  • 与 define 相比,enum适用于同一类型的常量声明,而不是单一独立的常量。往往出现都是成组。

格式化代码

花括号 {}

  • 混合使用符合节俭思想,但会稍微有一点结构紊乱。
  • 单一使用能更好让代码结构清晰。
  • 所谓混合,单一指的是是否一直使用 {} 进行代码包裹。
  • 有人认为 当单一语句的时候不必要添加 {},有的人则习惯添加
  • 当作用域超过一个屏幕的时候,可以适当的使用注释来指明 {} 作用域

     

while(1){
   if(tmp == NULL){
    break;
   }
   else if(fanny == 1){
    ... 大概超过了一个屏幕的代码
   } /*else if fanny*/
  }/*end while*/

如果是代码量少的情况下,但嵌套比较多,也可以使用这个方式进行注释。

括号 ()

有人建议除了函数调用以外,在条件语句等类似情况下使用 () 要在关键字后空一格,再接上 ()语句,对于这一点,我个人习惯是不空格,但总有这种说法。

  if (space == NULL) {
   /**TODO**/
  }
  while(1){
   /**我习惯于如此写**/
  }
  strcpy(str1, str2); /**第一种写法是为了和函数调用写法进行区分**/
  return 0;
switch

一定要放一个 default 在最后,即使它永远不会用到。
每个 case 如果需要使用新变量,可以用 {} 包裹起来,并在里面完成所有操作。

  switch(...)
  {
   case 1:
    /**TODO**/
    break;

   case 2:
   {
    int new_vari;
    /**创建新变量则用 {} 包裹起来**/
   }
   break;

   default:
    call_error();
  }

goto

虽然许多人,许多书都提醒不再使用 goto 关键字,而是使用 setjmp 和 longjmp来取代它,但是这还是那句话,仁者见仁智者见智,如果 goto 能够让代码清晰,那何乐而不为呢,这个观点也是最近才体会到的(并非我一己之言)。
具体使用可以查询官方文档。
语句

  • 应该让完整的语句在每一行中,只出现一次。
  • 对于变量声明定义亦是如此
  • 原因是这样能让文档更有针对性

头文件保护

对于头文件而言,在一个程序中有可能被多次包含(#include),如果缺少头文件保护,则会发生编译错误
不要将 _ 作为宏的开头或者结尾。

  #ifndef VECTOR_H_INCLUDE
   #define VECTOR_H_INCLUDE
    /**TODO**/
   #endif 

C语言的宏有诸多弊端,所以尽量使用 inline 函数来代替宏。在大后方会有解释
但是,请不要因此抛弃了宏,比如在 C11 中有一个新兴的宏。
变量

第一时刻初始化所有所声明的变量,因为这么做总没有坏处,而且能减少出错的可能。
函数

函数应该尽可能的短小,一个ANSI屏幕的为最佳。
如果某个循环带着空语句,使用 {} 进行挂载,以免出现意外。

 while(*is_end++ != '\0')
 {
  ;
 }

虽然是空的循环体,但是写出来以免造成误循环。

尽量不要让函数返回值直接作为条件语句的判断,这样会极大降低可读性

 if(is_eof(file) == 0)
  好过
 if(!is_eof(file))

不要为了方便或者一点点的所谓速度提升(也许根本没有),而放弃可读性,使用嵌入式的赋值语句

 int add = 10;
 int num = 11;
 int thr = 20;
 add = add + thr;
 num = add + 20;

      不要写成

 num = (add = add + thr) + 20;

浮点数

  • 万万记住不要再使用浮点数比较彼此是否相等或不等。
  • 如果把浮点数用在离散性的数据上,比如循环计数器,那就...

其他

使用 #if 而不是 #ifdef
可以使用 define() 来代替 #ifdef的功能

 #if !define(USERS_DEFINE)
  #define USERS_DEFINE ...
 #endif

对于某些大段需要消除的代码,我们不能使用注释 /**/,因为注释不能内嵌着注释(//除外),我们可以使用黑魔法:

 #if NOT_DECLARATION
  /**想要注释的代码**/
 #endif

不要使用纯数字
意味着,不在使用毫无标记的数字,因为可能你过了几个月再看源代码的时候,你根本不知道这个数字代表着什么。
而应该使用#define 给它一个名字,来说明这个数字的意义。


代码注释

作者:喵哥笔记

IDC笔记

学的不仅是技术,更是梦想!