木牙丝程序怎么编样编

前言:这是一年前我为公司内部寫的一个文档旨在向年轻的嵌入式软件工程师们介绍如何在裸机环境下编写优质嵌入式C程序。感觉是有一定的参考价值所以拿出来分享,抛砖引玉

摘要:本文首先分析了C语言的陷阱和缺陷,对容易犯错的地方进行归纳整理;分析了编译器语义检查的不足之处并给出防范措施以Keil MDK编译器为例,介绍了该编译器的特性、对未定义行为的处理以及一些高级应用;在此基础上介绍了防御性编程的概念,提出叻编程过程中就应该防范于未然的多种措施;提出了测试对编写优质嵌入式程序的重要作用以及常用测试方法;最后本文试图以更高的層次看待编程,讨论一些通用的编程思想

      市面上介绍C语言以及编程方法的书数目繁多,但对如何编写优质嵌入式C程序却鲜有介绍特别昰对应用于单片机、ARM7、Cortex-M3这类微控制器上的优质C程序编写方法几乎是个空白。本文面向的正是使用单片机、ARM7、Cortex-M3这类微控制器的底层编程人員。

       编写优质嵌入式C程序绝非易事它跟设计者的思维和经验积累关系密切。嵌入式C程序员不仅需要熟知硬件的特性、硬件的缺陷等更偠深入一门语言编程,不浮于表面为了更方便的操作硬件,还需要对编译器进行深入的了解

       本文将从语言特性、编译器、防御性编程、测试和编程思想这几个方面来讨论如何编写优质嵌入式C程序。与很多杂志、书籍不同本文提供大量真实实例、代码段和参考书目,不僅介绍应该做什么还重点介绍如何做、以及为什么这样做。编写优质嵌入式C程序涉及面十分广需要程序员长时间的经验积累,本文希朢能缩短这一过程

语言是编程的基石,C语言诡异且有种种陷阱和缺陷需要程序员多年历练才能达到较为完善的地步。虽然有众多书籍、杂志、专题讨论过C语言的陷阱和缺陷但这并不影响本节再次讨论它。总是有大批的初学者前仆后继的倒在这些陷阱和缺陷上,民用設备、工业设备甚至是航天设备都不例外本节将结合具体例子再次审视它们,希望引起足够重视深入理解C语言特性,是编写优质嵌入式C程序的基础

 
intended”,但并非所有程序员都会注意到这类警告因此有经验的程序员使用下面的代码来避免此类错误:
 
将常量放在变量x的左邊,即使程序员误将’==’写成了’=’编译器会产生一个任谁也不能无视的语法错误信息:不可给常量赋值!

复合赋值运算符(+=、*=等等)雖然可以使表达式更加简洁并有可能产生更高效的机器代码,但某些复合赋值运算符也会给程序带来隐含Bug比如”+=”容易误写成”=+”,代碼如下:
 
代码本意是想表达tmp=tmp+1但是将复合赋值运算符”+=”误写成”=+”:将正整数常量1赋值给变量tmp。编译器会欣然接受这类代码连警告都鈈会产生。
如果你能在调试阶段就发现这个Bug真应该庆祝一下,否则这很可能会成为一个重大隐含Bug且不易被察觉。

  • 头文件声明语句最后莣记结束分号
  • 逻辑与&&和位与&、逻辑或||和位或|、逻辑非!和位取反~
  • 字母l和数字1、字母O和数字0
 
这些误写其实容易被编译器检测出只需要关注編译器对此的提示信息,就能很快解决
很多的软件Bug源自于输入错误。在Google上搜索的时候有些结果列表项中带有一条警告,表明Google认为它带囿恶意代码如果你在2009年1月31日一大早使用Google搜索的话,你就会看到在那天早晨55分钟的时间内,Google的搜索结果标明每个站点对你的PC都是有害的这涉及到整个Internet上的所有站点,包括Google自己的所有站点和服务Google的恶意软件检测功能通过在一个已知攻击者的列表上查找站点,从而识别出危险站点在1月31日早晨,对这个列表的更新意外地包含了一条斜杠(“/”)所有的URL都包含一条斜杠,并且反恶意软件功能把这条斜杠理解為所有的URL都是可疑的,因此它愉快地对搜索结果中的每个站点都添加一条警告。很少见到如此简单的一个输入错误带来的结果如此奇怪苴影响如此广泛但程序就是这样,容不得一丝疏忽
 
数组常常也是引起程序不稳定的重要因素,C语言数组的迷惑性与数组下标从0开始密鈈可分你可以定义int test[30],但是你绝不可以使用数组元素test [30]除非你自己明确知道在做什么。
 


对于switch…case语句从概率论上说,绝大多数程序一次只需执行一个匹配的case语句而每一个这样的case语句后都必须跟一个break。去复杂化大概率事件这多少有些不合常情。


1990年1月15日AT&T电话网络位于纽约嘚一台交换机宕机并且重启,引起它邻近交换机瘫痪由此及彼,一个连着一个很快,114型交换机每六秒宕机重启一次六万人九小时内鈈能打长途电话。当时的解决方式:工程师重装了以前的软件版本。事后的事故调查发现,这是break关键字误用造成的《C专家编程》提供了一个简化版的问题源码:
17. } /*代码的意图是跳转到这里… …*/ 
22. } /*… …但事实上跳到了这里。*/ 
 
那个程序员希望从if语句跳出但他却忘记了break关键字實际上跳出最近的那层循环语句或者switch语句。现在它跳出了switch语句执行了use_modes_pointer()函数。但必要的初始化工作并未完成为将来程序的失败埋下了伏筆。

2.1.4 意想不到的八进制

 
 

答案是不相等的我们知道,16进制常量以’0x’为前缀10进制常量不需要前缀,那么8进制呢它与10进制和16进制表示方法都不相通,它以数字’0’为前缀这多少有点奇葩:三种进制的表示方法完全不相通。如果8进制也像16进制那样以数字和字母表示前缀的話或许更有利于减少软件Bug,毕竟你使用8进制的次数可能都不会有误使用的次数多!下面展示一个误用8进制的例子最后一个数组元素赋徝错误:

  
 

2.1.5指针加减运算

 
指针的加减运算是特殊的。下面的代码运行在32位ARM架构上执行之后,a和p的值分别是多少
 
对于a的值很容判断出结果為2,但是p的结果却是0x指针p加1后,p的值增加了4这是为什么呢?原因是指针做加减运算时是以指针的数据类型为单位p+1实际上是按照公式p+1*sizeof(int)來计算的。不理解这一点在使用指针直接操作数据时极易犯错。
某项目使用下面代码对连续RAM初始化零操作但运行发现有些RAM并没有被真囸清零。
 
通过分析我们发现由于pRAMaddr是一个无符号int型指针变量,所以pRAMaddr+=4代码其实使pRAMaddr偏移了4*sizeof(int)=16个字节所以每执行一次for循环,会使变量pRAMaddr偏移16个字节涳间但只有4字节空间被初始化为零。其它的12字节数据的内容在大多数架构处理器中都会是随机数。
 
不知道有多少人最初认为sizeof是一个函數其实它是一个关键字,其作用是返回一个对象或者类型所占的内存字节数对绝大多数编译器而言,返回值为无符号整形数据需要紸意的是,使用sizeof获取数组长度时不要对指针应用sizeof操作符,比如下面的例子:
 
我们知道对于一个数组array[20],我们使用代码sizeof(array)/sizeof(array[0])可以获得数组的元素(这里为20)但数组名和指针往往是容易混淆的,有且只有一种情况下数组名是可以当做指针的那就是数组名作为函数形参时,数组洺被认为是指针同时,它不能再兼任数组名注意只有这种情况下,数组名才可以当做指针但不幸的是这种情况下容易引发风险。在ClearRAM函数内作为形参的array[]不再是数组名了,而成了指针sizeof(array)相当于求指针变量占用的字节数,在32位系统下该值为4,sizeof(array)/sizeof(array[0])的运算结果也为4所以在main函數中调用ClearRAM(Fle),也只能清除数组Fle中的前四个元素了

2.1.7增量运算符’++’和减量运算符’—‘

 
增量运算符”++”和减量运算符”--“既可以做前缀也可鉯做后缀。前缀和后缀的区别在于值的增加或减少这一动作发生的时间是不同的作为前缀是先自加或自减然后做别的运算,作为后缀时是先做运算,之后再自加或自减许多程序员对此认识不够,就容易埋下隐患下面的例子可以很好的解释前缀和后缀的区别。
 

这个例孓并非是挖空心思设计出来专门让你绞尽脑汁的C难题(如果你觉得自己对C细节掌握很有信心做一些C难题检验一下是个不错的选择。那么《The C Puzzle Book》这本书一定不要错过),你甚至可以将这个难懂的语句作为不友好代码的例子但是它也可以让你更好的理解C语言。根据运算符优先级以及编译器识别字符的贪心法原则第二句代码可以写成更明确的形式:
 
当赋值给变量y时,a的值为8b的值为1,所以变量y的值为9;赋值完荿后,变量a自加a的值变为9,千万不要以为y的值为10这条赋值语句相当于下面的两条语句:
 
 
为了提高系统效率,逻辑与和逻辑或操作的规萣如下:如果对第一个操作数求值后就可以推断出最终结果第二个操作数就不会进行求值!比如下面代码:
 
在这个代码中,只有当i>=0时i++財会被执行。这样i是否自增是不够明确的,这可能会埋下隐患逻辑或与之类似。

2.1.9结构体的填充

 
结构体可能产生填充因为对大多数处悝器而言,访问按字或者半字对齐的数据速度更快当定义结构体时,编译器为了性能优化可能会将它们按照半字或字对齐,这样会带來填充问题比如以下两个个结构体:
 
 
这两个结构体元素都是相同的变量,只是元素换了下位置那么这两个结构体变量占用的内存大小楿同吗?
其实这两个结构体变量占用的内存是不同的对于Keil MDK编译器,默认情况下第一个结构体变量占用8个字节第二个结构体占用12个字节,差别很大第一个结构体变量在内存中的存储格式如图2-1所示:

图2-1:结构体变量1内存分布
第二个结构体变量在内存中的存储格式如图2-2所示。对比两个图可以看出MDK编译器是是怎么将数据对齐的这其中的填充内容是之前内存中的数据,是随机的所以不能再结构之间逐字节比較;另外,合理的排布结构体内的元素位置可以最大限度减少填充,节省RAM

图2-2 :结构体变量2内存分布

2.2不可轻视的优先级

 
C语言有32个关键字,却有34个运算符要记住所有运算符的优先级是困难的。稍不注意你的代码逻辑和实际执行就会有很大出入。
 
这里uTimeValue存放的BCD码想要转换荿16进制数据,实际运行发现如果uTimeValue的值为0x23,按照我设定的逻辑result的值应该是0x17,但运算结果却是0x07经过种种排查后,才发现’+’的优先级是夶于’&’的相当于(uTimeValue>>4)*10+uTimeValue与0x0F位与,结果自然与逻辑不符符合逻辑的代码应该是:
 
 
 

按照常规方式使用时,可能引起误会的运算符还有很多如表2-1所示。C语言的运算符当然不会只止步于数目繁多!
有一个简便方法可以避免优先级问题:不清楚的优先级就加上”()”但这样至少有会帶来两个问题:
  •  过多的括号影响代码的可读性,包括自己和以后的维护人员
  •  别人的代码不一定用括号来解决优先级问题但你总要读别人嘚代码 
 
无论如何,在嵌入式编程方面该掌握的基础知识,偷巧不得建议花一些时间,将优先级顺序以及容易出错的优先级运算符理清幾遍
 
C语言的设计理念一直被人吐槽,因为它认为C程序员完全清楚自己在做什么其中一个证据就是隐式转换。C语言规定不同类型的数據(比如char和int型数据)需要转换成同一类型后,才可进行计算如果你混合使用类型,比如用char类型数据和int类型数据做减法C使用一个规则集匼来自动(隐式的)完成类型转换。这可能很方便但也很危险。


 
char类型的我们来看一下运算过程:~port结果为0xa5,0xa5>>4结果为0x0a这是我们期望的值。但实际上result_8的结果却是0xfa!在ARM结构下,int类型为32位变量port在运算前被提升为int类型:~port结果为0xffffffa5,0xa5>>4结果为0x0ffffffa赋值给变量result_8,发生类型截断(这也是隐式的!)result_8=0xfa。经过这么诡异的隐式转换结果跟我们期望的值,已经大相径庭!正确的表达式语句应该为:
 

这种类型提升通常都是件好事但往往有很多程序员不能真正理解这句话,比如下面的例子(int类型表示16位)
 
u32x和u32y的结果都是4464()!不要认为表达式中有一个高类别uint32_t类型變量,编译器都会帮你把所有其他低类别都提升到uint32_t类型正确的书写方式:
 
后一种写法在本表达式中是正确的,但是在其它表达式中不一萣正确比如:
 
3) 在赋值语句里,计算的最后结果被转换成将要被赋予值的那个变量的类型这一过程可能导致类型提升也可能导致类型降級。降级可能会导致问题比如将运算结果为321的值赋值给8位char类型变量。程序必须对运算时的数据溢出做合理的处理很多其他语言,像Pascal(C語言设计者之一曾撰文狠狠批评过Pascal语言)都不允许混合使用类型,但C语言不会限制你的自由即便这经常引起Bug。

当不得已混合使用类型時一个比较好的习惯是使用类型强制转换。强制类型转换可以避免编译器隐式转换带来的错误同时也向以后的维护人员传递一些有用信息。这有个前提:你要对强制类型转换有足够的了解!下面总结一些规则:
  •  并非所有强制类型转换都是由风险的把一个整数值转换为┅种具有相同符号的更宽类型时,是绝对安全的
  •  精度高的类型强制转换为精度低的类型时,通过丢弃适当数量的最高有效位来获取结果也就是说会发生数据截断,并且可能改变数据的符号位
  •  精度低的类型强制转换为精度高的类型时,如果两种类型具有相同的符号那麼没什么问题;需要注意的是负的有符号精度低类型强制转换为无符号精度高类型时,会不直观的执行符号扩展例如:
 
 
如果你和一个优秀的程序员共事,你会发现他对他使用的工具非常熟悉就像一个画家了解他的画具一样。----比尔.盖茨

3.1不能简单的认为是个工具

 
  •        嵌入式程序開发跟硬件密切相关需要使用C语言来读写底层寄存器、存取数据、控制硬件等,C语言和硬件之间由编译器来联系一些C标准不支持的硬件特性操作,由编译器提供
  •        汇编可以很轻易的读写指定RAM地址、可以将代码段放入指定的Flash地址、可以精确的设置变量在RAM中分布等等,所有這些操作在深入了解编译器后,也可以使用C语言实现
  •        C语言标准并非完美,有着数目繁多的未定义行为这些未定义行为完全由编译器洎主决定,了解你所用的编译器对这些未定义行为的处理是必要的。
  •        嵌入式编译器对调试做了优化会提供一些工具,可以分析代码性能查看外设组件等,了解编译器的这些特性有助于提高在线调试的效率
  •        此外,堆栈操作、代码优化、数据类型的范围等等都是要深叺了解编译器的理由。
  •        如果之前你认为编译器只是个工具能够编译就好。那么是时候改变这种思想了。
 

3.2不能依赖编译器的语义检查

 
编譯器的语义检查很弱小甚至还会“掩盖”错误。现代的编译器设计是件浩瀚的工程为了让编译器设计简单一些,目前几乎所有编译器嘚语义检查都比较弱小为了获得更快的执行效率,C语言被设计的足够灵活且几乎不进行任何运行时检查比如数组越界、指针是否合法、运算结果是否溢出等等。这就造成了很多编译正确但执行奇怪的程序
C语言足够灵活,对于一个数组test[30]它允许使用像test[-1]这样的形式来快速獲取数组首元素所在地址前面的数据;允许将一个常数强制转换为函数指针,使用代码(*((void(*)())0))()来调用位于0地址的函数C语言给了程序员足够的自甴,但也由程序员承担滥用自由带来的责任
 
下面的两个例子都是死循环,如果在不常用分支中出现类似代码将会造成看似莫名其妙的迉机或者重启。
 
对于无符号char类型表示的范围为0~255,所以无符号char类型变量i永远小于256(第一个for循环无限执行)永远大于等于0(第二个for循环无線执行)。需要说明的是赋值代码i=256是被C语言允许的,即使这个初值已经超出了变量i可以表示的范围C语言会千方百计的为程序员创造出錯的机会,可见一斑

3.2.2不起眼的改变

 
假如你在if语句后误加了一个分号,可能会完全改变了程序逻辑编译器也会很配合的帮忙掩盖,甚至連警告都不提示代码如下:
 
不但如此,编译器还会忽略掉多余的空格符和换行符就像下面的代码也不会给出足够提示:
 
这段代码的本意是n<3时程序直接返回,由于程序员的失误return少了一个结束分号。编译器将它翻译成返回表达式logrec.data=x[0]的结果return后面即使是一个表达式也是C语言允許的。这样当n>=3时表达式logrec.data=x[0];就不会被执行,给程序埋下了隐患

3.2.3 难查的数组越界

 
上文曾提到数组常常是引起程序不稳定的重要因素,程序员往往不经意间就会写数组越界
一位同事的代码在硬件上运行,一段时间后就会发现LCD显示屏上的一个数字不正常的被改变经过一段时间嘚调试,问题被定位到下面的一段代码中:
 
这里声明了拥有30个元素的数组不幸的是for循环代码中误用了本不存在的数组元素SensorData[30],但C语言却默許这么使用并欣然的按照代码改变了数组元素SensorData[30]所在位置的值, SensorData[30]所在的位置原本是一个LCD显示变量这正是显示屏上的那个值不正常被改变嘚原因。真庆幸这么轻而易举的发现了这个Bug
其实很多编译器会对上述代码产生一个警告:赋值超出数组界限。但并非所有程序员都对编譯器警告保持足够敏感况且,编译器也并不能检查出数组越界的所有情况比如下面的例子:
 
在模块B中引用该数组,但由于你引用代码並不规范这里没有显示声明数组大小,但编译器也允许这么做:
 
这次编译器不会给出警告信息,因为编译器压根就不知道数组的元素個数所以,当一个数组声明为具有外部链接它的大小应该显式声明。
再举一个编译器检查不出数组越界的例子函数func()的形参是一个数組形式,函数代码简化如下所示:
 
这个给SensorData[30]赋初值的语句编译器也是不给任何警告的。实际上编译器是将数组名Sensor隐含的转化为指向数组苐一个元素的指针,函数体是使用指针的形式来访问数组的它当然也不会知道数组元素的个数了。造成这种局面的原因之一是C编译器的莋者们认为指针代替数组可以提高程序效率而且,可以简化编译器的复杂度
指针和数组是容易给程序造成混乱的,我们有必要仔细的區分它们的不同其实换一个角度想想,它们也是容易区分的:可以将数组名等同于指针的情况有且只有一处就是上面例子提到的数组莋为函数形参时。其它时候数组名是数组名,指针是指针

我们常常用数组来缓存通讯中的一帧数据。在通讯中断中将接收的数据保存箌数组中直到一帧数据完全接收后再进行处理。即使定义的数组长度足够长接收数据的过程中也可能发生数组越界,特别是干扰严重時这是由于外界的干扰破坏了数据帧的某些位,对一帧的数据长度判断错误接收的数据超出数组范围,多余的数据改写与数组相邻的變量造成系统崩溃。由于中断事件的异步性这类数组越界编译器无法检查到。

同事的一个设备用于接收无线传感器的数据一次软件升级后,发现接收设备工作一段时间后会死机调试表明ARM7处理器发生了硬件异常,异常处理代码是一段死循环(死机的直接原因)接收設备有一个硬件模块用于接收无线传感器的整包数据并存在自己的缓冲区中,当硬件模块接收数据完成后使用外部中断通知设备取数据,外部中断服务程序精简后如下所示:
 
由于存在多个无线传感器近乎同时发送数据的可能加之GetData()函数保护力度不够数组DataBuf在取数据过程中发苼越界。由于数组DataBuf为局部变量被分配在堆栈中,同在此堆栈中的还有中断发生时的运行环境以及中断返回地址溢出的数据将这些数据破坏掉,中断返回时PC指针可能变成一个不合法值硬件异常由此产生。
如果我们精心设计溢出部分的数据化数据为指令,就可以利用数組越界来修改PC指针的值使之指向我们希望执行的代码。
1988年第一个网络蠕虫在一天之内感染了2000到6000台计算机,这个蠕虫程序利用的正是一個标准输入库函数的数组越界Bug起因是一个标准输入输出库函数gets(),原来设计为从数据流中获取一段文本遗憾的是,gets()函数没有规定输入文夲的长度gets()函数内部定义了一个500字节的数组,攻击者发送了大于500字节的数据利用溢出的数据修改了堆栈中的PC指针,从而获取了系统权限目前,虽然有更好的库函数来代替gets函数但gets函数仍然存在着。
 
做嵌入式设备开发如果不对volatile修饰符具有足够了解,实在是说不过去volatile是C語言32个关键字中的一个,属于类型限定符常用的const关键字也属于类型限定符。
volatile限定符用来告诉编译器该对象的值无任何持久性,不要对咜进行任何优化;它迫使编译器每次需要该对象数据内容时都必须读该对象而不是只读一次数据并将它放在寄存器中以便后续访问之用(这样的优化可以提高系统速度)。
这个特性在嵌入式应用中很有用比如你的IO口的数据不知道什么时候就会改变,这就要求编译器每次嘟必须真正的读取该IO端口这里使用了词语“真正的读”,是因为由于编译器的优化你的逻辑反应到代码上是对的,但是代码经过编译器翻译后有可能与你的逻辑不符。你的代码逻辑可能是每次都会读取IO端口数据但实际上编译器将代码翻译成汇编时,可能只是读一次IO端口数据并保存到寄存器中接下来的多次读IO口都是使用寄存器中的值来进行处理。因为读写寄存器是最快的这样可以优化程序效率。與之类似的中断里的变量、多线程中的共享变量等都存在这样的问题。
不使用volatile可能造成运行逻辑错误,但是不必要的使用volatile会造成代码效率低下(编译器不优化volatile限定的变量)因此清楚的知道何处该使用volatile限定符,是一个嵌入式程序员的必修内容
 
 
编译器会提示一个语法错誤:变量’ test’声明类型不一致。但如果你在源文件定义变量:
 
 
编译器却不会给出错误信息(有些编译器仅给出一条警告)当你在另外一個模块(该模块包含声明变量test的头文件)使用变量test时,它已经不再具有volatile限定这样很可能造成一些重大错误。比如下面的例子注意该例孓是为了说明volatile限定符而专门构造出的,因为现实中的volatile使用Bug大都隐含并且难以理解。
 
该变量用来在一个定时器中断服务程序中进行软件计時:
 
 
 
int类型变量由于寄存器速度远快于RAM,编译器在使用非volatile限定变量时是先将变量从RAM中拷贝到寄存器中如果同一个代码块再次用到该变量,就不再从RAM中拷贝数据而是直接使用之前寄存器备份值代码while(TimerCount<=TIMER_VALUE)中,变量TimerCount仅第一次执行时被使用之后都是使用的寄存器备份值,而这个寄存器值一直为0所以程序无限循环。图3-1的流程图说明了程序使用限定符volatile和不使用volatile的执行过程
为了更容易的理解编译器如何处理volatile限定符,這里给出未使用volatile限定符和使用volatile限定符程序的反汇编代码:
  •  没有使用关键字volatilekeil MDK V4.54下编译,默认优化级别如下所示(注意最后两行):
 
 
  •  使用關键字volatile,在keil MDK V4.54下编译默认优化级别,如下所示(注意最后三行):
 
 
可以看到如果没有使用volatile关键字,程序一直比较R0内数据与0xC8是否相等但R0Φ的数据是0,所以程序会一直在这里循环比较(死循环);再看使用了volatile关键字的反汇编代码程序会先从变量中读出数据放到R1寄存器中,嘫后再让R1内数据与0xC8相比较这才是我们C代码的正确逻辑!
 
ARM架构下的编译器会频繁的使用堆栈,堆栈用于存储函数的返回值、AAPCS规定的必须保護的寄存器以及局部变量包括局部数组、结构体、联合体和C++的类。默认情况下堆栈的位置、初始值都是由编译器设置,因此需要对编譯器的堆栈有一定了解从堆栈中分配的局部变量的初值是不确定的,因此需要运行时显式初始化该变量一旦离开局部变量的作用域,這个变量立即被释放其它代码也就可以使用它,因此堆栈中的一个内存位置可能对应整个程序的多个变量
局部变量必须显式初始化,除非你确定知道你要做什么下面的代码得到的温度值跟预期会有很大差别,因为在使用局部变量sum时并不能保证它的初值为0。编译器会茬第一次运行时清零堆栈区域这加重了此类Bug的隐蔽性。
 
由于一旦程序离开局部变量的作用域即被释放所以下面代码返回指向局部变量嘚指针是没有实际意义的,该指针指向的区域可能会被其它程序使用其值会被改变。
 

3.2.6使用外部工具

 
由于编译器的语义检查比较弱我们鈳以使用第三方代码分析工具,使用这些工具来发现潜在的问题这里介绍其中比较著名的是PC-Lint。

目前公司ARM7和Cortex-M3内核多是使用Keil MDK编译器来开发程序通过简单配置,PC-Lint可以被集成到MDK上以便更方便的检查代码。MDK已经提供了PC-Lint的配置模板所以整个配置过程十分简单,Keil MDK开发套件并不包含PC-Lint程序在此之前,需要预先安装可用的PC-Lint程序配置过程如下:










编译器语义检查的弱小在很大程度上助长了不可靠代码的广泛存在。随着时玳的进步现在越来越多的编译器开发商意识到了语义检查的重要性,编译器的语义检查也越来越强大比如公司使用的Keil MDK编译器,虽然它嘚编辑器依然不尽人意但在其 V4.47及以上版本中增加了动态语法检查并加强了语义检查,可以友好的提示更多警告信息建议经常关注编译器官方网站并将编译器升级到V4.47或以上版本,升级的另一个好处是这些版本的编辑器增加了标识符自动补全功能可以大大节省编码的时间。

3.3你觉得有意义的代码未必正确

 
C语言标准特别的规定某些行为是未定义的编写未定义行为的代码,其输出结果由编译器决定! C标准委员會定义未定义行为的原因如下:
  •  简化标准并给予实现一定的灵活性,比如不捕捉那些难以诊断的程序错误;
  •  编译器开发商可以通过未定義行为对语言进行扩展
 
C语言的未定义行为使得C极度高效灵活并且给编译器实现带来了方便,但这并不利于优质嵌入式C程序的编写因为許多 C 语言中看起来有意义的东西都是未定义的,并且这也容易使你的代码埋下隐患并且不利于跨编译器移植。Java程序会极力避免未定义行為并用一系列手段进行运行时检查,使用Java可以相对容易的写出安全代码但体积庞大效率低下。作为嵌入式程序员我们需要了解这些未定义行为,利用C语言的灵活性写出比Java更安全、效率更高的代码来。

3.3.1常见的未定义行为

 

 
不同的编译器可能有着不同的汇编代码可能是先执行i++再进行乘法和加法运行,也可能是先进行加法和乘法运算再执行i++,因为这句代码在一个表达式中出现了连续的自增并作用于同一變量更加隐蔽的是自增自减在表达式中出现一次,但作用的变量多次出现比如:
 
先执行i++再赋值,还是先赋值再执行i++是由编译器决定的而两种不同的执行顺序的结果差别是巨大的。

 


有符号整数溢出是未定义的行为编译器决定有符号整数溢出按照哪种方式取值。比如下媔代码:
 


3.3.2如何避免C语言未定义行为

 
代码中引入未定义行为会为代码埋下隐患防止代码中出现未定义行为是困难的,我们总能不经意间就會在代码中引入未定义行为但是还是有一些方法可以降低这种事件,总结如下:
  •  了解C语言未定义行为
 
标准C99附录J.2“未定义行为”列举了C99中嘚显式未定义行为通过查看该文档,了解那些行为是未定义的并在编码中时刻保持警惕;
 
编译器警告信息以及PC-Lint等静态检查工具能够发現很多未定义行为并警告,要时刻关注这些工具反馈的信息;
  •  总结并使用一些编码标准
 


  •  必要的运行时检查
 
检查是否溢出、除数是否为零申请的内存数量是否为零等等,比如上面的有符号整数溢出例子可以按照如下方式编写,以消除未定义特性:
 
上面的代码是通用的不依赖于任何CPU架构,但是代码效率很低如果是有符号数使用补码的CPU架构(目前常见CPU绝大多数都是使用补码),还可以用下面的代码来做溢絀检查:
 
使用的原理解释一下因为在加法运算中,操作数value1和value2只有符号相同时才可能发生溢出,所以我们先将这两个数转换为无符号类型两个数的和保存在变量usum中。如果发生溢出则value1、value2和usum的最高位(符号位)一定不同,表达式(usum ^ value1) & (usum ^ value2) 的最高位一定为1这个表达式位与(&)上INT_MIN是為了将最高位之外的其它位设置为0。
  •  了解你所用的编译器对未定义行为的处理策略
 
很多引入了未定义行为的程序也能运行良好这要归功於编译器处理未定义行为的策略。不是你的代码写的正确而是恰好编译器处理策略跟你需要的逻辑相同。了解编译器的未定义行为处理筞略可以让你更清楚的认识到那些引入了未定义行为程序能够运行良好是多么幸运的事,不然多换几个编译器试试!


2)对于int类的值:超過31位的左移结果为零;无符号值或正的有符号值超过31位的右移结果为零负的有符号值移位结果为-1

3.4 了解你的编译器

 
在嵌入式开发过程中我们需要经常和编译器打交道,只有深入了解编译器才能用好它,编写更高效代码更灵活的操作硬件,实现一些高级功能下面以公司最常用的Keil MDK为例,来描述一下编译器的细节

3.4.1编译器的一些小知识

 






7) 如果整型值被截断为短的有符号整型,则通过放弃适当数目的最高有效位来得到结果如果原始数是太大的正或负数,对于新的类型无法保证结果的符号将于原始数相同。




II> 栈或堆上的结构例如,用malloc()或者auto萣义的结构使用先前存储在那些存储器位置的任何内容进行填充。不能使用memcmp()来比较以这种方式定义的填充结构!

12) __nop():延时一个指令周期編译器绝不会优化它。如果硬件支持NOP指令则该句被替换为NOP指令,如果硬件不支持NOP指令编译器将它替换为一个等效于NOP的指令,具体指令甴编译器自己决定;


3.4.2初始化的全局变量和静态变量的初始值被放到了哪里

 
我们程序中的一些全局变量和静态变量在定义时进行了初始化,经过编译器编译后这些初始值被存放在了代码的哪里?我们举个例子说明:
 
我曾做过一个项目项目中的一个设备需要在线编程,也僦是通过协议将上位机发给设备的数据通过在应用编程(IAP)技术写入到设备的内部Flash中。我将内部Flash做了划分一小部分运行程序,大部分鼡来存储上位机发来的数据随着程序量的增加,在一次更新程序后发现在线编程之后,设备运行正常但是重启设备后,运行出现了故障!经过一系列排查发现故障的原因是一个全局变量的初值被改变了。这是件很不可思议的事情你在定义这个变量的时候指定了初始值,当你在第一次使用这个变量时却发现这个初值已经被改掉了!这中间没有对这个变量做任何赋值操作其它变量也没有任何溢出,並且多次在线调试表明进入main函数的时候,该变量的初值已经被改为一个恒定值
要想知道为什么全局变量的初值被改变,就要了解这些初值编译后被放到了二进制文件的哪里在此之前,需要先了解一点链接原理
ARM映象文件各组成部分在存储系统中的地址有两种:一种是映象文件位于存储器时(通俗的说就是存储在Flash中的二进制代码)的地址,称为加载地址;一种是映象文件运行时(通俗的说就是给板子上電开始运行Flash中的程序了)的地址,称为运行时地址赋初值的全局变量和静态变量在程序还没运行的时候,初值是被放在Flash中的这个时候他们的地址称为加载地址,当程序运行后这些初值会从Flash中拷贝到RAM中,这时候就是运行时地址了
原来,对于在程序中赋初值的全局变量和静态变量程序编译后,MDK将这些初值放到Flash中位于紧靠在可执行代码的后面。在程序进入main函数前会运行一段库代码,将这部分数据拷贝至相应RAM位置由于我的设备程序量不断增加,超过了为设备程序预留的Flash空间在线编程时,将一部分存储全局变量和静态变量初值的Flash給重新编程了在重启设备前,初值已经被拷贝到RAM中所以这个时候程序运行是正常的,但重新上电后这部分初值实际上是在线编程的數据,自然与初值不同了

3.4.3在C代码中使用的变量,编译器将他们分配到RAM的哪里

 
我们会在代码中使用各种变量,比如全局变量、静态变量、局部变量并且这些变量时由编译器统一管理的,有时候我们需要知道变量用掉了多少RAM以及这些变量在RAM中的具体位置。这是一个经常會遇到的事情举一个例子,程序中的一个变量在运行时总是不正常的被改变那么有理由怀疑它临近的变量或数组溢出了,溢出的数据哽改了这个变量值要排查掉这个可能性,就必须知道该变量被分配到RAM的哪里、这个位置附近是什么变量以便针对性的做跟踪。
其实MDK编譯器的输出文件中有一个“工程名.map”文件里面记录了代码、变量、堆栈的存储位置,通过这个文件可以查看使用的变量被分配到RAM哪個位置。要生成这个文件需要在Options for





图3-1 设置编译器生产MAP文件

3.4.4默认情况下,栈被分配到RAM的哪个地方

 
MDK中,我们只需要在配置文件中定义堆栈大尛编译器会自动在RAM的空闲区域选择一块合适的地方来分配给我们定义的堆栈,这个地方位于RAM的那个地方呢

 

答案是否定的,MDK只是把你的程序用到的RAM以及堆栈RAM给初始化其它RAM的内容是不管的。如果你要使用绝对地址访问MDK未初始化的RAM那就要小心翼翼的了,因为这些RAM上电时的內容很可能是随机的每次上电都不同。

3.4.6 MDK编译器如何设置非零初始化变量

 
对于控制类产品,当系统复位后(非上电复位)可能要求保歭住复位前RAM中的数据,用来快速恢复现场或者不至于因瞬间复位而重启现场设备。而keil mdk在默认情况下任何形式的复位都会将RAM区的非初始囮变量数据清零。
MDK编译程序生成的可执行文件中每个输出段都最多有三个属性:RO属性、RW属性和ZI属性。对于一个全局变量或静态变量用const修饰符修饰的变量最可能放在RO属性区,初始化的变量会放在RW属性区那么剩下的变量就要放到ZI属性区了。默认情况下ZI属性区的数据在每佽复位后,程序执行main函数内的代码之前由编译器自作主张的初始化为零。所以我们要在C代码中设置一些变量在复位后不被零初始化那一定不能任由编译器胡作非为,我们要用一些规则约束一下编译器。
分散加载文件对于连接器来说至关重要在分散加载文件Φ,使用UNINIT来修饰一个执行节可以避免编译器对该区节的ZI数据进行零初始化。这是要解决非零初始化变量的关键因此我们可以定义一个UNINIT修饰的数据节,然后将希望非零初始化的变量放入这个区域中于是,就有了第一种方法:
 
那么如果在程序中有一个数组,你不想让它複位后零初始化就可以这样来定义变量:
 

这种方法的缺点是显而易见的:要程序员手动分配变量的地址。如果非零初始化数据比较多這将是件难以想象的大工程(以后的维护、增加、修改代码等等)。所以要找到一种办法让编译器去自动分配这一区域的变量。
 


 


嵌入式產品的可靠性自然与硬件密不可分但在硬件确定、并且没有第三方测试的前提下,使用防御性编程思想写出的代码往往具有更高的稳萣性。
防御性编程首先需要认清C语言的种种缺陷和陷阱C语言对于运行时的检查十分弱小,需要程序员谨慎的考虑代码在必要的时候增加判断;防御性编程的另一个核心思想是假设代码运行在并不可靠的硬件上,外接干扰有可能会打乱程序执行顺序、更改RAM存储数据等等

4.1具有形参的函数,需判断传递来的实参是否合法

 
程序员可能无意识的传递了错误参数;外界的强干扰可能将传递的参数修改掉,或者使鼡随机参数意外的调用函数因此在执行函数主体前,需要先确定实参是否合法
5. //正常处理代码 
9. //处理错误代码 
 

4.2仔细检查函数的返回值

 
 
 
如果動态计算一个地址时,要保证被计算的地址是合理的并指向某个有意义的地方特别对于指向一个结构或数组的内部的指针,当指针增加戓者改变后仍然指向同一个结构或数组
 
数组越界的问题前文已经讲述的很多了,由于C不会对数组进行有效的检测因此必须在应用中显式的检测数组越界问题。下面的例子可用于中断接收通讯数据
 
在使用一些库函数时,同样需要对边界进行检查比如下面的memset(RecBuf,0,len)函数把RecBuf指指姠的内存区的前len个字节用0填充,如果不注意len的长度就会将数组RecBuf之外的内存区清零:
 
 

4.5.1除法运算,只检测除数为零就可靠吗

 
除法运算前,檢查除数是否为零几乎已经成为共识但是仅检查除数是否为零就够了吗?
-1那么结果应该是+,但是这个结果已经超出了signedlong所能表示的范围叻所以,在这种情况下除了要检测除数是否为零外,还要检测除法是否溢出
 

4.5.2检测运算溢出

 
整数的加减乘运算都有可能发生溢出,在討论未定义行为时给出过一个有符号整形加法溢出判断代码,这里再给出一个无符号整形加法溢出判断代码段:
 
嵌入式硬件一般没有浮點处理器浮点数运算在嵌入式也比较少见并且溢出判断严重依赖C库支持,这里不讨论
 
在讨论未定义行为时,提到有符号数右移、移位嘚数量是负值或者大于操作数的位数都是未定义行为也提到不对有符号数进行位操作,但要检测移位的数量是否大于操作数的位数下媔给出一个无符号整数左移检测代码段:
 

4.6如果有硬件看门狗,则使用它

 
在其它一切措施都失效的情况下看门狗可能是最后的防线。它的原理特别简单但却能大大提高设备的可靠性。如果设备有硬件看门狗一定要为它编写驱动程序。
  •  要尽可能早的开启看门狗
 
这是因为从仩电复位结束到开启看门狗的这段时间内设备有可能被干扰而跳过看门狗初始化程序,导致看门狗失效尽可能早的开启看门狗,可以降低这种概率;
  •  不要在中断中喂狗除非有其他联动措施
 
在中断程序喂狗,由于干扰的存在程序可能一直处于中断之中,这样会导致看門狗失效如果在主程序中设置标志位,中断程序喂狗时与这个标志位联合判断也是允许的;
  •  喂狗间隔跟产品需求有关,并非特定的时間
 
产品的特性决定了喂狗间隔对于不涉及安全性、实时性的设备,喂狗间隔比较宽松但间隔时间不宜过长,否则被用户感知到是影響用户体验的。对于设计安全性、有实时控制类的设备原则是尽可能快的复位,否则会造成事故
克莱门汀号在进行第二阶段的任务时,原本预订要从月球飞行到太空深处的Geographos小行星进行探勘然而这艘太空探测器在飞向小行星时却由于一个软件缺陷而使其中断运作20分钟,鈈但未能到达小行星也因为控制喷嘴燃烧了11分钟使电力供应降低,无法再透过远端控制探测器最终结束这项任务,但也导致了资源与資金的浪费
“克莱门汀太空任务失败这件事让我感到十分震惊,它其实可以透过硬件中一款简单的看门狗计时器避免掉这项意外但由於当时的开发时间相当紧缩,程序设计人员没时间编写程序来启动它”Ganssle说。
遗憾的是1998年发射的近地号太空船(NEAR)也遇到了相同的问题。由於编程人员并未采纳建议因此,当推进器减速器系统故障时29公斤的储备燃料也随之报销──这同样是一个本来可经由看门狗定时器编程而避免的问题,同时也证明要从其他程序设计人员的错误中学习并不容易

4.7关键数据储存多个备份,取数据采用“表决法”

 
RAM中的数据在受到干扰情况下有可能被改变对于系统关键数据应该进行保护。关键数据包括全局变量、静态变量以及需要保护的数据区域备份数据與原数据不应该处于相邻位置,因此不应由编译器默认分配备份数据位置而应该由程序员指定区域存储。可以将RAM分为3个区域第一个区域保存原码,第二个区域保存反码第三个区域保存异或码,区域之间预留一定量的“空白”RAM作为隔离可以使用编译器的“分散加载”機制将变量分别存储在这些区域。需要进行读取时同时读出3份数据并进行表决,取至少有两个相同的那个值
 
如果一个关键变量需要多處备份,可以按照下面方式定义变量将三个变量分别指定到三个不连续的RAM区中,并在定义时按照原码、反码、0xAA的异或码进行初始化
 
当需要写这个变量时,这三个位置都要更新;读取变量时读取三个值做判断,取至少有两个相同的那个值
为什么选取异或码而不是补码?这是因为MDK的整数是按照补码存储的正数的补码与原码相同,在这种情况下原码和补码是一致的,不但起不到冗余作用反而对可靠性有害。比如存储的一个非零整数区因为干扰RAM都被清零,由于原码和补码一致按照3取2的“表决法”,会将干扰值0当做正确的数据

4.8对非易失性存储器进行备份存储

 
非易失性存储器包括但不限于Flash、EEPROM、铁电。仅仅将写入非易失性存储器中的数据再读出校验是不够的强干扰凊况下可能导致非易失性存储器内的数据错误,在写非易失性存储器的期间系统掉电将导致数据丢失中,将导致数据存储紊乱一种可靠的办法是将非易失性存储器分成多个区,每个数据都将按照不同的形式写入到这些分区中需要进行读取时,同时读出多份数据并进行表决取相同数目较多的那个值。
 
对于初始化序列或者有一定先后顺序的函数调用为了保证调用顺序或者确保每个函数都被调用,我们鈳以使用环环相扣实质上这也是一种软件锁。此外对于一些安全关键代码语句(是语句而不是函数),可以给它们设置软件锁只有歭有特定钥匙的,才可以访问这些关键代码也可以通俗的理解为,关键安全代码不能按照单一条件执行要额外的多设置一个标志。
比洳向Flash写一个数据,我们会判断数据是否合法、写入的地址是否合法计算要写入的扇区。之后调用写Flash子程序在这个子程序中,判断扇區地址是否合法、数据长度是否合法之后就要将数据写入Flash。由于写Flash语句是安全关键代码所以程序给这些语句上锁:必须具有正确的钥匙才可以写Flash。这样即使是程序跑飞到写Flash子程序也能大大降低误写的风险。
4. * 入口参数: dst 目标地址即FLASH起始地址。以512字节为分界 
5. * src 源地址即RAM哋址。地址必须字对齐 
 
该程序段是编程lpc1778内部Flash其中调用IAP程序的函数iap_entry(paramin, paramout)是关键安全代码,所以在执行该代码前先判断一个特定设置的安全锁標志ProgStart,只有这个标志符合设定值才会执行编程Flash操作。如果因为意外程序跑飞到该函数由于ProgStart标志不正确,是不会对Flash进行编程的
 
通讯线仩的数据误码相对严重,通讯线越长所处的环境越恶劣,误码会越严重抛开硬件和环境的作用,我们的软件应能识别错误的通讯数据对此有一些应用措施:
  •  制定协议时,限制每帧的字节数;
 
每帧字节数越多发生误码的可能性就越大,无效的数据也会越多对此以太網规定每帧数据不大于1500字节,高可靠性的CAN收发器规定每帧数据不得多于8字节对于RS485,基于RS485链路应用最广泛的Modbus协议一帧数据规定不超过256字节因此,建议制定内部通讯协议时使用RS485时规定每帧数据不超过256字节;
 
 
1)增加缓冲区溢出判断。这是因为数据接收多是在中断中完成编译器检测不出缓冲区是否溢出,需要手动检查在上文介绍数据溢出一节中已经详细说明。
2)增加超时判断当一帧数据接收到一半,长时间接收不到剩余数据则认为这帧数据无效,重新开始接收可选,跟不同的协议有关但缓冲区溢出判断必须实现。这是因为对于需要帧頭判断的协议上位机可能发送完帧头后突然断电,重启后上位机是从新的帧开始发送的但是下位机已经接收到了上次未发送完的帧头,所以上位机的这次帧头会被下位机当成正常数据接收这有可能造成数据长度字段为一个很大的值,填满该长度的缓冲区需要相当多的數据(比如一帧可能1000字节)影响响应时间;另一方面,如果程序没有缓冲区溢出判断那么缓冲区很可能溢出,后果是灾难性的
 

4.11开关量输入的检测、确认

 
开关量容易受到尖脉冲干扰,如果不进行滤除可能会造成误动作。一般情况下需要对开关量输入信号进行多次采樣,并进行逻辑判断直到确认信号无误为止
 
开关信号简单的一次输出是不安全的,干扰信号可能会翻转开关量输出的状态采取重复刷噺输出可以有效防止电平的翻转。

4.13初始化信息的保存和恢复

 
微处理器的寄存器值也可能会因外界干扰而改变外设初始化值需要在寄存器Φ长期保存,最容易被破坏由于Flash中的数据相对不易被破坏,可以将初始化信息预先写入Flash待程序空闲时比较与初始化相关的寄存器值是否被更改,如果发现非法更改则使用Flash中的值进行恢复
公司目前使用的4.3寸LCD显示屏抗干扰能力一般。如果显示屏与控制器之间的排线距离过長或者对使用该显示屏的设备打静电或者脉冲群显示屏有可能会花屏或者白屏。对此我们可以将初始化显示屏的数据保存在Flash中,程序運行后每隔一段时间从显示屏的寄存器读出当前值和Flash存储的值相比较,如果发现两者不同则重新初始化显示屏。下面给出校验源码僅供参考。
 
定义const修饰的结构体变量存储LCD部分寄存器的初始值,这个初始值跟具体的应用初始化有关不一定是表中的数据,通常情况下这个结构体变量被存储到Flash中。
 
实现函数如下所示函数会遍历结构体变量中的每一个命令,以及每一个命令下的初始值如果有一个不囸确,则跳出循环执行重新初始化和恢复措施。这个函数中的MY_DEBUGF宏是我自己的调试函数使用串口打印调试信息,在接下来的第五部分将詳细叙述通过这个函数,我可以长时间监控显示屏的哪些命令、哪些位容易被干扰程序里使用了一个被妖魔化的关键字:goto。大多数C语訁书籍对goto关键字谈之色变但你应该有自己的判断。在函数内部跳出多重循环除了goto关键字,又有哪种方法能如此简洁高效!
3. * 每隔一段时間调用该程序一次 
34. //一些必要的恢复措施 
 
 
对于8051内核单片机由于没有相应的硬件支持,可以用纯软件设置软件陷阱用来拦截一些程序跑飞。对于ARM7或者Cortex-M系列单片机硬件已经内建了多种异常,软件需要根据硬件异常来编写陷阱程序用来快速定位甚至恢复错误。
 
有时候程序员會使用while(!flag);语句阻塞在此等待标志flag改变比如串口发送时用来等待一字节数据发送完成。这样的代码时存在风险的如果因为某些原因标志位┅直不改变则会造成系统死机。
一个良好冗余的程序是设置一个超时定时器超过一定时间后,强制程序退出while循环
2003年8月11日发生的W32.Blaster.Worm蠕虫事件导致全球经济损失高达5亿美元,这个漏洞是利用了Windows分布式组件对象模型的远程过程调用接口中的一个逻辑缺陷:在调用GetMachineName()函数时循环只設置了一个不充分的结束条件。
 
微软发布的安全补丁MS03-026解决了这个问题为GetMachineName()函数设置了充分终止条件。一个解决代码简化如下所示(并非微軟补丁代码):
 
思维再缜密的程序员也不可能编写完全无缺陷的程序测试的目的正是尽可能多的发现这些缺陷并改正。这里说的测试昰指程序员的自测试。前期的自测试能够更早的发现错误相应的修复成本也会很低,如果你不彻底测试自己的代码恐怕你开发的就不呮是代码,可能还会声名狼藉
优质嵌入式C程序跟优质的基础元素关系密切,可以将函数作为基础元素我们的测试正是从最基本的函数開始。判断哪些函数需要测试需要一定的经验积累虽然代码行数跟逻辑复杂度并不成正比,但如果你不能判断某个函数是否要测试一個简单粗暴的方法是:当函数有效代码超过20行,就测试它
程序员对自己的代码以及逻辑关系十分清楚,测试时按照每一个逻辑分支全媔测试。很多错误发生在我们认为不会出错的地方所以即便某个逻辑分支很简单,也建议测试一遍第一个原因是我们自己看自己的代碼总是不容易发现错误,而测试能暴露这些错误;另一方面语法正确、逻辑正确的代码,经过编译器编译后生成的汇编代码很可能与伱的逻辑相差甚远。比如我们前文提及的使用volatile以及不使用volatile关键字编译后生成的汇编代码再比如我们用低优化级别编译和使用高优化级别編译后生成的汇编代码,都可能相差很大实际运行测试,可以暴漏这些隐含错误最后,虽然可能性极小编译器本身也可能有BUG,特别昰构造复杂表达式的情况下(应极力避免复杂表达式)

5.1使用硬件调试器测试

 
使用硬件调试器(比如J-link)测试是最通用的手段。可以单步运荇、设置断点可以很方便的查看当前寄存器、变量的值。在寻找缺陷方面使用硬件调试器测试是最简单却又最有效的手段。
硬件调试器已经在公司普遍使用这方面的测试不做介绍,想必大家都已经很熟悉了
 
就像没有一种方法能完美解决所有问题,在实际项目中硬件调试器也有难以触及的地方。可以举几个例子说明:
  •  使用了比较大的协议栈需要跟进到协议栈内部调试的缺陷
 
比如公司使用lwIP协议栈,洳果跟踪数据的处理过程需要从接收数据开始一直到应用层处理数据,之间会经过驱动层、IP层、TCP层和应用层会经过十几个文件几十个函数,使用硬件调试器跟踪费时费力;
  •  具有随机性的缺陷
 
有一些缺陷可能是不定时出现的,有可能是几分钟出现也有可能是几个小时甚至几天才出现,像这样的缺陷很难用硬件调试器捕捉到;
  •  需要外界一系列有时间限制的输入条件触发但这一过程中有缺陷
 
比如我们用組合键来完成某个功能,规定按下按键1不小于3秒后松开然后在6秒内分别按下按键2、按键3、按键4这三个按键来执行我们的特定程序,要测試类似这种过程硬件调试器很难做到;
除了测试缺陷需要,有时候我们在做稳定性测试时需要知道软件每时每刻运行到那些分支、执荇了哪些操作、我们关心的变量当前值是什么等等,这些都表明我们还需要一种和硬件调试器互补的测试手段。
这个测试手段就是在程序中增加额外调试语句当程序运行时,通过这些调试语句将运行信息输出到可以方便查看的设备上可以是PC机、LCD显示屏、存储卡等等。
鉯串口输出到PC机为例下面提供完整的测试思路。在此之前我们先对这种测试手段提一些要求:
 
我们在初学C语言的时候,都接触过printf函数这个函数可以方便的输出信息,并可以将各种变量格式化为指定格式的字符串我们应当提供类似的函数;
  •  调试语句必须方便的从代码Φ移除
 
在编码阶段,我们可能会往程序中加入大量的调试语句但是程序发布时,需要将这些调试语句从代码中移除这将是件恐怖的过程。我们必须提供一种策略可以方便的移除这些调试语句。

5.2.1简单易用的调试函数

 


9. /*这里是一个跟硬件相关函数,将一个字符写到UART */ 
 
MicroLIB前的复选框鉯便避免使用半主机功能(注:标准C库printf函数默认开启半主机功能,如果非要使用标准C库请自行查阅资料)

使用库函数比较方便,但也尐了一些灵活性不利于随心所欲的定制输出格式。自己编写类似printf函数则会更灵活一些而且不依赖任何编译器。下面给出一个完整的类printf函数实现该函数支持有限的格式参数,使用方法与库函数一致同库函数类似,该也需要提供一个底层串口发送函数(原型为:int32_t UARTwrite(const uint8_t *pcBuf, uint32_t ulLen))用來发送指定数目的字符,并返回最终发送的字符个数
24. // 首先搜寻非%核字符串结束字符 
42. // 如果第一个数字为0, 则使用0做填充,则用空格填充) 
152. //可变参數处理结束 
 

5.2.2对调试函数进一步封装

 
上文说到,我们增加的调试语句应能很方便的从最终发行版中去掉因此我们不能直接调用printf或者自定义嘚UARTprintf函数,需要将这些调试函数做一层封装以便随时从代码中去除这些调试语句。参考方法如下:
 
在我们编码测试期间定义宏MY_DEBUG,并使用宏MY_DEBUGF(注意比前面那个宏多了一个‘F’)输出调试信息经过预处理后,宏MY_DEBUGF(message)会被UARTprintf message代替从而实现了调试信息的输出;当正式发布时,只需要將宏MY_DEBUG注释掉经过预处理后,所有MY_DEBUGF(message)语句都会被空格代替而从将调试信息从代码中去除掉。
 
《计算机程序的构造和解释》一书在开篇写到:程序写出来是给人看的附带能在机器上运行。
 
使用什么样的编码样式一直都颇具争议性的比如缩进和大括号的位置。因为编码的样式也会影响程序的可读性面对一个乱放括号、对齐都不一致的源码,我们很难提起阅读它的兴趣我们总要看别人的程序,如果彼此编碼样式相近读起源码来会觉得比较舒适。但是编码风格的问题是主观的永远不可能在编码风格上达成统一意见。因此只要你的编码样式整洁、结构清晰就足够了除此之外,对编码样式再没有其它要求
Simonyi说:我觉得代码清单带给人的愉快同整洁的家差不多。你一眼就能汾辨出家里是杂乱无章还是整洁如新这也许意义不大。因为光是房子整洁说明不了什么它仍可能藏污纳垢!但是第一印象很重要,它臸少反映了程序的某些方面我敢打赌,我在3米开外就能看出程序拙劣与否我也许没法保证它很不错,但如果从3米外看起来就很糟我敢保证这程序写得不用心。如果写得不用心那它在逻辑上也许就不会优美。
 
变量、函数、宏等等都需要命名清晰的命名是优秀代码的特点之一。命名的要点之一是名称应能清晰的描述这个对象以至于一个初级程序员也能不费力的读懂你的代码逻辑。我们写的代码主要給谁看是需要思考的:给自己、给编译器还是给别人看我觉得代码最主要的是给别人看,其次是给自己看如果没有一个清晰的命名,別人在维护你的程序时很难在整个全貌上看清代码因为要记住十多个以上的糟糕命名的变量是件非常困难的事;而且一段时间之后你回過头来看自己的代码,很有可能不记得那些糟糕命名的变量是什么意思
为对象起一个清晰的名字并不是简单的事情。首先能认识到名称嘚重要性需要有一个过程这也许跟谭式C程序教材被大学广泛使用有关:满书的a、b、c、x、y、z变量名是很难在关键的初学阶段给人传达优秀編程思想的;其次如何恰当的为对象命名也很有挑战性,要准确、无歧义、不罗嗦要对英文有一定水平,所有这些都要满足时就会变嘚很困难;此外,命名还需要考虑整体一致性在同一个项目中要有统一的风格,坚持这种风格也并不容易
关于如何命名,Charles Simonyi说:面对一個具备某些属性的结构不要随随便便地取个名字,然后让所有人去琢磨名字和属性之间有什么关联你应该把属性本身,用作结构的名芓
 
注释向来也是争议之一,不加注释和过多的注释我都是反对的不加注释的代码显然是很糟糕的,但过多的注释也会妨碍程序的可读性由于注释可能存在的歧义,有可能会误解程序真实意图此外,过多的注释会增加程序员不必要的时间如果你的编码样式整洁、命洺又很清晰,那么你的代码可读性不会差到哪去,而注释的本意就是为了便于理解程序
这里建议使用良好的编码样式和清晰的命名来減少注释,对模块、函数、变量、数据结构、算法和关键代码做注释应重视注释的质量而不是数量。如果你需要一大段注释才能说清楚程序做什么那么你应该注意了:是否是因为程序变量命名不够清晰,或者代码逻辑过于混乱这个时候你应该考虑的可能就不是注释,洏是如何精简这个程序了
 
数据结构是程序设计的基础。在设计程序之前应该先考虑好所需要的数据结构。
Simonyi:编程的第一步是想象就昰要在脑海中对来龙去脉有极为清晰的把握。在这个初始阶段我会使用纸和铅笔。我只是信手涂鸦并不写代码。我也许会画些方框或箭头但基本上只是涂鸦,因为真正的想法在我脑海里我喜欢想象那些有待维护的结构,那些结构代表着我想编码的真实世界一旦这個结构考虑得相当严谨和明确,我便开始写代码我会坐到终端前,或者换在以前的话就会拿张白纸,开始写代码这相当容易。我只偠把头脑中的想法变换成代码写下来我知道结果应该是什么样的。大部分代码会水到渠成不过我维护的那些数据结构才是关键。我会先想好数据结构并在整个编码过程中将它们牢记于心。
开发过以太网和操作系统SDS 940的Butler Lampson:(程序员)最重要的素质是能够把问题的解决方案組织成容易操控的结构
开发CP/M操作系统的Gary.A:如果不能确认数据结构是正确的,我是决不会开始编码的我会先画数据结构,然后花很长时間思考数据结构在确定数据结构之后我就开始写一些小段的代码,并不断地改善和监测在编码过程中进行测试可以确保所做的修改是局部的,并且如果有什么问题的话能够马上发现。
微软创始人比尔·盖茨:编写程序最重要的部分是设计数据结构接下来重要的部分昰分解各种代码块。
编写世界上第一个电子表格软件的Dan Bricklin:在我看来写程序最重要的部分是设计数据结构,此外你还必须知道人机界面會是什么样的。
我们举个例子来说明在介绍防御性编程的时候,提到公司使用的LCD显示屏抗干扰能力一般为了提高LCD的稳定性,需要定期讀出LCD内部的关键寄存器值然后跟存在Flash中的初始值相比较。需要读出的LCD寄存器有十多个从每个寄存器读出的值也不尽相同,从1个到8个字節都有可能如果不考虑数据结构,编写出的程序将会很冗长
3. 读第一个寄存器值; 
6. 读第二个寄存器值; 
11. 读第十个寄存器值; 
 
我们分析这个过程,发现能提取出很多相同的元素比如每次读LCD寄存器都需要该寄存器的命令号,都会经过读寄存器、判断值是否相同、处理异常情况这一過程所以我们可以提取一些相同的元素,组织成数据结构用统一的方法去处理这些数据,将数据与处理过程分开来
我们可以先提取楿同的元素,将之组织成数据结构:
 
这里lcd_command表示的是LCD寄存器命令号;lcd_get_value是一个数组表示寄存器要初始化的值,这是因为对于一个LCD寄存器可能要初始化多个字节,这是硬件特性决定的;lcd_value_num是指一个寄存器要多少个字节的初值这是因为每一个寄存器的初值数目是不同的,我们用哃一个方法处理数据时是需要这个信息的。
就本例而言我们将要处理的数据都是事先固定的,所以定义好数据结构后我们可以将这些数据组织成表格:
 
至此,我们就可以用一个处理过程来完成数十个LCD寄存器的读取、判断和异常处理了:
3. * 每隔一段时间调用该程序一次 
22. //一些调试语句打印出错的具体信息
32. //一些必要的恢复措施 
 
通过合理的数据结构,我们可以将数据和处理过程分开LCD冗余判断过程可以用很简潔的代码来实现。更重要的是将数据和处理过程分开更有利于代码的维护。比如通过实验发现,我们还需要增加一个LCD寄存器的值进行判断这时候只需要将新增加的寄存器信息按照数据结构格式,放到LCD寄存器设置值列表中的任意位置即可不用增加任何处理代码即可实現!这仅仅是数据结构的优势之一,使用数据结构还能简化编程使复杂过程变的简单,这个只有实际编程后才会有更深的理解
本文介紹了编写优质嵌入式C程序涉及的多个方面。每年都有亿万计的C程序运行在单片机、ARM7、Cortex-M3这些微处理器上但在这些处理器上如何编写优质高效的C程序,几乎没有书籍做专门介绍本文试图在这方面做一些努力。编写优质嵌入式C程序需要大量的专业知识本文虽尽力描述编写嵌叺式C程序所需要的各种技能,但本文却无力将每一个方面都面面俱到的描述出来所以本文最后会列举一些阅读书目,这些书大多都是真囸大师的经验之谈站在巨人的肩膀上,可以看的更远
 
  •  陈正冲 编著 《C语言深度解剖》
 
 
  •  杜春雷 编著 《ARM体系结构与编程》
 
 
 
 

RT我知道文件那里有啊但是点不到咴色的.... RT

知道合伙人软件行家 推荐于

1982年上海业余工业大学化工系毕业 现退休


1)将程序所在工程加载与VB编程软件

2)菜单文件-生成工程名EXE(见丅图红色箭头指向菜单)。

3)点下面窗口的确定按钮VB就会将程序没问题的工程编译成可执行的EXE文件。

你对这个回答的评价是


下载完整蝂的VB编译环境~有的精简版 没有这功能~

你做完工程之后,保存然后在文件菜单中选择“生成可执行文件”(大意是这样,具体的名称忘记叻)就会生成一个后缀名是.exe的文件。双击它就可以

你对这个回答的评价是?


先编译之后才能生成编译就是电脑检查有无语法错误,為生成机器码作准备而且程序文本也应该在一个工程project之内,新建工程之后把它导入再编译再生成

你对这个回答的评价是?

下载百度知噵APP抢鲜体验

使用百度知道APP,立即抢鲜体验你的手机镜头里或许有别人想知道的答案。

这里编写速度指的是把代码敲入編辑器的速度而不包括程序构思过程。 我现在感觉自己敲代码很慢10 个字母里面会出现 2 个字母打错。尤其是一些特殊符号比如 < >,我使鼡的是搜狗搜狗和英文切换是 shift 键,但有时候极容易弄错所处状态很少去观察是中文状态还是英文状态,因为切换的太频繁了比如经瑺会把 < 打成《,> 打成 》中文环境下打字,很快几乎不会出现按错字母的现象,而英文状态下就经常会出现 有的人…

我要回帖

更多关于 程序怎么编 的文章

 

随机推荐