数字电子元件日益普及,应用深入到生活的方方面面,从移动电话和平板电脑、健康监测仪和家庭数字助理,到互联网和电信基础设施、数据中心、运输管理和线传飞控系统,均有涉及。随着我们在日常生活中越来越依赖这些产品,我们也越来越多地注意到产品中使用的电子元器件的可靠性带来的问题。
定义可靠性和MTBF
面对这一趋势,设计工程师们在元器件选择过程中越来越注重可靠性,纷纷利用元器件供应商提供的平均故障间隔时间(MTBF)等重要数据点制定设计决策,也就不足为奇了。尽管MTBF可以作为评估可靠性的一个实用指标,尤其是在比较多家供应商的元器件时,但很多人会落入一个圈套,误将MTBF数据直接等同于元器件的预期寿命。鉴于在电子设计中围绕这一问题存在许多错误观念,因此务必要反复审视电子元件可靠性与使用寿命的联系。可靠性的定义是单独一套产品在规定条件下能够正常运行达到指定时长的概率。它可以采用统计数据表达如下:R(t) = e-λt其中,λ表示固有故障率,不包括初期故障(早期故障)和磨损故障(寿命终点)。因而可靠性是在下图所示常见故障率曲线的中央平直部分发生故障的概率。
图1:故障率曲线显示了从寿命起点到终点的故障趋势λ的倒数1/λ给出了修复前平均时间(MTTF),这一概念更为常见的表述是平均故障间隔时间(MTBF),在电力行业尤其常用。人们会倾向于认为计算MTBF就能得出产品的一般预期寿命,但这只是一种常见的错误观念。
如何解读MTBF和可靠性
设想一个元器件的固有故障率(λ)为10-6次故障/小时。尽管MTBF为100万小时,但R(t) = e-λt曲线(如下图所示)告诉我们,统计表明只有36.7%的装置有可能运行这么久。60.6%的装置预计能够运行500,000小时,而我们可以进一步预计有90.5%的装置寿命能够持续100,000小时。
图2:元器件能够在计算得出的整个MTBF期间持续运行的概率仅为36.7%
得出各元器件的这个信息之后,我们必须将构成系统的所有元器件各自的故障率相加,从而了解整个产品能够持续运转的时间(λA = λ1n1 + λ2n2 + … + λini)。显然,系统的可靠性可能不如其中最不可靠的元器件。对于设计者而言,着重优化较薄弱的元器件会带来收益。从中得出的重要信息是,MTBF虽然是分析和比较产品和元器件的可靠依据,但不应被当作预期寿命的直接表述。对于数字产品可靠性的要求如今已经交织在生活和工作之中,并且该要求将不断提高。我们这个行业能够清晰地沟通我们产品相关的可靠性、MTBF和实际寿命预期,帮助设计者获得更好的设计体验。