adminftp 发表于 2005-8-31 09:03

[转帖]二十世纪留给二十一世纪可靠性工程热点问题

<P>一、对可靠性定义再认识</P>
<P>    可靠性通常被定义为:“产品在规定的条件下和规定的时间内,完成规定功能的能力”或定义为:“在规定的条件下和规定时间内所允许的故障数。”数学表达式为平均故障间隔时间(MTBF)。这就认为随机故障是不可避免的,也是可以接受的。这就导致由于设计原因引起的故障只要在允许数之内,往往不能追溯到最终根源。由于制造过程导致的故障,只要仍低于许可的故障数也就不被追究。为此,在国际上早在1995年对这传统的可靠性定义提出了质疑,在欧洲开始用无维修使用期(MFOP)取代原先的MTBF,故障率浴盆曲线分布规律也就被打破。由此,摒弃随机失效无法避免的旧观念。因此,当前国际上兴起的在可靠工程中推行失效物理方法的新潮流,设计出不存在随机失效的产品并非没有可能。同时,从故障修理转换到计划预防维修。这就需要产品研发设计人员必须清楚产品将会怎样发生故障,一般何时发生故障。?</P>
<P>    要做到《无维修使用期》必须作好如下两项工作:?</P>
<P>1、改变可靠性设计思路?<BR>    以自下而上的可靠性设计方法,取代采用MTBF进行自上而下分配方法。当产品系统构思和设计完成之后,单元的设计师们应在设计前充分了解单元,模块的环境条件,可能发生故障的关键部及故障模式、机理、在设计时重点加以解决,且自下而上可能存在的可靠性问题都得到彻底解决,不仅可以将系统可靠性建立在踏实的基础上,而且可以确保系统的可靠性指标留有充分的余地。同时避免因设计后期发现问题再进行更改设计,不仅费时,且效果不好,重点可采取如下设计措施:?</P>
<P>    采用状态监控,故障诊断和故障预测设计;?<BR>    引入容错和冗余设计?<BR>    可重构性设计?<BR>    动态设计?<BR>    故障软化设计?<BR>    环境防护设计?<BR>    冗余设计?<BR>    在任务能力不受影响下,留出可接受的降级水平设计等。 </P>
<P>2、改变可靠性工程工作方法?<BR>    为了达到产品无维修使用周期,必须把人力、精力集中于产品研发早期阶段,只有从项目开始第一天就强调可靠性,才能真正落实自下而上的可靠性设计方法。早期明了产品的核心单元和薄弱环节,开展失效物理方法工作,采取有效纠正与预防措施,才能做到“无维修使用期”。为此,应做如下工作:?</P>
<P>    失效物理分析、研究与应用?<BR>    开展可靠性研制试验,及早暴露设计缺陷,采取有效纠正措施。?<BR>    开展高加速应力试验(HAST),暴露产品薄弱环节予以纠正?<BR>    严格设计评审制度,消除设计隐患?<BR>    制订合理预防维修计划并予以实施。?</P>
<P>二、关于可靠性指标体系及其验证 ?</P>
<P>    当前电子产品普遍用平均故障间隔时间MTBF来表征。MTBF是产品基本可靠性指标。在可靠性预计时,以串联模型为基础,但用户最关心的是任务可靠性,即平均致命故障间隔时间MTBCF,在军品合同中都签的是MTBF,在进行可靠性指标验证试验时,都是以MTBF为依据。这出现了对故障的认识问题,一般都把可靠性验证试验中产品的存在状态简化为“二元状态”处理,即认为产品要么能完成规定功能,视为成功;要么不能完成规定功能,视为故障,非此即彼。故障统计也比较简单,要么为0,要么为1,对故障既不分类,也不加权,这在工程实施显然存在问题。大量事实证明,产品的不同故障造成的影响也不同。有的后果严重,损失很大(如雷达产品发射机的磁控管或行波管等),有的后果轻微(如指示灯失效,显示器画面瞬时抖动等),损失很小。如果把这些后果严重程度不同的故障,等同看待,客观上是不合理的,与实际情况也是不相符的。在产品可靠性验证与评价中,在确认故障,采用什么方法对故障数据进行处理,直接关系到产品的生存和发展。如果这个问题处理不当,就有可能把本来具有发展潜力的健壮设计,冗余设计扼杀在研制早期。因此,早在70年代美国在地面产品广泛地采用故障加权,但由于这种方法存在着主观的随意性和评估结果,不确定性,并且在理论上还存在一些具体问题难以解释。所以,在1980年美军标准MIL-STD-785B颁布后,故障加权处理方法被取缔,虽然785B标准取缔了故障加权问题,但对产品可靠性验证中出现的故障“二元状态”处理不合理和存在问题如何解决?所以,以美国陆军为首的一些部门和专家研究所得的验证方案,就是把产品可靠性指标细化分解。分别验证,如把地面武器装备任务状态区分以下五种加以考核。?</P>
<P>    能圆满完成任务(Missionworthy)?<BR>    在规定时间内排除故障后能完成任务(Missionworthy)?<BR>    能完成任务,但性能降低(Missionworthy impaired)?<BR>    不能完成任务(Non-missionworthy)?<BR>    不能完成任务,失去机动能力(Non-mission-worthy) ?</P>
<P>    把可靠性指标分解,表面看来是合理的,但又如何将这些指标进行分配和预计及如何进行可靠性设计,问题并非有些文章说的那么简单,所以美军于1986年10月17日发布的MIL-STD-7810《工程研制鉴定和生产可靠性试验》正式文本中,首次提出在可靠性验证中按后果严重程度把发生故障区分为:致命故障,严重故障和轻度故障三类,这就意味着根据故障严重程度可以进行加权处理,美军MI坦克就是这样做的。?</P>
<P>    我们国家有标准可查的就有近20种门类产品对故障进行加权处理,在军品方方面面《地面雷达可靠性试验方法》率先提出,在民品原邮电部的YD282-1982《邮电通信设备可靠性通用试验方法》,率先提出故障加权问题,尽管有些门类产品明文中没有提出故障加权问题,但在实际试验中也在进行故障加权方案,只不过各自故障加权权数不同而已。目前对故障加权有争议,该如何对待此问题这是二十世纪留给二十一世纪应尽快解决的问题。?</P>

adminftp 发表于 2005-8-31 09:03

回复:(beyond)[转帖]二十世纪留给二十一世纪可靠性...

<P>三、改变传统只重视硬件可靠性设计思路 加强软件可靠性设计 ?</P>
<P>    随着社会日益信息化,社会的日常运行越来越依赖于软件的电子系统,当前电子系统(或设备)软件功能较硬件功能占系统功能比例越来越高,通讯产品可占50%以上。但目前人们只重视硬件可靠性,而对软件可靠性很“漠然”,虽然软件故障频繁发生,危害很大,但在开展可靠性工程工作时,对软件可靠性提及甚少,原因有二:一是开展软件可靠性工作较晚。在国际上虽然在二十世纪六十年代后期就已开始,但软件可靠性工程概念在八十年代末提出,时至今日软件的有关技术还不够成熟,还有许多问题有待研究,在我国八十年代才有极小数专家从事分散、零星的研究,进入九十年代软件可靠性工程一词才出现,目前正处于软件可靠性理论研究向工程应用过渡时期,二十一世纪要解决的是如何像硬件可靠性技术一样,软件可靠性工程技术在产品研发中被广泛应用。二是软件可靠性技术较为复杂,研究和应用难度较大,其中有如下几个方面:?</P>
<P>    A.可靠性模型非指数分布,一般属于正态分布或威布尔分布,可靠性数字模型建立难度很大;?<BR>    B.可靠性指标确定多样化;?<BR>    C.标的实现、测试、评估和验证、模式不确定性;?<BR>    D.电子设备的软件可靠性很难与硬件可靠性剥离。有些软件故障是由硬件设计缺隐和故障所引发的。?<BR>开展软件可靠性工程主要有以下工作:?<BR>    A.建立可靠性模型;?<BR>    B.确定系统软件可靠性指标;?<BR>    C.进行软件可靠性指标分配;?<BR>    D.进行可靠性指标预计;?<BR>    E.软件可靠性设计;?<BR>      防错设计?<BR>      容错设计?<BR>      标错设计?<BR>      纠错设计?<BR>      故障恢复设计等?<BR>    F软件可靠性分析:?<BR>      软件失效模式影响分析(SFMEA)?<BR>      软件故障树分析(SFTA)?<BR>      Pertri网分析法?</P>
<P>    G软件可靠性验证。软件可靠性一般都是通过软件可靠性测试,评估已达到软件可靠性水平,来加以验证。国内外有些专家认为由于软件故障过程的随机性和软件验收测试期间不对软件进行修改,因此可以认为软件可靠性服从指数分布,在这情况下,就可参考GJB899《可靠性鉴定与验收试验》来确定软件可靠性验收准则。<BR>?<BR>四、改变传统的电子产品结构设计观念 实施集成化结构设计 ?</P>
<P>    传统的电子产品结构设计,按标准进行结构设计,能将模块或插件紧密的装进框架内,能缓冲减振即可,但伴随科学技术发展,这是远远不够的。为了提高产品可靠性,结构设计应改变这种传统的结构设计观念和做法,而应实施集成化结构设计,所谓集成化结构设计如上公式所示:?</P>
<P>电子产品结构设计=机械件可靠性设计+热设计+EMC设计+维修性设计+三防设计上述诸设计因素中,不是简单的相加,因为它们既有统一一面,也有矛盾一面,需要进行权衡优化设计。?</P>
<P><BR>    上述诸设计因素中,机械件可靠性设计难度最大,国内外还都在进行探索,机械件可靠性设计的基本途径概括为:?<BR>    A.无故障设计与耐久性设计相结合?<BR>    B.系统可靠性设计与零部件可靠性设计相结合?<BR>    C.传统设计与可靠性设计相结合?<BR>    D.定性设计与定量设计相结合?<BR>    E.机械件可靠性设计与成本设计相结合?<BR>    F.机械件可靠性设计与电路可靠性设计相结合?</P>
<P>    研究机械件可靠性,必须把握其特殊性,紧密结合工程实际,有针对性地研究机械可靠性的分析方法与设计方法。?</P>
<P>五、开拓质量与可靠性管理新思路推行IPPD管理 ?</P>
<P>    我于1995年末,在美国考察时曾拜访了世界著名的质量管理专家——朱兰博士,当谈及质量管理新趋势时,他纵观世界经济发展史断言:“二十世纪是一个生产的世纪……二十一世纪将是一个质量的世纪……集团公司将在质量的波涛中经受考验,人们将在质量大堤下生活……世界和美国在质量管理上都在变革,质量管理不再是单个烟囱”。这些话言简意深,值得我们深思,最近我翻看了一下美国国防部研制试验、系统工程与评价局系统工程副局长Mark schaeffer在空间与国防工业质量讨论会上的讲话《美国质量管理的过去,现在与未来》他总结美国质量管理的三个阶段:</P>
<P>    (1)早期阶段,推行质量检验;<BR>    (2)80年代,质量重点转移,推行TQM(Totac Quality Management);<BR>    (3)90年代;重点抓产品研发设计,推行IPPD。讲话中还谈到:“今天的质量是面向预防和过程驱动,从而使质量的全部职责由质量专业人员转移到机构中的每一个人。质量不再是“单个烟囱”式的学科。而质量必须是工程,制造软件编程和产品维护的一个综合要素。质量必须是商务活动的组成部份。推行IPPD的实施强调并行工作和协作精神,从产品设计开始,来自设计、制造、试验、使用和保障等各方面的人员(包括可靠性及维修性人员)组成多学科的综合产品组(IPT),协同工作,所有人员都要了解产品的总目标和技术要求,统一考虑并共同解决各学科问题。这种管理方法确保R&amp;M&amp;S(包括测试性、保障性和安全性),从设计一开始就与传统的性能一起设计到产品中去,避免出现“两张皮”的问题。?</P>
<P>    IPPD的实施强调用户参与,以确保用户的要求,从产品设计开始,用户代表便作为IPT的成员参与设计,使每一个IPT成员都充分了解用户的要求,特别是用户对R&amp;M&amp;S的要求,把用户要求转换成产品设计和过程的技术要求。并把这些要求设计到产品中。美商独资企业旭电(苏州)科技有限公司,他们成功的推行IPPD管理,成立了客户专属团队CFT(相当于IPT)。他们都有一个项目经理作为召集人,由来自质量、制造、工程、测试、业务、物料等不同部门的全职为CFT服务的人员组成。他们的共同目标是使客户满意,达到公司目标。?</P>
<P>    IPPD管理是质量观从传统质量观向现代质量观转变的结晶。传统质量观单纯追求技术性能,着眼于缺陷纠正,在管理上以“产品符合生产图低和工艺规程要求”,实施“检验”手段来保证产品质量,俗称“事后把关”。现代质量观追求产品“长期保持良好性能”和“最佳寿命周期费用”,着眼于缺陷的预防。在管理上实施“三全管理”,即:全过程、全员、全方位(性能、可靠性、维修性、经济性、安全性、保障性等)。由于世界各国尤其是经济发达国家早已完成这种质量观转变,因而纷纷推行IPPD管理,如美国、英国、法国、日本等国,我国一些外资企业也开展了这项工作。?<BR>要作好IPPD管理,必须作好如下工作:?</P>
<P>    A.在产品研发一开始就要树立将质量与可靠性设计到产品中去的思想,在分案设计时就应组织IPT小组。?<BR>    B.解决如何把技术性、可靠性、维修性、测试性、保障性、经济性、安全性等统一权衡优化,并行设计到产品中去的技术问题。?<BR>    C.开展网络化管理,加强可靠性与质量监控工作。?<BR>    D.使IPT有效工作,必须加强团队合作精神,更重要的是“沟通”,“沟通”的核心问题是如何将数据转换成有用的信息,使IPT小组更好工作。<BR>?<BR>六、开辟可靠性管理新模式 实施网络化管理 ?</P>
<P>    可靠性管理是可靠性工程组成部分,占有很重要地位,有人曾讲;“产品可靠性是设计出来的、制造出来的和管理出来的……”。可靠性管理是伴随着可靠性工程发展而发展,纵观可靠性工程发展史不难看出可靠性管理的发展历程。美国是可靠性工程兴起最早和发展最快的国家之一,具有代表性。?<BR>    50年代是美国可靠性兴起和形成年代。为了解决军用电子设备和复杂导弹系统的可靠性问题,开展了可靠性技术研究,成立了军用电子设备可靠性咨询组(AGREE),开展了全面的可靠性发展计划,但可靠性管理还未提到议事日程。(编者注,我国在当时苏联的帮助下也在57年建成“可靠性与环境试验研究所”即现在的广州电子五所)。?</P>
<P>    60年代是美国可靠性工程全面发展的阶段,也是美国武器系统研制全面贯彻可靠性大纲的年代。</P>
<P>    在这10年中对重点武器装备系统开始了可靠性管理,形成了一套可靠性设计、试验和管理标准,如MIL-HDBK-217、MIL-STD-781和MIL-STD-785等。在工业界和各企业中对重点工程和重点可靠性工作项目实施“单点”管理。?<BR>70年代是美国可靠性发展步入成熟阶段。主要特点是建立集中统一的可靠性管理机构,负责组织协调国防部范围内的可靠性政策、标准、手册和重大研究课题等,成立全国数据网。工业部门和各企业也纷纷成立可靠性管理组织机构。从产品可靠性指标分配、预计、可靠性设计、可靠性分析、可靠性试验、数据交换等进行系统化管理,形成了系统性“线条”式管理,将“单点”管理系统串联起来。?</P>
<P>    80年代以来美国可靠性工程向着更深、更广的方向发展。在管理上,加强集中统一管理,强调可靠性及维修性管理制度化,在技术上深入开展软件可靠性、机械可靠性,全面推广计算机辅助设计(CAD)技术在可靠性工程中应用,积极采用模块化、综合化、容错设计、光导纤维和超高速集成电路等新技术来全面提高现代武器系统的可靠性。1985年美国空军推行了“可靠性及维修性2000年行动计划”(R&amp;M2000)更进一步加强可靠性管理和制度化。为了保证可靠性、维修性、保障性及武器装备作战能力,使武器装备达到战备完好性、使用可用性及任务成功性,在管理上大力推行“矩阵式”管理,纵向到位,横向到边。?</P>
<P>    90年代美国由于以经费为独立变量,废除大量的军用标准,大力推行健壮设计和并行工程及IPPD管理。因此,用“网络化”管理取代“矩阵式”管理。首先在美国海军及其相关工业部门广泛推广“网络化”管理。通过大量标准、规范引入和支持,为“网络化”管理提供依据和指导,实施程序化、规范化、系统化的“网络化”管理,详见图1、图2。“网络化”管理的要点是:A.实施并行工程。在产品研发过程中要全过程、全因素、全方位(技术性、可靠性、维修性、保障性、安全性、经济性等)并行进行。B.加强过程监控。尤其在产品研发过程中的可靠性判决点上即网络结点上,进行严格评审。C.加强信息传递与管理。网络化管理能够有效运转关键在于信息的沟通和快速传递。D.实施制度化和规范化管理。在产品研发前就应制订详尽、严密网络化管理制度与程序,并对每一工作项目和接口及判决点都要有科学的管理规范,尽量避免人为的干预。?</P>
<P>根据我长期从事可靠性工程工作经验和研究成果,按我国国情和产品特点,拟订出某电子设备研制和生产的网络化管理,并已实施。?</P>
<P>本文仅对电子系统或整机的可靠性工程提出拙见,对于电子元器件可靠性工程,还未提及。</P>

adminftp 发表于 2005-8-31 09:04

回复:(beyond)[转帖]二十世纪留给二十一世纪可靠性...

这篇文章虽然是电子方面的,不过对结构的可靠性应该有一定的借鉴作用

icepoint 发表于 2006-8-4 15:05

现在可靠性领域发展的相当庞大了,需要指导性的见解,呵呵
页: [1]
查看完整版本: [转帖]二十世纪留给二十一世纪可靠性工程热点问题