可靠性工作需要做的事情非常多,該從哪里下手?
實際上,整個產品的可靠性工作沒有那么復雜,可靠性工作歸根到底是跟故障打交道,就是解決故障問題。首先是減少故障,其次是減少影響,如果影響減少不了,就要評估影響有多大。減少故障主要通過避錯和排錯。避錯主要針對研發階段,通過研發的設計和測試去實施保障;排錯主要針對制造階段,通過來料和生產制程的攔截實施保障。減少影響的措施是容錯,容錯就是運行功能的保障,主要通過軟件來實現,如果出了問題,通過一些檢測、定位、隔離、恢復等保障。評估影響的措施是預錯,基于故障機理的評估,預測失效率、壽命等,評估風險影響。
02
國內企業可靠性工作開展,會經歷哪些發展階段?
國內企業的發展,可靠性工作可能會經歷五個不同的階段。
第一個階段是市場試錯。通過市場應用去識別問題,反饋給設計,迭代下一版本。這個市場試錯階段一般是一些很小規模的企業,比如說十幾個人的企業沒有那么多人力去開展很多工作,經常是產品出來,調試成功后就發往市場,一旦出了問題,開發人員直接到市場定位解決。
第二個階段是事后檢測。在生產后端,經過質量檢測、篩選、數據處理、試驗評價的手段,把不合格的產品篩除,但一般的檢測對整個制造的失效率是沒什么貢獻的。
第三個階段是事前預防。重視生產過程的預防,把整個生產過程的每個工序做一些優化,進行SPC、CPK、6西格瑪等一系列管控措施,事前預防對產品的直通率會有很大的提升。
第四個階段是事前控制。從生產前移到研發,不僅僅在生產要控制好,在研發階段重點研究產品失效的機理,重點抓產品研發設計,從設計層面來降低市場的失效。
第五個階段是端到端管控。實際上,在市場上的產品有大量的物料問題,那么這里面就是一道端到端的管控問題,從物料-研發-生產-市場應用進行全方位管控,才能真正意義上降低產品市場的問題。除了這五個階段,后面還有沒有?我想肯定還會有,因為隨著科技的發展,還有更先進技術管理措施。
國內大部分企業都在事前預防和事前控制之間的階段,華為目前是到了端到端管控階段,華為是我們國內可靠性工作的標桿企業。我們企業要多做一些主動的可靠性工作,不然會很被動,老是感覺在救火,對于產品的可靠性,我們不能心存僥幸。
03
降本,可以從哪些角度考慮進行降本?一旦降本,可靠性模型如何構建?是在原有設計冗余基礎上還是重新構建模型?
降成本的策略:物料歸一化,減少物料編碼數,提升單一物料的采購額,降低采購成本和物料的管理成本。物料替代,尋找并識別質量同等甚至更好,但成本更低的供應商,這也是物料技術工程師的價值。基于對物料應用的深入理解,簡化設計,并做物料方案級的替代。提倡的產品降本,是要求在不降低產品可靠性的前提下進行降本,如物料通過物料技術認證,選用規格“合適”的物料,從而達到降本的目的。對原有可靠性模型影響不大。
04
企業要如何去解決可靠性預計的準確性問題?
主要有兩個因素,一是模型。不管多高級的模型,只要沒有反映產品的實際工作狀態和故障狀態就不是一個好模型,依據這樣的模型計算出來的結果就不會準確。二是基礎數據。失效率這塊企業不能僅僅依靠國軍標299等標準,要聯合相關部門一起統計產品實際的失效率。可靠性預計工作要想做好并不容易,但只有這樣做了之后,可靠性預計的結果才能支持市場端,將可靠性預計工具化。
05
FTA適合作為一個流程活動嗎?
一種可靠性方法是否適合放入流程需要具體問題具體分析,FTA這種方法實施起來比較耗時耗力,因為FTA這種方法頂事件過多,難以確定。比如通訊網絡的故障狀態就非常多樣化,很難確定將哪個故障狀態作為頂事件。而且底事件組合的量也是爆炸性的,比如環境的影響、人為操作的影響等,很多底事件范圍都超出產品本身的范圍,很難操作。另外,新開發的產品,沒有人能對產品非常熟悉,如果將FTA放到流程活動里面,就無法落實責任人。這種方法也不是一無是處,更適合現場故障診斷應用。但“兵無常勢,水無常形”,可靠性的設計分析方法需要結合產品摸索應用之道,才能做出實效。
06
DFMECA分析,如何才能發現潛在失效問題,并且怎么樣才能分析提出有效的控制措施?
FMEA的主要目的其實并不是發現產品存在的問題,而是確定產品最關鍵的單元(失效率高+影響大),并對這些單元采取必要的可靠性措施,確保其不出問題,從而確保整個系統的可靠性。可靠性的措施包含兩類:避錯,即從器件選型、電路設計、生產工藝等方面提出避免出現問題的措施;容錯,即從故障后的處理(故障檢測、隔離、診斷、恢復等)上考慮設計措施。
07
企業失效率數據的收集流程具體是?
統計失效率所需的數據包括:發貨量,這些發貨的設備中有多少在運行使用(有些發貨設備是作為備件存儲在備件庫里,并未運行使用),在運行使用的這些設備中有多少發生了故障,它們各自的運行時間,如果要統計器件失效率,還要一環環的追溯到哪些器件發生了故障,以及這些器件的運行時間,這個過程十分繁雜。
08
對IC產品,量產前后的可靠性預計如何去做,需要收集哪些信息來佐證結論?
大的芯片廠家都有專門的可靠性統計試驗,有些是通過加速實現的,并在器件手冊上會給出失效率的數據,但這些失效率屬于基本失效率,并未考慮芯片應用廠家的實際使用環境和應力,因此芯片應用廠家還需要采用應力法做芯片的可靠性預計才能得到該芯片的使用失效率。
09
關于可靠性模型準確性的問題,在可靠性模型預測方面,有什么驗證方法嗎?
最簡單直接的驗證方法就是把預測的結果和實際統計的結果拿來對比,這樣不僅可以檢驗預測模型的準確性,也可以檢驗基礎失效率數據的準確性。
10
企業FRACAS系統如何建立、運轉,才能起到真正的作用?
好的系統要依靠好的流程和體制來保障落地,否則再好的系統也是空的。FRACAS系統是非常重要的一個工具,我們前期的可靠性設計得好不好,有什么問題,以及可靠性工作所需的基礎數據都來源于它,一定要利用好這個系統。