當前位置:工程項目OA系統(tǒng) > 泛普各地 > 福建OA系統(tǒng) > 福州OA系統(tǒng) > 福州OA快博
BI:數據挖掘在質量管理中的應用
隨著市場競爭的日益激烈,市場已成為需求驅動的市場,客戶滿意度的提高是企業(yè)工作的重點,而質量是衡量客戶滿意度的量度,所以,先進的質量管理已經成為增強企業(yè)核心競爭力中的重要一環(huán)。
針對生產質量管理問題,從休哈特的統(tǒng)計質量控制理論開始,研究人員創(chuàng)立了數十種質量控制圖,控制對象也從一元發(fā)展到多元,但是控制圖和后來發(fā)展起來的統(tǒng)計控制診斷在質量管理方面的主要應用是針對質量的控制和診斷,屬于事后控制和診斷。
隨著數據倉庫和數據挖掘技術的迅猛發(fā)展,商業(yè)智能成為企業(yè)預測和決策支持的核心技術,在產品質量控制、生產工藝流程質量控制、故障分析和庫存管理等領域進行了應用,并且取得了良好的分析預測效果。
數據挖掘等商業(yè)智能方法是通用的,但由于數據有限,本文只針對質量預測問題,把數據挖掘和數據倉庫等商業(yè)智能技術應用于生產管理中,在進行質量控制和診斷的基礎上,嘗試應用數據挖掘進行生產中產品質量的預測。主要解決:① 針對影響加工質量的多個相關因素,進行各因素的權重的判定,確定哪些因素是影響質量的關鍵因素;② 針對生產過程中各屬性之間復雜的內在聯系,對質量影響因素之間的關聯關系進行量化分析,找出生產安排的最佳組合或者隱患;③ 基于加工記錄的歷史數據建立質量預測模型,模擬計劃排產后的產品質量情況,從而根據質量預測結果進行針對質量的計劃排產的優(yōu)化,為企業(yè)提供計劃排產方面的決策支持。
1 數據倉庫與數據挖掘
在國際上,數據挖掘等商業(yè)智能技術主要應用于分析型客戶關系管理系統(tǒng)和生物數據挖掘等海量數據領域。在國內生產管理方面,數據挖掘技術的應用取得了可喜進展,如寶鋼結合質量分析應用數據挖掘技術,實現質量問題的診斷,進入了把商業(yè)智能技術應用到生產實際的新階段。
數據挖掘應用的基礎是建立數據倉庫。數據倉庫之父Inmon W H把數據倉庫定義為:數據倉庫是支持管理決策過程的、針對主題式的、綜合式的、與時間有關而持久的數據集合。數據倉庫是一種管理技術,它將分布在企業(yè)中的異構數據集成在一起,實現數據的采集、歸納和處理,使企業(yè)的業(yè)務工作環(huán)境和信息分析環(huán)境相分離,為數據挖掘的應用奠定堅實的基礎。圖1給出了從建立數據倉庫到應用數據挖掘的整個過程。
圖1 商業(yè)智能應用的整體架構
把異構的數據抽取、清理、轉載和更新到數據倉庫中,是企業(yè)級的商業(yè)智能應用的基礎,針對不同的主題建立數據倉庫后(本文是針對質量問題),應用數據挖掘技術進行海量數據內在聯系的發(fā)掘、建立相關主題的預測模型,指導聯機分析處理的實現,為企業(yè)提供決策支持。
2 數據挖掘應用于質量管理
本文以某鋁業(yè)集團(簡稱A公司)為研究對象。A公司主要是以生產鋁箔為主,為了進一步提高客戶的滿意度,找出質量的隱性影響因素,利用A公司近年積累的生產加工和檢驗的記錄,共計10萬余條,建立以質量為主題的數據倉庫,針對質量控制、診斷和預測的實際需求,利用數據挖掘中的屬性權重分析、關聯規(guī)則和分類分析分別進行質量影響因素的量化分析,影響因素的關聯發(fā)現,進而建立質量的預測模型。這些數據挖掘方法的主要用途為:
(1)屬性權重分析。通常是數據挖掘應用的第一步,用于確定數據樣本中的各個屬性取值變化對目標屬性取值的影響程度;
(2)關聯規(guī)則。在屬性權重分析的基礎上,挖掘屬性之間取值的關聯,明確它們之間的隱含關系;
(3)分類分析。用于離散值的預測,在以上兩個方法應用的基礎上,根據樣本屬性的取值,來預測樣本屬于什么分類。
2.1 建立質量影響因素的關聯模型
2.1.1 數據準備和屬性權重分析
使用數據提取、轉換和裝載工具基于事務型數據庫建立質量相關的主題數據倉庫,使用數據有效性過濾方法過濾掉不完整的記錄,使用數字規(guī)范化方法把質量的檢驗結果歸納成布爾值(0不合格,1合格),在數據處理完畢后,利用屬性權重分析找出各生產相關的屬性影響質量的權重(如表1所示)。
表1 屬性權重分析結果
表1中的權重是根據對應屬性取不同值時,影響加工質量的概率統(tǒng)計。其中權重大于零的屬性被認為是與質量相關的屬性,權重小于等于零的屬性認為是對質量沒有影響的屬性。下面針對表1結果中權重大于零的屬性,利用關聯規(guī)則進行相關性分析,并對其數學基礎進行簡要介紹。
2.1.2 關聯規(guī)則基本概念
設I={i1,i2,i3,…,in}是事件全集。設集合D是事件的集合(DㄈI)。A、B是兩個事件,關聯規(guī)則是形如A→B的蘊涵式,其中A∈I,B∈I。規(guī)則A→B在事件集D中成立,具有支持度s,其中s是D中的事件包含A∪B(A和B同時發(fā)生)的概率,記為P(A∪B)。規(guī)則A→B在事件集D中具有置信度c,c是在D中包含事件A的條件下也包含B的概率,即條件概率P(B︱A)。分別記為:
Support(A→B)=P(A∪B)Confidence(A→B)=P(B︱A)
2.1.3 關聯規(guī)則的應用
關聯規(guī)則在應用中,考慮的是事件的存在與不存在即布爾值0或1,所以它是布爾關聯規(guī)則。
根據規(guī)則中涉及的數據維可以分為單維關聯規(guī)則和多維關聯規(guī)則。對于使用關聯規(guī)則中的項或屬性每個只涉及一個維的方法,是單維關聯規(guī)則。
例1:WA→quality(“不合格”):表示工人A加工的產品為不合格(其中支持度和置信度省略)(符號說明:PZ:軋制工序,PRA:物料圖號A,WA:工人A,CA:檢驗員A,MA表示設備A,其他類推;下文均符合這個約定)。
同樣,對于使用多個維度進行關聯的分析的方法,稱為多維關聯規(guī)則。
例2:WA∧PRK→quality(“不合格”):表示工人A在加工產品K時,加工質量不合格。
在關聯分析模型中的維數可以任意的進行指定,不過指定的維數與數據挖掘進行的速度是成反比的,而且大于3個維度的置信度將會非常小,模型具有實際意義的可能性很小。表2是一個3個維度關聯分析的運行結果,可以看到不同的屬性的組合能夠生產出合格產品的量化判定。以第一行為例:工人A在軋制工序加工圖號為A的鋁箔,產出合格鋁箔的置信度為97.71%,支持度為4.85??梢钥闯龉と薃在軋制工序,加工A鋁箔操作水平比較好(97.71%的合格率)。
表2 關聯規(guī)則的3個維的運行結果
針對以上的結果還可以發(fā)現屬性之間微妙的聯系,例如第二、三行綜合起來可得:工人B加工相同產品A時,在不同的檢驗員進行檢驗的情況下,產品合格率相差5%。這說明:要么是工人加工水平低下,要么檢驗員檢驗結果有偏差。這為企業(yè)提供了決策支持的依據,但是這只是質量控制和診斷的應用,都是事后補救的做法。下面將著重介紹數據挖掘在質量預測方面的應用。
- 1SOA、BPEL和ESB的前生后世
- 2專業(yè)與綜合的博弈 獨立BI廠商將出局
- 3SOA架構的潛在用戶有哪些投資決策顧慮
- 4如何在企業(yè)中有效地實施準時生產方式
- 5成功的SOA需要一個強大治理計劃
- 6軟件服務時代解讀2008年十大SaaS術語
- 7重視項目收尾 踢好軟件開發(fā)臨門一腳
- 8SaaS模式難入中小企業(yè)之門嗎?
- 9企業(yè)CIO如何讓IT具備預見性
- 10降低成本 福州OA領料管理做到心中有數
- 11企業(yè)主管關注 SaaS的“三級跳”
- 12企業(yè)應該如何規(guī)劃和實施知識管理系統(tǒng)
- 13開源企業(yè)如何為項目獲得風險投資
- 14生產及物料控制部門的管理流程及注意事項
- 15發(fā)展中的SOA框架的幾大缺憾研究
- 16經濟低迷時期的反周期IT投資
- 17如何建立軟件開發(fā)項目里程碑
- 18企業(yè)管理戰(zhàn)略也需要“嘩眾取寵”
- 19從IBM經驗看企業(yè)供應鏈的整合戰(zhàn)略
- 20福州OA項目到底是面紅旗還是個黑洞
- 21供應鏈管理的關鍵:供與需的競爭力
- 22多維數據模型與OLAP的實現
- 23我國企業(yè)財務管理信息化協(xié)同模式研究
- 24關于福州OA項目監(jiān)理方法研究
- 25四大因素導致軟件行業(yè)發(fā)生轉化
- 26過緊日子的智慧
- 27緩解資金壓力 中小物流企業(yè)試水物流金融
- 28企業(yè)的成本管理要從創(chuàng)業(yè)階段開始
- 29杜絕信息孤島出現 整合高級時期到來
- 30商務流程模型結合SOA消除業(yè)務部門間隔閡
成都公司:成都市成華區(qū)建設南路160號1層9號
重慶公司:重慶市江北區(qū)紅旗河溝華創(chuàng)商務大廈18樓