數據倉庫技術和rfid的聯系
RFID作為一種自動識別標簽,是通過射頻信號來自動識別目標對象從而獲取相應的數據。RFID標簽有很多種的識別方式,但最為常見的是存儲一個唯一的序列號來標識一個人或者物品的信息。它是通過一個帶有天線的微芯片來傳輸信息,芯片借助天線將識別信息傳輸給一個RFID閱讀器。這種技術讓用戶能通過一個RFID閱讀器遠距離、非接觸地讀取數據,在這個過程中閱讀器和芯片之間不需要有機械或光學的接觸,并且這個過程不需要人工干預,在任何環境當中均可自發完成。
RFID會使得原來的供應鏈管理系統變得更為智能,它改進了原始的二維條形碼,使得相應的貨物跟蹤和訂單管理的過程變得簡易。近幾年沃爾瑪開始在它們的供應鏈系統中使用這種技術,RFID還被廣泛應用于軍事、郵政、航空、醫療等領域。由RFID的廣泛應用而帶來的新事物就是“物聯網”,它意味著人們能通過無線網絡隨時獲取數以億計物品的位置及相關信息。
數據倉庫領域對RFID數據的研究主要分為三個方向:第一個方向在于安全地收集和管理rfid電子標簽攜帶的信息;第二個方向是清理RFID數據中的誤差數據;第三個方向是創建一個多維度的數據倉庫,以提供對大量RFID數據集的OLAP操作。這也是本文的討論內容。RFID數據完全不同于傳統的關聯技術或者數據倉庫技術中的數據,對這些不同之處的研究正是對RFID數據進行數據建倉工作的起點,RFID數據主要有如下一些特性:
數據簡單:RFID所產生的數據可視為一個RFID元數據的流,元數據的結構主要是EPC、LocaTIon、TIme,EPC是Electronic Product Code的縮寫,即電子產品代碼,它用來唯一識別一個物品。LocaTIon是RFID閱讀器讀取該物品時的所在位置,TIme就是讀取時的時間。這種數據格式并沒有攜帶太復雜的信息,簡單易讀。
數據海量:RFID應用的重要挑戰就是由此產生的海量數據。
數據誤差:RFID數據的另一個重要問題是RFID閱讀器在產生數據流時會有誤差。在實際應用當中RFID閱讀率大概在60%~70%之間。
允許冗余:RFID閱讀器每隔固定一段時間就會產生一個(EPC,location,time)格式的元數據,當一個物體停留在相同的地點一段時間就會有很多元數據產生,這就形成的數據的冗余,我們同樣需要對這些冗余進行處理。
RFID數據清理
數據清洗是在數據處理過程中最常見的問題之一,比如在數據倉庫當中進行各種預定義的成熟操作當中都涉及到這一過程。在RFID當中的數據主要存在以下三種問題:缺失值,數據錯誤,數據冗余。
缺失值和數據錯誤這類問題在RFID應用當中非常常見,因為一些簡陋的無線閱讀器在無線通信過程中會出錯。很多學者針對這類問題提出了若干解決方案,比如有效的RFID數據流過濾技術、比如ESP(Extensible Sensor Stream Processing,在線清洗多層框架系統),再有基于定長滑動窗口的清洗技術等等。其中ESP作為主要的數據流清洗方法分為五個階段,每個階段都對應一個不同數據處理的邏輯過程。ESP系統針對數據的時間粒度和空間粒度,通過說明性的查詢語言來解決用戶定義的功能,并通過實驗證明ESP也適合于RFID數據流。
數據冗余的問題在RFID應用當中也非常嚴重。數據的冗余主要有兩個層面:在閱讀層面的冗余以及數據層面的冗余。
①閱讀層面的冗余:這種冗余是指一個rfid電子標簽在同一個地點被不同的RFID閱讀器重復讀取。解決這種問題的一個辦法是,當一個RFID閱讀器打開時其它有交叉部分的閱讀器暫時關閉;其次,每個RFID閱讀器計算出它所覆蓋的RFID標簽的數目,然后將這個數據向它所覆蓋的每個RFID標簽中書寫。如果一個閱讀器一個標簽都沒有鎖定,則這個閱讀器為多余的。但是這個算法當中有一個假定,就是每個閱讀器會在同一位置持續很長時間,然而在實際中很多閱讀器是隨時移動的。
②數據層面的冗余:每一個閱讀器產生RFID元數據(EPC,location,time),當一個物品停留在一個地方一段時間后會持續產生這樣的元數據,解決方法將元數據處理成(EPC,location,time_in,time_out)這樣的數據格式。在多數時候許多物品都是一起移動的,比如一整集裝箱的洗發水從工廠出來后,在各物流中心中轉,直至被擺放到貨架上。因此,我們用(EPC list,location,time_in,time_out)格式來進行儲存有助于減少冗余。
因為RFID數據的諸多特性,RFID數據倉庫的建立也不同于傳統的數據倉庫。假設我們已經將數據進行了清洗,得到了以(EPC,location,time_in,time_out)格式的數據。傳統的數據處理技術也許能夠找出在指定地點,指定時間的相應信息,但是對這些數據之間的聯系則缺少相應的研究方法,比如如何尋找某些類別的商品從A地到B地的相關信息方面,并沒有很好的處理技術。為了滿足用戶對信息的需求,并結合RFID數據本身的特點,我們可以構建RFID數據倉庫并進行數據處理的一些相關技術。建立RFID數據倉庫。
RFID數據有很多自己的特性,需要進行復雜的數據清洗工作,這就需要在處理過程中對數據進行壓縮,并創建有效的數據倉庫結構來存儲這些數據,在減少RFID數據量的同時保留數據本身攜帶的相關信息。這在數據壓縮算法、數據倉庫模型等方面都提供了可供繼續研究的內容。以上就是rfid電子標簽生產廠家靈天智能今天分享的內容,了解更多資訊關注我們。www.tjyonghui.com