《電子技術應用》
您所在的位置:首頁 > 測試測量 > 設計應用 > 基于DAG的Hive數據溯源方法
基于DAG的Hive數據溯源方法
2020年信息技術與網絡安全第11期
杜 娟1,蘇秋月2
1.61646部隊,北京100192;2.四川大學,四川 成都610065
摘要: 數據溯源能夠快速定位數據的來源及其產生過程,對審計、數據生命周期管理都有很大幫助,是數據安全防護中的重要一環。針對傳統數據溯源機制難以應用于Hive數據倉庫中大規模、復雜的數據處理的問題,提出了一種基于DAG的數據溯源方法,實現了對Hive中數據的溯源。最后通過實驗對該方法的有效性以及性能進行了測試與驗證。
中圖分類號: TP311.13
文獻標識碼: A
DOI: 10.19358/j.issn.2096-5133.2020.11.005
引用格式: 杜娟,蘇秋月. 基于DAG的Hive數據溯源方法[J].信息技術與網絡安全,2020,39(11):31-37.
Hive data provenance method based on DAG
Du Juan1,Su Qiuyue2
1.Unit 61646 of PLA,Beijing 100192,China;2.Sichuan University,Chengdu 610065,China
Abstract: Data provenance can quickly locate the source of data and its production process, which is of great help to audit and data life cycle management. It is an important part of data security protection. Aiming at the problem that traditional data provenance mechanisms are difficult to apply to large-scale and complex data processing in Hive data warehouses, this paper proposes a data traceability method based on Directed Acyclic Graph(DAG). It can implement the traceability of Hive data. Finally, the effectiveness and performance of this method are tested and verified by experiments.
Key words : data provenance;big data;directed acyclic graph

0 引言

    Hive是基于Hadoop的開源數據倉庫工具,它提供了豐富的SQL查詢方式來分析存儲在Hadoop分布式文件系統中的數據:可以將結構化的數據文件映射為一張數據庫表,并提供完整的SQL查詢功能;可以將SQL語句轉換為MapReduce任務運行,通過自己的SQL查詢分析需要的內容。這套SQL簡稱Hive SQL,使不熟悉MapReduce的用戶可以很方便地利用SQL語言查詢、匯總和分析數據[1]。由于Hive在數據存儲和分析上的靈活性,眾多企業用它存儲重要數據。這些敏感的商業數據被大量企業內部人員訪問和操作,一旦發生人為誤操作或違規操作,很容易導致數據的泄露。現有大數據平臺上的數據安全防護方案缺乏對敏感數據靈活的訪問控制,難以對數據的生命周期及用戶操作行為進行精確的追蹤溯源,無法提供對大數據合規審計管理的支撐。因此,如何提供有效的安全防護機制來保障Hive中數據的安全,是目前研究的重點。

    數據溯源也稱為數據血緣、數據譜系等,數據溯源技術根據追蹤路徑重現數據的歷史、狀態和演變過程,實現數據歷史檔案的追溯[2]。通過數據溯源能追蹤到異常發生的原因,還能幫助人們確定數據倉庫中各項數據的來源。國內外學者在數據溯源技術上進行了深入研究。在數據溯源模型方面,汪洪昕[3]提出了數據染色體溯源模型,更加完善地揭示數據傳播過程中的變化及數據的關系,并在Hadoop平臺中得以實現。郝鵬飛[4]通過對大數據模型分析平臺工作流特征分析,討論了基于Oozie模型工作流的數據溯源問題。

    目前針對數據庫的數據溯源追蹤主要有兩種方法:(1)基于標注的方法[5],此類方法雖然實施起來比較簡單,但需要額外的存儲空間且隨著處理的數據量增加其執行效率會降低,難以直接應用于維護著海量數據的Hive數據倉庫;(2)基于逆置函數的方法[6],此類方法需要的存儲空間較小,但不是所有的數據處理都可以逆置,且其溯源追蹤的性能完全取決于逆置機制。對于Hive數據倉庫中復雜的數據處理,要構造一個良好的逆置機制難度較大。Hive數據的溯源重點在于數據沿襲問題,而給定數據的數據沿襲問題可以概括為建立數據的血緣關系,得到其產生過程以及源數據。

    對于數據倉庫中數據溯源問題,柯潔[7]等人基于W3C的PROV模型對ETL過程的數據溯源進行了深入分析,并提出了相應的數據溯源算法。文獻[8-9]討論了數據倉庫中的數據譜系跟蹤問題,提供了譜系跟蹤算法以及溯源過程中屬性映射和轉換起源集的求解方法。但這些研究均針對傳統數據倉庫中的數據溯源,難以應用于大數據環境下Hive的數據溯源。針對大數據環境,文獻[10]提出了一種基于層的數據溯源架構,其中包括大數據來源的捕獲及可視化,并且在溯源數據中引入了一種訪問控制機制。文獻[11-13]總結了數據庫中的數據溯源技術,分析了在Hadoop環境下數據溯源面臨的研究挑戰,并從數據溯源模型、溯源數據存儲、溯源查詢語言等方面梳理了現有解決方案。Apache Atlas是Hadoop社區為解決Hadoop生態系統的元數據治理問題而產生的開源項目,它為Hadoop集群提供了包括數據分類、集中策略引擎、數據溯源、安全和生命周期管理在內的元數據治理核心能力[14],因此可以將Apache Atlas引入到Hive數據溯源中。

    針對傳統數據溯源機制難以滿足Hive中大規模、復雜的數據處理問題,本文提出了基于有向無環圖(Directed Acyclic Graph,DAG)的數據溯源方法。通過對Apache Atlas進行擴展,在Hive中實現了該數據溯源方法,并通過實驗證明該方法可為Hive提供準確、高效的數據溯源機制,也為數據安全審計提供了有力支撐。




本文詳細內容請下載:http://www.xxav2194.com/resource/share/2000003062




作者信息:

杜  娟1,蘇秋月2

(1.61646部隊,北京100192;2.四川大學,四川 成都610065)

此內容為AET網站原創,未經授權禁止轉載。
欧美激情办公室aⅴ_国产欧美综合一区二区三区_欧美午夜精品久久久久免费视_福利视频欧美一区二区三区

          99精品视频免费观看| 中文在线资源观看网站视频免费不卡| 男女精品网站| 久久久999国产| 欧美一级片在线播放| 亚洲一区二区三区涩| 一区二区三区www| 一区二区欧美在线| 一本色道久久综合亚洲精品按摩| 亚洲精品孕妇| 亚洲狼人精品一区二区三区| 亚洲激情网站| 亚洲精品视频一区二区三区| 亚洲精品久久久久久久久久久| 在线观看视频一区| 亚洲国产精品久久精品怡红院| 影音先锋日韩精品| 影音先锋国产精品| 亚洲国产mv| 91久久久在线| 一片黄亚洲嫩模| 亚洲欧美日本精品| 欧美中文字幕在线观看| 久久九九精品99国产精品| 久久裸体艺术| 欧美成人午夜视频| 欧美日韩你懂的| 国产精品久久久久久久久久直播 | 亚洲人成人一区二区在线观看| 在线观看日韩www视频免费 | 久久天天狠狠| 农村妇女精品| 欧美伦理视频网站| 国产精品国产| 国产日韩欧美精品综合| 一区二区三区在线高清| 欧美视频一区二区| 国产欧美日韩亚洲| 在线国产精品播放| 99视频精品全国免费| 午夜精品久久99蜜桃的功能介绍| 欧美在线视频二区| 男人天堂欧美日韩| 欧美日韩精品欧美日韩精品| 国产精品女人久久久久久| 国产精品色网| 在线精品国精品国产尤物884a| 亚洲美女视频| 午夜精品一区二区三区电影天堂 | 免费观看30秒视频久久| 欧美日韩在线视频首页| 国产免费成人av| 在线看无码的免费网站| 日韩一级裸体免费视频| 欧美亚洲免费电影| 欧美.com| 国产精品久久久亚洲一区| 国产亚洲成av人片在线观看桃| 亚洲国产日韩欧美在线动漫| 亚洲私人黄色宅男| 久久久久久久激情视频| 欧美久久一级| 韩国av一区二区| 亚洲特色特黄| 久久综合中文字幕| 国产精品福利影院| 在线成人激情| 午夜精彩国产免费不卡不顿大片| 欧美成va人片在线观看| 国产视频丨精品|在线观看| 日韩午夜电影在线观看| 久久成人羞羞网站| 欧美色精品在线视频| 精品粉嫩aⅴ一区二区三区四区| 亚洲无亚洲人成网站77777| 亚洲综合另类| 欧美韩日一区二区三区| 国产一区二区三区在线观看精品 | 国产午夜精品久久久| 一个色综合导航| 你懂的视频一区二区| 国产偷国产偷精品高清尤物| 99在线精品视频| 免费视频一区二区三区在线观看| 国产伦精品一区二区三区免费| 亚洲日韩欧美视频一区| 久久久噜噜噜| 国产美女搞久久| 在线视频精品| 欧美精品大片| 亚洲大片在线观看| 欧美自拍偷拍| 国产精品日韩一区| 在线视频欧美一区| 欧美日韩国产综合网| 亚洲高清视频中文字幕| 久久精品首页| 国产午夜亚洲精品不卡| 亚洲欧美日韩国产一区二区三区| 欧美日韩视频一区二区三区| 亚洲精品国产精品久久清纯直播 | 黄色一区三区| 久久狠狠一本精品综合网| 国产九色精品成人porny| 亚洲一区二区毛片| 欧美视频在线观看| 在线中文字幕日韩| 欧美日韩视频在线观看一区二区三区| 91久久国产精品91久久性色| 久热精品视频在线观看| 国语自产精品视频在线看一大j8| 亚洲欧美日韩精品久久| 国产精品久久一区二区三区| 亚洲午夜女主播在线直播| 欧美日韩亚洲一区二区三区在线| 亚洲精品乱码久久久久| 欧美激情精品久久久久| 亚洲精品日韩综合观看成人91| 久久婷婷麻豆| 136国产福利精品导航网址| 老司机凹凸av亚洲导航| 亚洲国产精品高清久久久| 久久这里只精品最新地址| 亚洲第一视频| 欧美高清在线播放| 日韩网站免费观看| 欧美视频免费在线| 午夜欧美大尺度福利影院在线看 | 欧美一区二区在线| 国产一区二区三区观看| 久久精品视频免费观看| 一区二区三区在线免费播放| 久久嫩草精品久久久久| 在线观看中文字幕亚洲| 欧美高清视频免费观看| 亚洲精品日韩久久| 国产精品mm| 欧美一区二区久久久| 国产综合视频在线观看| 老牛影视一区二区三区| 亚洲黄色成人| 欧美日韩国产电影| 亚洲资源av| 国产专区综合网| 久久综合中文色婷婷| 亚洲裸体俱乐部裸体舞表演av| 欧美日韩伦理在线免费| 亚洲一区二区在线视频| 国产手机视频精品| 免费短视频成人日韩| 99视频+国产日韩欧美| 国产精品一区久久久久| 久久久久se| 亚洲精品美女在线观看| 国产精品www994| 欧美专区中文字幕| 亚洲国产视频一区| 国产精品国产亚洲精品看不卡15 | 久久婷婷一区| 99人久久精品视频最新地址| 国产免费亚洲高清| 美女精品网站| 一本色道久久综合亚洲精品高清| 国产模特精品视频久久久久| 美日韩精品免费观看视频| 亚洲视频一二区| 黑人中文字幕一区二区三区 | 欧美乱妇高清无乱码| 欧美亚洲一区二区三区| 亚洲茄子视频| 国产日韩欧美精品综合| 欧美成人免费在线| 香蕉免费一区二区三区在线观看| 亚洲第一黄色网| 国产精品视频内| 欧美高清在线视频观看不卡| 欧美一区二区三区久久精品茉莉花| 亚洲国产精品久久久久久女王| 国产精品久久久久久久7电影 | 久久精品观看| 一区二区三区四区国产| 影音先锋成人资源站| 国产精品久久91| 久久一区二区三区四区五区| 宅男在线国产精品| 亚洲成人影音| 国产精品久久综合| 欧美精品一区在线发布| 久久精品视频一| 亚洲校园激情| 亚洲乱码精品一二三四区日韩在线| 国产亚洲福利| 国产精品爱久久久久久久| 免费欧美日韩| 欧美在线播放一区| 一区二区三区不卡视频在线观看| 黄色亚洲免费| 国产精品永久免费| 欧美视频一区二| 欧美日韩国产美女|