數據中心最新文章 基于元數據分離的數據管理體系結構及應用研究 針對現有嵌入式工業計算設備的數據分散、管理不足等問題,提出了一種基于元數據分離的數據管理體系結構。融合數據特性需求,設計了一種數據統一標準化處理的規則庫,構建了元數據信息組織模型、索引存儲結構及標準格式的數據文件,實現了數據文件與元數據分離存儲的管理模式,將數據文件存儲至索引目錄磁盤,元數據信息實時寫入時序數據庫。初步開發了數據管理的應用原型系統,提升以元數據模型為基準的數據分級組織管理能力,實現數據互聯互通,提高以業務為導向的數據管理應用服務效能。 發表于:11/1/2023 基于多模態特征融合的社交媒體賬號分類方法 社交媒體賬號分類方法從賬號的屬性信息出發,通過構建賬號特征從而對賬號進行分類,對從海量社交媒體數據中挖掘有價值的信息具有十分重要的作用。現有社交媒體賬號分類一般基于用戶發布的信息提取特征,存在賬號信息描述不完整、分類有效性低的問題。針對上述問題,提出了一種基于多模態特征融合的社交媒體賬號分類方法。該方法綜合考慮賬號自身屬性、文本以及賬號之間的社交關系等信息,使用張量分析的方法對賬號所表現的多模態特征進行融合。相比現有方法,所提方法可以更好地利用賬號的各種信息,獲得更好的分類效果。通過實驗,所提方法準確率達到了93.74%。 發表于:11/1/2023 集成電路產業的多源數據融合前沿識別研究 大數據時代,能夠精準及時地識別研究前沿對于科技戰略的定位和科研方向的部署尤為重要,可提供更加全面的決策參考和依據。利用自開發的多源數據融合分析方法,從全球期刊論文、會議論文、專利文獻、科技新聞、研究報告、科技政策、標準等數據進行數據挖掘和去噪,有效識別出集成電路領域當前的研究前沿和技術清單。當前全球集成電路領域的研究熱點和重點發展方向集中在半導體制造設備、高制程制造技術上,重點產品集中在高端芯片、功率器件、傳感器、存儲器以及第三代半導體的相關產品上。中國半導體產業國產化迫在眉睫,前沿識別結果為政府與企業提供有價值的決策支持和參考。 發表于:10/23/2023 NVIDIA發布首部DPU和DOCA編程入門書籍 北京時間 2023 年 10 月 17 日,NVIDIA 宣布由 NVIDIA 撰寫的《數據處理器: DPU 編程入門》一書正式上市發行,成為 NVIDIA 的全球首部 DPU 處理器編程入門書籍。該書由機械工業出版社出版,將為使用 NVIDIA BlueField 系列 DPU 和 NVIDIA DOCA 開發環境的開發者提供實用指南,助力開發者快速上手,學習如何在 DPU 上靈活編程。 發表于:10/18/2023 神策數據案例解讀:企業如何提升可視化分析能力? 神策分析 2.5 版本正式發布經營分析能力以來,已有不少客戶接入使用,并充分實現了可視化分析能力的提升。本文將為大家分享兩家客戶的真實反饋,希望能夠幫助您進一步了解神策經營分析的能力。 發表于:10/10/2023 Spectrum儀器數字化儀可以10GS/s采樣速度傳輸無限數據流 COTS解決方案可存儲6小時以上的數據,并可持續進行信號處理 發表于:10/7/2023 面向區塊鏈數據交換的層次化訪問控制方法 傳統的集中式訪問控制模型在某些場景下存在局限性,特別是在政府部門、軍事應用等特殊場景中,數據的安全管理需要考慮保密性、完整性等因素,并且需要靈活且嚴格的訪問控制機制。此外,現有的層次化訪問控制方法對訪問層級區限的評估和驗證過程存在單點故障問題,且存在訪問層級區限泄露的風險。為了克服這些限制,提出了一種面向區塊鏈數據交換的層次化訪問控制方法,結合同態加密實現對訪問層級區限的保護。實驗結果表明,本方法有效地遏制了用戶“越級”訪問數據主體的安全問題,且在一些關鍵的功能上符合預期的運行效率。 發表于:9/26/2023 創作型人工智能應用下作者“數據控制權”的提出 當人工智能使用作品作為數據來源并制造產物時,可能無法構成合理使用。現有著作權法僅規定了控制作品電子存儲行為的復制權,缺少對“數據使用”行為的控制。使數據處理者在獲得電子存儲的復制許可后,可以利用權利要素的缺失,自由使用創作型人工智能生成數據產物,對作者利益造成損害。基此,提出了作者的“數據控制權”,并通過案例分析、文獻研究等方式,論述“數據控制權”設立的正當性、合理性并進行框架建構,填補著作權法中數據權利要素的缺失,對作品的數據權利進行針對性的保護,同時也兼顧了作者與數據處理者的利益,為人工智能的數據使用的行為,提供了一種基于數據權和著作權相結合的保護思路。 發表于:9/25/2023 數據流通的歐盟戰略及其鏡鑒 歐盟近年來著重數據流通,其相關戰略可提煉為數據主權、單一市場與共同空間。數據主權是歐盟因應數據博弈的核心戰略,內松外嚴的數據流動模式為其理念。單一數據市場是維護數據主權的關鍵路徑,歐盟制定系列法案意圖建設“公平、自立,跨地域、跨領域”的數據市場。共同數據空間是建設數據市場的助推機制,歐盟將基于基礎設施打造若干數據空間。對此,中國須理性鏡鑒,立足國情而非削足適履,建構扎根中國大地的數據流通制度體系。 發表于:9/25/2023 商業數據不正當競爭行為的司法規制研究* 當前大量存在的不正當商業數據抓取、流量劫持、數據封鎖、惡意干擾等行為,嚴重干擾了數字經濟時代商業活動的有序發展,并出現了表現形式多樣化與動態化的變化趨勢。針對商業數據不正當競爭行為的司法實踐印證了《反不正當競爭法》第2條及第12條的法律保障效果,同時也暴露出現有規定的概括性、條款之間規范的界限不明確、對“不正當競爭關系”認定不當等問題。為進一步加強商業數據不正當競爭行為司法規制,應通過統一標準以規范反不正當競爭法的適用,明確“競爭關系”作為司法適用的前提,構建有利于引導商業數據合理利用的多元化法治體系。 發表于:9/25/2023 基于三維人臉數據增強的深度偽造檢測方法 隨著深度偽造技術的發展,深度偽造視頻的制作及傳播變得越來越容易,給社會帶來了巨大的安全風險,深度偽造檢測算法成為當前網絡安全領域的重要方向。聚焦于提出一種泛化性能更好、效率更高、可解釋性更強的深度偽造檢測算法,主要針對DFDC、FaceForensic++及CelebDF三個深度偽造視頻數據集進行實驗并以這三個數據集集中訓練出檢測模型,首先使用人臉檢測算法MTCNN提取人臉圖像,進而將EfficientNet網絡與Transformer架構相結合作為檢測模型,通過采用三維人臉數據增強、注意力機制以及全局局部融合方法對模型進行訓練和測試。模型在未使用型集成、知識蒸餾等方法的基礎上,達到了與最優檢測效果相當的檢測水平。 發表于:9/25/2023 基于數據元件與數據金庫打造安全可信金融數據空間 基于中國電子提出的數據元件與數據金庫理念,數據要素市場被科學合理地切分為數據資源市場、數據元件市場、數據產品市場,實現數據“資源化、資產化、資本化”。安全可信金融數據空間通過搭建多對多的安全可信數據空間架構模型,融合公共數據和社會數據,以信用為手段,以金融科技為抓手,搭建政府、組織、企業和金融機構之間的數據安全流通橋梁,實現多主體在線供給需求對接,支撐數據要素實現安全、高效流通和跨域流通,形成符合經濟學原理的市場化配置體系。 發表于:9/25/2023 基于預訓練模型的基層治理敏感實體識別方法 基層治理產生的大量敏感數據可通過數據脫敏去除隱私內容,但這些數據包含較多非結構化文本數據,難以直接進行數據脫敏。因此,需要對非結構化文本數據進行命名實體識別以提取敏感數據。首先把敏感實體分為16類并對信訪文本進行標注,輸入層表示采用預訓練模型BERT,編碼層利用雙向長短時記憶網絡汲取上下文信息,解碼層通過條件隨機場模型優化序列,構建了較高精度的基層治理敏感實體識別模型。針對脫敏工作需要,改變假陰性和假陽性的loss權重,并采用敏感實體框選率輔助評價模型性能。在基層治理信訪數據集和公共數據集MSRA上進行實驗,F1值分別為88.38%和90.11%,相較于基準模型提升了4.64%和3.78%。該模型可應用于非結構化文本的敏感實體識別,識別成功率高。現有評價指標未能較好地反映敏感實體的間接推理關系,應當探索更完善的敏感實體評價體系。 發表于:9/25/2023 中國首個接入大模型的 Linux 操作系統來了 9 月 22 日,統信軟件運營的深度社區正式官宣 deepin 成為首個接入大模型的開源操作系統。 發表于:9/25/2023 英特爾示警數據中心芯片庫存嚴重 英特爾表示,數據中心芯片庫存消化時間遠比PC更長,整個數據中心業務將延宕復蘇。日前,更傳出英特爾一批數據中心服務器CPU以40~50%折扣出售,最后由騰訊、阿里等大客戶出手“救援”。 發表于:9/25/2023 ?…28293031323334353637…?