《電子技術應用》
您所在的位置:首頁 > 嵌入式技術 > 業界動態 > Linux超線程感知的調度算法研究

Linux超線程感知的調度算法研究

2008-06-24
作者:李 亮,吳慶波

  摘 要: Intel公司的超線程" title="超線程">超線程技術(Hyper-Threading Technology)是一項新的微處理器體系結構技術,它在傳統指令級并行的基礎上提供了線程級并行。分析了超線程技術" title="超線程技術">超線程技術的特點,重點研究了Linux超線程感知調度優化技術,解決了對Intel處理器的有效支持問題,并且進行了相關的性能評測。
  關鍵詞: 超線程技術 多處理器 Linux


  隨著計算機應用的日益普及,用戶對計算機的處理能力的需求成指數級增長。為了滿足用戶的需求,處理器生產廠商采用了諸如超流水、分支預測、超標量、亂序執行及緩存等技術以提高處理器的性能。但是這些技術的采用增加了微處理器的復雜性,帶來了諸如材料、功耗、光刻、電磁兼容性等一系列問題。因此處理器設計人員開始尋找新的途徑來提高處理器的性能。Intel公司于2002年底推出了超線程技術,通過共享處理器的執行資源,提高CPU的利用率,讓處理單元獲得更高的吞吐量。
1 超線程技術背景
  傳統的處理器內部存在著多種并行操作方式。①指令級并行ILP(Instruction Level Paramllelism):同時執行幾條指令,單CPU就能完成。但是,傳統的單CPU處理器只能同時執行一個線程,很難保證CPU資源得到100%的利用,性能提高只能通過提升時鐘頻率和改進架構來實現。②線程級并行TLP(Thread Level Paramllesim):可以同時執行多個線程,但是需要多處理器系統的支持,通過增加CPU的數量來提高性能。
  超線程微處理器將同時多線程技術SMT(Simultaneous Multi-Threading)引入Intel體系結構,支持超線程技術的操作系統將一個物理處理器視為兩個邏輯處理器,并且為每個邏輯處理器分配一個線程運行。物理處理器在兩個邏輯處理器之間分配高速緩存、執行單元、總線等執行資源,讓暫時閑置的運算單元去執行其他線程代碼,從而最大限度地提升CPU資源的利用率。
  Intel 超線程技術通過復制、劃分、共享Intel的Netburst微架構的資源讓一個物理CPU中具有兩個邏輯CPU。(1)復制的資源:每個邏輯CPU都維持一套完整的體系結構狀態,包括通用寄存器、控制寄存器、高級可編程寄存器(APIC)以及一些機器狀態寄存器,體系結構狀態對程序或線程流進行跟蹤。從軟件的角度,一旦體系結構狀態被復制,就可以將一個物理CPU視為兩個邏輯CPU。(2)劃分的資源:包括重定序(re-order)緩沖、Load/Store緩沖、隊列等。劃分的資源在多任務模式時分給兩個邏輯CPU使用,在單任務模式時合并起來給一個邏輯CPU使用。(3)共享的資源:包括cache及執行單元等,邏輯CPU共享物理CPU的執行單元進行加、減、取數等操作。
  在線程調度時,體系結構狀態對程序或線程流進行跟蹤,各項工作(包括加、乘、加載等)由執行資源(處理器上的單元)負責完成。每個邏輯處理器可以單獨對中斷作出響應。第一個邏輯處理器跟蹤一個線程時,第二個邏輯處理器可以同時跟蹤另一個線程。例如,當一個邏輯處理器在執行浮點運算時,另一個邏輯處理器可以執行加法運算和加載操作。擁有超線程技術的CPU可以同時執行處理兩個線程,它可以將來自兩個線程的指令同時發送到處理器內核執行。處理器內核采用亂序指令調度并發執行兩個線程,以確保其執行單元在各時鐘周期均處于運行狀態。
  圖1和圖2分別為傳統的雙" title="的雙">的雙處理器系統和支持超線程的雙處理器系統。傳統的雙處理器系統中,每個處理器有一套獨立的體系結構狀態和處理器執行資源,每個處理器上只能同時執行一個線程。支持超線程的雙處理器系統中,每個處理器有兩套獨立體系結構狀態,可以獨立地響應中斷。


2 Linux超線程感知調度優化
  Linux從2.4.17版開始支持超線程技術,傳統的Linux O(1)調度器" title="調度器">調度器不能區分物理CPU和邏輯CPU,因此不能充分利用超線程處理器的特性。Ingo Monlar編寫了“HT-aware scheduler patch”,針對超線程技術對O(1)調度器進行了調度算法優化:優先安排線程在空閑的物理CPU的邏輯CPU上運行,避免資源競爭帶來的性能下降;在線程調度時考慮了在兩個邏輯CPU之間進行線程遷移的開銷遠遠小于物理CPU之間的遷移開銷以及邏輯CPU共享cache等資源的特性。這些優化的相關算法被Linux的后期版本所吸收,具體如下:
  (1)共享運行隊列
  在對稱多處理SMP(Symmetrical Multi-Processing)環境中,O(1)調度器為每個CPU分配了一個運行隊列,避免了多CPU共用一個運行隊列帶來的資源競爭。Linux會將超線程CPU中的兩個邏輯CPU視為SMP的兩個獨立CPU,各維持一個運行隊列。但是這兩個邏輯CPU共享cache等資源,沒有體現超線程CPU的特性。因此引入了共享運行隊列的概念。HT-aware scheduler patch在運行隊列struct runqueue結構中增加了nr_cpu和cpu兩個屬性,nr_cpu記錄物理CPU中的邏輯CPU數目,CPU則指向同屬CPU(同一個物理CPU上的另一個邏輯CPU)的運行隊列,如圖3所示。


  在Linux中通過調用sched_map_runqueue( )函數實現兩個邏輯CPU的運行隊列的合并。sched_map_runqueue( )首先會查詢系統的CPU隊列,通過phys_proc_id(記錄邏輯CPU所屬的物理CPU的ID)判斷當前CPU的同屬邏輯CPU。如果找到同屬邏輯CPU,則將當前CPU運行隊列的cpu屬性指向同屬邏輯CPU的運行隊列。
  (2)支持“被動的”負載均衡" title="負載均衡">負載均衡
  用中斷驅動的均衡操作必須針對各個物理 CPU,而不是各個邏輯 CPU。否則可能會出現兩種情況:一個物理 CPU 運行兩個任務,而另一個物理 CPU 不運行任務;現有的調度程序不會將這種情形認為是“失衡的”。在調度程序看來,似乎是第一個物理處理器上的兩個 CPU運行1-1任務,而第二個物理處理器上的兩個 CPU運行0-0任務。
  在2.6.0版之前,Linux只有通過load_balance( )函數才能進行CPU之間負載均衡。當某個CPU負載過輕而另一個CPU負載較重時,系統會調用load_balance( )函數從重載CPU上遷移線程到負載較輕的CPU上。只有系統最繁忙的CPU的負載超過當前CPU負載的 25% 時才進行負載平衡。找到最繁忙的CPU(源CPU)之后,確定需要遷移的線程數為源CPU負載與本CPU負載之差的一半,然后按照從 expired 隊列到 active 隊列、從低優先級線程到高優先級線程的順序進行遷移。
  在超線程系統中進行負載均衡時,如果也是將邏輯CPU等同于SMP環境中的單個CPU進行調度,則可能會將線程遷移到同一個物理CPU的兩個邏輯CPU上,從而導致物理CPU的負載過重。
  在2.6.0版之后,Linux開始支持NUMA(Non-Uniform Memory Access Architecture)體系結構。進行負載均衡時除了要考慮單個CPU的負載,還要考慮NUMA下各個節點的負載情況。
  Linux的超線程調度借鑒NUMA的算法,將物理CPU當作NUMA中的一個節點,并且將物理CPU中的邏輯CPU映射到該節點,通過運行隊列中的node_nr_running屬性記錄當前物理CPU的負載情況。
  Linux通過balance_node( )函數進行物理CPU之間的負載均衡。物理CPU間的負載平衡作為rebalance_tick( )函數中的一部分在 load_balance( )之前啟動,避免了出現一個物理CPU運行1-1任務,而第二個物理CPU運行0-0任務的情況。balance_node( )函數首先調用 find_
  busiest_node( )找到系統中最繁忙的節點,然后在該節點和當前CPU組成的CPU集合中進行 load_balance( ),把最繁忙的物理CPU中的線程遷移到當前CPU上。之后rebalance_tick( )函數再調用load_balance(工作集為當前的物理CPU中的所有邏輯CPU)進行邏輯CPU之間的負載均衡。
  (3)支持“主動的”負載均衡
  當一個邏輯 CPU 變成空閑時,可能造成一個物理CPU的負載失衡。例如:系統中有兩個物理CPU,一個物理CPU上運行一個任務并且剛剛結束,另一個物理CPU上正在運行兩個任務,此時出現了一個物理CPU空閑而另一個物理CPU忙的現象。
  Linux中通過active_load_balance( )函數進行主動的負載均衡,active_load_balance( )函數用于在所有的邏輯CPU中查詢該CPU的忙閑情況。如果發現由于超線程引起的負載不平衡(一個物理CPU的兩個邏輯CPU都空閑,另一個物理CPU的兩個邏輯CPU都在運行兩個線程),則喚醒一個需要遷移的線程,將它從一個忙的物理CPU遷移到一個空閑的物理CPU上。
  active_load_balance( )通過調用cpu_rq( )函數得到每一個邏輯CPU上的運行隊列。如果運行隊列上的當前運行線程為idle線程,則說明當前邏輯CPU為空閑;如果發現一個物理CPU兩個邏輯CPU都為空閑,而另一個物理CPU中的兩個邏輯CPU的運行隊列為繁忙的情況,則說明存在超線程引起的負載不均衡。這時當前CPU會喚醒遷移服務線程(migration_thread)來完成負載均衡的線程遷移。
  (4)支持超線程感知的任務挑選
  在超線程處理器中,由于cache資源為兩個邏輯處理器共享,因此調度器在選取一個新任務時,必須確保同組的任務盡量共享一個物理CPU,從而減少cache失效的開銷,提高系統的性能。而傳統的調度器只是簡單地為邏輯CPU選取一個任務,沒有考慮物理CPU的影響。
  Linux進行線程切換時會調用schedule( )函數進行具體的操作。如果沒有找到合適的任務schedule()函數,則會調度idle線程在當前CPU上運行。在超線程環境中Linux調度idle線程運行之前會查詢其同屬CPU的忙閑狀況。如果同屬CPU上有等待運行的線程,則會調用一次load_balance( )函數在兩個同屬CPU之間作一次負載均衡,將等待運行的線程遷移到當前CPU上,保證優先運行同屬CPU上的任務。
  (5)支持超線程感知的CPU喚醒
  傳統的調度器只知道當前CPU,而不知道同屬的邏輯CPU。在超線程環境下,一個邏輯CPU正在執行任務時,其上的一個線程被喚醒了,此時,如果它的同屬邏輯CPU是空閑的,則應該在同屬邏輯CPU上運行剛剛喚醒的任務。
  Linux通過wake_up_cpu( )函數實現CPU喚醒,在try_o_wakeup、pull_task、move_task_away加入了wake_up_cpu( )函數的相應調用點。wake_up_cpu()首先查詢當前CPU是不是空閑的,如果當前CPU為空閑,則調用resched_cpu( )函數啟動調度器,將喚醒的線程調度到當前CPU執行;否則查找其同屬邏輯CPU。如果同屬邏輯CPU是空閑的,則將喚醒的線程調度到同屬邏輯CPU上執行;否則比較喚醒的線程和當前CPU上運行的線程的優先級。如果喚醒的線程的優先級高,或者優先級相等但是時間片多,則進行線程切換,在當前CPU上調度執行喚醒的線程。如果上述條件都不滿足,最后比較喚醒的線程和當前CPU的同屬邏輯CPU上運行的線程的優先級,如果喚醒的線程的優先級高,或者優先級相等但是時間片多,則在同屬邏輯CPU上調度執行喚醒的線程。
3 性能測試
  Linux-2.6.0 HT-aware scheduler patch實現了上述超線程調度優化。這里根據linux-2.6.0 HT-aware scheduler patch對這幾種調度優化進行了性能測試。
  測試硬件環境:Xeon 2.2GHz處理器(支持超線程)×4,2GB SDRAM內存。
  Benchmark:(1)Volanomark是一個純Java的benchmark,專門用于測試系統調度器和線程環境的綜合性能。它建立一個模擬Client/Server方式的Java聊天室,通過獲取每秒平均發送的消息數來評測宿主機綜合性能(數值越大性能越好)。Volanomark測試與Java虛擬機平臺相關,本文使用Sun Java SDK 1.4.2作為測試用Java平臺,Volanomark版本2.5.0.9。(2)LMBench是一個用于評價系統綜合性能的多平臺開源benchmark,對其進行修改后實現了lat_thread_ctx接口,用來測試線程的切換開銷。
  圖4表明開啟超線程后Volanomark在Linux-2.6.0平臺下平均吞吐量提高了25.5%。由于Linux的O(1)內核調度器比較好地實現了SMP負載均衡算法,所以在超線程環境下整個系統的性能也有了比較好的提升。
  圖5顯示出Linux在進行了超線程調度優化后,在支持超線程的平臺上所獲得的性能加速比。在Linux-2.6.0加入HT-aware scheduler patch后Volanomark的平均吞吐提高了 8.5%,分別實現主動負載均衡、被動的負載均衡、CPU喚醒和任務挑選的相關代碼后,吞吐量分別提高了1.8.%、2.5%、2.3%和2.1%。

?


  使用Lmbench創建10~150個線程,在不同的負載條件下測試線程的切換開銷。表1的數據顯示HT-aware scheduler patch可以將線程的切換開銷減少3%~7%。數據顯示:在輕負載情況下,系統可以獲得更多的加速比。這是因為被動的負載均衡以及主動的負載均衡只有在系統有CPU空閑時才能發揮比較好的作用。


4 相關工作和展望
  采用支持超線程技術的Linux可以獲得較大的性能提升。但是其調度算法還要根據實際的應用進一步研究。參考文獻[7]中提出了用“Symbiosis”概念來衡量多個線程在SMT環境中同時執行的有效性。參考文獻[8]中提出了線程敏感的調度算法,用一組硬件性能計數器計算兩個邏輯CPU上運行不同作業子集的執行信息,利用這些信息來預測不同作業子集的執行性能,并選擇具有最好預測性能的作業子集調度同一個物理CPU執行。參考文獻[9]中主要研究了適合SMT 結構并考慮作業優先級的調度器。研究結果表明,這些調度算法能有效地提高超線程系統的性能。
  Intel的超線程技術是其企業產品線中的重要特征,并將會集成到越來越多的產品中,它標志著Intel微處理器一個新的時代:從指令級并行到線程級并行,這樣可使微處理器運行模式與多線程應用的運行模式更加接近,應用程序可以充分利用線程級并行和指令級并行進行優化。隨著超線程處理器的發展,可能會出現操作系統使用處理器系統中硬件性能監視器估算系統在某一時間段的某些性能指標,然后利用這些性能指標來指導線程的調度策略。
參考文獻
1 Vianney D.Hyper-Threading speeds Linux.http://www-106.ibm.com/developerworks/linux/library/l-htl/,2003
2 Marr D T,Binns F,Hill D L.Hyper-Threading technology architecture and microarchitecture.Intel Technology Journal,2002
3 IntelXeonTM Processor Family for Servers with Hyper-Threading Technology.Intel white paper,2002
4 Volano LLC.Volano Chat.http://www.volano.com/benchmarks.html
5 Larry M V.LMbench-Tools for Performance Analysis.http://www.bitmover.com/lmbench/
6 Bulusu P,Kumar J,Shetty S.HyperThreading-A Voyage.Intel Technology Journal,2002
7 Snavely A,Tullsen D M,Voelker G.Symbiotic Jobscheduling with Priorities for a Simultaneous Multithreading Processor.In:Proc.of International Conference on Measurement and Modeling of Computer Systems,June,2002
8 Parekh S S,Eggers S J,Levy H M et al.Thread-Sensitive Scheduling for SMT Processors.Technical Report,University of Washington,2000
9 Bulpin J R,Pratt L A.Hyper-Threading Aware Process Scheduling Heuristics.In:USENIX Annual Technical Confer-ence,2005

本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。
欧美激情办公室aⅴ_国产欧美综合一区二区三区_欧美午夜精品久久久久免费视_福利视频欧美一区二区三区

          在线观看视频一区二区欧美日韩| 亚洲国产精品一区二区尤物区| 久久国产精品色婷婷| 亚洲免费av电影| 亚洲国产精品尤物yw在线观看| 国产亚洲欧美中文| 国产婷婷精品| 国产精品资源| 国产精品久久久久久久久免费 | 欧美日韩高清在线观看| 美女成人午夜| 久久免费视频观看| 久久精品综合| 久久成人人人人精品欧| 久久电影一区| 久久国产乱子精品免费女| 欧美亚洲综合久久| 欧美一级专区免费大片| 欧美一级专区| 久久精品网址| 久久人人爽人人爽爽久久| 久久综合给合久久狠狠色| 麻豆成人在线观看| 欧美国产乱视频| 欧美精品1区| 欧美日韩国产成人| 欧美午夜视频一区二区| 国产精品久久久久9999| 国产美女在线精品免费观看| 国产欧美一区二区三区在线看蜜臀| 国产精品久久久久久久浪潮网站| 国产精品欧美在线| 国产一区二区高清不卡| 国产综合色产在线精品| 在线高清一区| 亚洲黄色片网站| 亚洲乱码国产乱码精品精98午夜| 在线亚洲美日韩| 欧美亚洲一区二区在线| 久久国产精品网站| 噜噜噜噜噜久久久久久91| 欧美午夜三级| 欧美性猛片xxxx免费看久爱| 国产精品欧美久久| 国内揄拍国内精品久久| 亚洲国产人成综合网站| 日韩一级精品视频在线观看| 亚洲一区久久久| 久久久久久久网站| 欧美理论电影网| 欧美视频在线一区| 久久久久国色av免费观看性色| 久久婷婷色综合| 欧美99久久| 欧美三日本三级三级在线播放| 国产精品美女999| 激情久久五月天| 亚洲国产成人tv| 一区二区三区国产盗摄| 欧美一区视频| 欧美成人r级一区二区三区| 欧美日韩中文字幕在线| 国产欧美日韩综合| 亚洲国产精品激情在线观看| 一区二区三区日韩在线观看| 久久精品91久久久久久再现| 欧美激情一区在线观看| 国产视频亚洲精品| 日韩亚洲成人av在线| 欧美在线免费观看视频| 欧美日本韩国| 国产在线成人| 国产欧美一区二区白浆黑人| 黑人操亚洲美女惩罚| 99精品久久久| 久久激情五月激情| 欧美视频在线观看免费| 1024亚洲| 亚洲欧美日韩另类| 欧美激情二区三区| 国产一区二区三区久久久| 亚洲福利一区| 午夜久久一区| 欧美日韩免费一区| 精品不卡一区二区三区| 亚洲一区精品在线| 欧美黑人一区二区三区| 国产欧美日韩精品一区| 亚洲免费观看在线视频| 久久午夜国产精品| 国产欧美日韩三区| 亚洲素人在线| 欧美美女福利视频| 亚洲高清不卡| 久久精品在线观看| 国产免费观看久久| 亚洲视频在线视频| 欧美精品一区二区三区一线天视频 | 99精品国产一区二区青青牛奶| 久久久久久一区二区| 国产精品亚洲产品| 夜夜狂射影院欧美极品| 欧美成人免费网| 在线色欧美三级视频| 久久精品久久综合| 国产欧美精品一区| 亚洲在线观看| 欧美午夜片欧美片在线观看| 日韩一级免费| 欧美久久视频| 亚洲精品护士| 欧美二区在线看| 亚洲国产综合在线看不卡| 久久综合一区二区| 永久域名在线精品| 可以看av的网站久久看| 在线不卡a资源高清| 久久人体大胆视频| 精品不卡一区| 久久最新视频| 亚洲国产日韩美| 欧美3dxxxxhd| 亚洲国产免费看| 欧美成人a视频| 亚洲精品免费一二三区| 欧美精品久久久久久久久老牛影院| 亚洲激情一区| 欧美伦理影院| 一区二区三区欧美日韩| 欧美午夜激情小视频| 亚洲一区二区成人| 国产乱码精品一区二区三区av| 欧美一区二区三区四区在线 | 在线视频观看日韩| 美女任你摸久久| 亚洲黄色在线视频| 欧美日韩1区2区3区| 在线视频一区二区| 国产精品视频成人| 欧美专区在线| 精品福利免费观看| 免费在线成人| 亚洲精品色图| 欧美午夜影院| 午夜精品久久久久久久男人的天堂| 国产精品一区二区视频| 久久久久免费视频| 亚洲人成在线观看一区二区| 欧美日韩国产不卡在线看| 亚洲视频在线观看三级| 国产农村妇女精品一二区| 久久蜜桃香蕉精品一区二区三区| 在线欧美日韩国产| 欧美大片18| 亚洲午夜精品一区二区| 国产日韩欧美在线| 免费久久精品视频| 在线亚洲美日韩| 国产一区二区黄| 欧美成人高清| 亚洲一区二区三区色| 国内精品久久久久久久97牛牛| 欧美jizz19hd性欧美| 中日韩高清电影网| 国产亚洲aⅴaaaaaa毛片| 欧美mv日韩mv国产网站app| 亚洲午夜极品| 依依成人综合视频| 欧美视频在线观看免费| 久久久精品国产免大香伊 | 快she精品国产999| 一级日韩一区在线观看| 国产综合在线视频| 欧美人与禽性xxxxx杂性| 欧美一区二区视频观看视频| 亚洲国产天堂久久综合网| 国产精品入口麻豆原神| 欧美成人国产一区二区| 午夜免费在线观看精品视频| 亚洲国产99精品国自产| 国产精品国产一区二区| 久色成人在线| 亚洲综合99| 亚洲激情一区二区| 国产精品系列在线| 欧美激情一区在线观看| 欧美一区二区三区在线看| 亚洲蜜桃精久久久久久久| 国产一区二区中文字幕免费看| 欧美日本在线| 久久综合图片| 欧美一级成年大片在线观看| 99精品欧美一区二区三区| 伊人男人综合视频网| 国产精品拍天天在线| 欧美精品国产一区二区| 久久久久久日产精品| 亚洲欧美国产视频| aaa亚洲精品一二三区| 在线日韩中文字幕|