|
|
楼主 |
发表于 2008-2-27 14:35:05
|
显示全部楼层
从IRQ到IRQL(APIC版)
来自:http://www.nsfocus.net/index.php ... o=view&mid=2534
' a+ Q1 A7 R6 O! v! }
& \$ a3 @: E& s5 x) @从IRQ到IRQL(APIC版)& Y: a6 U$ y7 A
( T5 s% e/ T% c* S5 k6 {# d9 U
作者:SoBeIt
( N2 a6 }. I' C: L) f出处:https://www.xfocus.net/bbs/index.php?act=ST&f=2&t=45502- y( H* ]+ h$ K& R. \) Z
日期:2005-02-04
9 w$ n9 K! f: Q+ w' q/ p$ y4 o, p( z A1 y+ T
事实上,老久的PIC在很早以前就被淘汰了,取而代之的是APIC。由于APIC可以兼容PIC,所以在很多单处理器系统上我们看到的PIC实际是APIC的兼容PIC模式。APIC主要应用于多处理器操作系统,是为了解决IRQ太少和处理器间中断而产生的,当然,单处理器操作系统也可以使用APIC(不是模拟PIC)。APIC的HAL和PIC的HAL有很大的不同,很突出的一个特点就是APIC的HAL不用再象PIC的HAL那样虚拟一个中断控制器,IRQL的概念已经可以通过中断向量的形式被APIC支持。事实上,因为被APIC所支持,所以在APIC HAL里IRQL的实现比PIC HAL那样虚拟一个中断控制器要简单得多了。1 d2 O2 n3 @* y) g
* S2 e- D! r5 ?; j/ {! H; V
现在来简单介绍一下APIC的结构(关于APIC详细的描述请参考《IA-32 Inel Architecture Software Developer's Manual Volume 3 Chapter 8》)。整个APIC系统由本地APIC、IO APIC和APIC串行总线组成(在Pentium 4和Xeon以后,APIC总线放到了系统总线中)组成。每个处理器中集成了一个本地APIC,而IO APIC是系统芯片组中一部分,APIC总线负责连接IO APIC和各个本地APIC。本地APIC接收该处理器产生的本地中断比如时钟中断,以及由该处理器产生的处理器间中断,并从APIC串行总线接收来自IO APIC的消息;IO APIC负责接收所有外部的硬件中断,并翻译成消息选择发给接收中断的处理器,以及从本地APIC接收处理器间中断消息。
7 y9 T. b% v' O' b8 w* \9 N( ?% ~1 j( u. d! W8 ~1 \' z
和PIC一样,控制本地APIC和IO APIC的方法是通过读写该单元中的相关寄存器。不过和PIC不一样的是,Intel把本地APIC和IO APIC的寄存器都映射到了物理地址空间,本地APIC默认映射到物理地址0xffe00000,IO APIC默认映射到物理地址0xfec00000。windows HAL再进一步把本地APIC映射到虚拟地址0xfffe0000,把IO APIC映射到虚拟地址0xffd06000,也就是说对该地址的读写实际就是对寄存器的读写,本地APIC里几个重要的寄存有EOI寄存器,任务优先级寄存器(TPR),处理器优先级寄存器(PPR),中断命令寄存器(ICR,64位),中断请求寄存器(IRR,256位,对应每个向量一位),中断在服务寄存器(ISR,256位)等。IO APIC里几个重要的寄存器有版本寄存器,I/O寄存器选择寄存器、I/O窗口寄存器(用要访问的I/O APIC寄存器的索引设置地址I/O寄存器选择寄存器,此时访问I/O窗口寄存器就是访问被选定的寄存器)还有很重要的是一个IO重定向表,每一个表项是一个64位寄存器,包括向量和目标模式、传输模式等相关位,每一个表项连接一条IRQ线,表项的数目随处理器的版本而不一样,在Pentium 4上为24个表项。表项的数目保存在IO APIC版本寄存器的[16:23]位。APIC系统支持255个中断向量,但Intel保留了0-15向量,可用的向量是16-255。并引进一个概念叫做任务优先级=中断向量/16,因为保留了16个向量,所以可用的优先级是2-15。当用一个指定的优先级设置本地APIC中的任务优先级寄存器TPR后,所有优先级低于TPR中优先级的中断都被屏蔽,是不是很象IRQL的机制?事实上,APIC HAL里的IRQL机制也就是靠着这个任务优先级寄存器得以实现。同一个任务优先级包括了16个中断向量,可以进一步细粒度地区分中断的优先级。
; W5 F0 T. B# A3 x) N* z
9 I# _0 ^8 `6 |8 |$ f 在HAL里虽然HalBeginSystemInterrupt仍然是IRQL机制的发动引擎,但是因为有APIC的支持,它和其它共同实现IRQL的函数要比PIC HAL里对应的函数功能简单得多。HalBeginSystemInterrupt通过用IRQL做索引在HalpIRQLtoTPR数组中获取该IRQL对应的任务优先级,用该优先级设置任务优先级寄存器TPR,并把TPR中原先的任务优先级/16做为索引在HalpVectorToIRQL数组中获取对应的原先的IRQL然后返回。若IRQL是从低于DISPATCH_LEVEL提升到高于DISPATCH_LEVEL,还需要设置KPCR+0x95(0xffdff095)为DISPATCH_LEVEL(0x2),表示是从DISPATCH_LEVEL以下的级别提升IRQL。HalEndSystemInterrupt向本地APIC的EOI寄存发送0,表示中断结束,可以接收新中断。并还要判断要降到的IRQL是否小于DISPATCH_LEVEL,若小于则进一步判断KPCR+0x96(0xffdff096)是否置位,若置位则表示有DPC中断在等待(在IRQL高于DISPATCH_LEVEL被引发,然后等待直到IRQL降到低于DISPATCH_LEVEL),则将KPCR+0x95和KPCR+0x96清0后调用KiDispatchInterrupt响应DPC软中断。否则做的工作就是和HalBeginSystemInterrupt一样的过程:把要降到的IRQL转换成任务优先级设置TRP,并把久的任务优先级转成IRQL返回。KfRaiseIrql、KfLowerIrql之类的函数也是这么一回事,把当前IRQL转成任务优先级修改TPR,并把原先TPR的值转成原先的IRQL并返回。而现在软中断的产生也有了APIC支持,APIC通过产生一个发向自己的处理器间中断,就可以产生一个软中断,因为可以指定该中断的向量,所以软中断就可以区分优先级别,如APC_LEVEL、DISPATCH_LEVEL。产生软中断的函数一样还是HalRequestSoftwareInterrupt,该函数会先判断KPCR+0x95是否和要产生的软中断IRQL一样,若是的话则置位KPCR+0x96并返回,表示现在IRQL大于DISPATCH_LEVEL所以不处理DPC中断。否则以要产生的软中断的IRQL为索引从HalpIRQLtoTPRHAL取出对应任务优先级,并或上0x4000,表示是发向自身的固定处理间中断,并用该值设置中断命令寄存器ICW的低32位,然后读取中断命令寄存器ICW的低32位是否为0x1000,确定中断消息已经发送后就返回,这时候软中断已经产生。值得注意的是APIC HAL里没有HalEndSoftwareInterrupt这个函数。HAL为软中断的IRQL提供了一个固定的中断向量:
- C- i) x: l# F0 T$ }4 e
( o( Y) G. G+ r3 j. i) h#define ZERO_VECTOR 0x00 // IRQL 00 ( ?& H9 _8 h, f0 [8 S
#define APC_VECTOR 0x3D // IRQL 01( Z3 z4 }/ C0 D% M; x4 j
#define DPC_VECTOR 0x41 // IRQL 02& t! _/ X7 ^/ J2 w$ N/ ~$ q7 t
#define APIC_GENERIC_VECTOR 0xC1 // IRQL 27" t. d: h, Q- j0 J
#define APIC_CLOCK_VECTOR 0xD1 // IRQL 28
( c" x2 G" r ]5 O# H#define APIC_SYNCH_VECTOR 0xD1 // IRQL 28
! {$ \+ \! T, J3 F#define APIC_IPI_VECTOR 0xE1 // IRQL 29
! d4 M; o( f$ u+ F#define POWERFAIL_VECTOR 0xEF // IRQL 304 L5 Z5 i: |; c0 D7 r0 ~4 T
#define APIC_PROFILE_VECTOR 0xFD // IRQL 31
2 p* n# ^+ Z. S v% s7 p; s2 c8 V# K/ g0 Z3 k1 l) H# l% q' k1 V
( q8 j# t( n. H6 } i( E$ ~
现在看一下一些重要的数据:
, ?4 u8 @& Z( D- I I N3 W) O! p" P3 \+ ^8 i* \7 ]
这是我写的代码输出的IO APIC重定向表内容:
+ r- `2 I1 [+ R2 B; P3 [6 d) ?" G% u7 d# J/ {0 ^$ B
Redirect Table Index: 0x17* w% \6 ^3 M; r1 h; D1 Y/ `4 C
Redirect Table[ 0]: ff* `: @, H) [& C* R/ }
Redirect Table[ 1]: b3% Y m+ f& s% Z4 Q1 E/ e
Redirect Table[ 2]: ff
, L# K- N4 r1 {; S" m7 H: t0 xRedirect Table[ 3]: 51. g! g2 V' G6 x" k; s2 i3 a# n4 ~2 S
Redirect Table[ 4]: ff+ V8 }3 ^- k( C4 m+ }
Redirect Table[ 5]: ff
+ [+ F8 ~+ G7 oRedirect Table[ 6]: 62
; z$ m1 ?: z7 H! IRedirect Table[ 7]: ff
* v! L' _1 q+ R, J# ~Redirect Table[ 8]: d1
% {+ q7 H1 @* L& P- Q8 {" CRedirect Table[ 9]: b1
7 B, l7 I+ \7 A8 u/ g3 s# BRedirect Table[ a]: ff
; N" d3 y: ~2 H% Y: q# |/ ?' J$ G4 iRedirect Table[ b]: ff
; a) o# @7 f! D3 m9 jRedirect Table[ c]: 52
M, `- ~ n7 @. Z9 Z4 V% hRedirect Table[ d]: ff
# l4 G' n& |" R1 P; _Redirect Table[ e]: ff
: L. W+ J: k5 z5 h5 GRedirect Table[ f]: 92" e& ` q$ D9 _
Redirect Table[10]: ff' q' c- y$ V! Q: {9 V7 A
Redirect Table[11]: a3
n# y1 J6 k: J( FRedirect Table[12]: 83; e4 Y+ g" B g* ?- T
Redirect Table[13]: 93
8 [5 i" [4 C- y. k V: l* k# bRedirect Table[14]: ff" U: K% _& p* G8 F
Redirect Table[15]: ff6 H& T' ]; d$ z( I' d/ Q* _7 N( {
Redirect Table[16]: ff; @% A: V' [" w8 s
Redirect Table[17]: ff! f% E8 h8 i# P$ U
" l8 d7 @, c& q" ^+ N
这是IDT表中被注册的向量:
! m: U6 \" m" ]1 a
- b8 q4 `: J$ z- L* |$ Z4 |1f: 80064908 (hal!HalpApicSpuriousService)
/ k8 Y7 J# ], i! l& ?2 c37: 800640b8 (hal!PicSpuriousService37)
: [ p# M4 w0 f3d: 80065254 (hal!HalpApcInterrupt)
/ k4 }9 f4 q6 E8 `5 A7 ?9 H41: 800650c8 (hal!HalpDispatchInterrupt)
! G& q: P9 @! m4 {, h50: 80064190 (hal!HalpApicRebootService)& ^9 }( c5 _; ^% A T
51: 817f59e4% }1 ^9 P& m, ~( `7 b) N
(Vector:51,Irql:4,SyncIrql:4,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:serial!SerialCIsrSw(f3c607c7))
1 R$ ]. e% h4 W0 C$ W4 G52: 817f5044
7 J. k$ C) K5 ~3 e! h* B(Vector:52,Irql:4,SyncIrql:a,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:i8042prt!I8042MouseInterruptService(f3c57a2c)) s- ]1 r6 w N+ r, Y2 R
83: 817d2d44
) _1 _& w9 a8 L4 B3 h3 d(Vector:83,Irql:7,SyncIrql:7,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:NDIS!ndisMIsr(bff1b794))
9 ?$ v. Z2 n$ I( f n92: 81821384 # n$ b/ N# }* h' t% e
(Vector:92,Irql:8,SyncIrql:8,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:atapi!ScsiPortInterrupt(bff892be))
, p5 r9 M, g( V* Q9 j93: 8185ed64
A0 @2 S5 i! e5 w(Vector:93,Irql:8,SyncIrql:8,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:uhcd!UHCD_InterruptService(f3f0253e))3 O9 I- x- c/ E6 p
a3: 8186cdc4
" E" @9 }. @8 ~+ a) h(Vector:a3,Irql:9,SyncIrql:9,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:SCSIPORT!ScsiPortInterrupt(bff719f0))
# m& `' b6 f2 X& nb1: 818902e4
3 D# J1 P3 ~9 b/ g" ?! c(Vector:b1,Irql:a,SyncIrql:a,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:ACPI!ACPIInterruptServiceRoutine(bffe14b4))2 p) o d5 T9 l9 D: Y" ^" C* g! w
b3: 81881664
2 w$ V. w; H+ R- D: [* O(Vector:b3,Irql:a,SyncIrql:a,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:i8042prt!I8042KeyboardInterruptService(f3c51918))# a" g- @) K! E! c( E! h
c1: 800642fc (hal!HalpBroadcastCallService)
& L' h5 Z8 \5 p" b) {2 nd1: 80063964 (hal!HalpClockInterrupt)
9 R& N6 M" J3 x! Re1: 80064858 (hal!HalpIpiHandler)( i1 n/ s5 N8 V8 h
e3: 800645d4 (hal!HalpLocalApicErrorService)
2 _( U8 F$ V* E. b4 I2 W+ E- f; @fd: 80064d64 (hal!HalpProfileInterrupt)( v ?$ b$ y+ |, X$ ?/ O) P/ n
fe: 80064eec (hal!HalpPerfInterrupt)
1 `! g( D N) @! ? x" P1 V
; e8 P* ~" v3 }! }* o; M: i7 D象a3、b1这类输出内容很多的是被硬件注册的中断向量,而象d1、e3这种输出内容少的是注册为了的HAL内部使用的中断向量和本地APIC中断向量8 N5 D. Y5 D9 f" A
5 A8 x2 x' Z% I6 s# S! g
这是几个重要的数组:& x" E4 n# F) Y) P8 W s5 W
! R }$ Y% s! D% c* x) f$ p
HalVectorToIrql(这个数组是以向量除于16做索引):6 a& @# j1 U$ @# r# n
8006a304 00 ff ff 01 02 04 05 06-07 08 09 0a 1b 1c 1d 1e) i3 y- L2 ^7 D# V e6 e' X( w
0 R5 Q) |0 `$ v, R; aHalpIRQLtoTPR:
; m# M: P% {2 Q2 l* a" y# G$ t8006a1e4 00 3d 41 41 51 61 71 81-91 a1 b1 b1 b1 b1 b1 b1( f7 S& l, S& b K
8006a1f4 b1 b1 b1 b1 b1 b1 b1 b1-b1 b1 b1 c1 d1 e1 ef ff
5 H O- J5 y3 s8 u. i: Y: p' d1 z s* _5 ~( r
HalpINTItoVector:
8 o) o8 y" `$ t6 g6 _1 Q# a3 j1 Z8006ada0 00 b3 61 51 a2 b2 62 91-a1 b1 71 81 52 82 72 920 j( m; h7 `. y( A5 p
8006adb0 00 a3 83 93 00 00 00 00-00 00 00 00 00 00 00 00
1 U% O* W9 d; f$ h2 a! j8 C9 z. D6 s
HalVectorToINTI:
3 N9 |5 @. f6 U3 w9 e) N8006a204 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff3 [$ S8 `& u& }, K9 G" F! F/ Y" _ X* l
8006a214 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
: q: T. r+ I5 K0 U# w8006a224 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff% l3 w$ M0 i9 t# ], z8 S2 U
8006a234 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff* c& A1 d# O3 a5 E+ E0 M6 J" s
8006a244 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff& b7 J9 o6 i- O
8006a254 ff 03 0c ff ff ff ff ff-ff ff ff ff ff ff ff ff
" C5 C: E; I1 ^- Z+ J+ C& M8006a264 ff 02 06 ff ff ff ff ff-ff ff ff ff ff ff ff ff
9 i: K& C; q; X- q/ } q8006a274 ff 0a 0e ff ff ff ff ff-ff ff ff ff ff ff ff ff
' C: K. l0 r' \6 _) j+ H6 O1 p8006a284 ff 0b 0d 12 ff ff ff ff-ff ff ff ff ff ff ff ff& O! p3 ~. Y, b+ T5 b/ ~ m( ~7 ?" W
8006a294 ff 07 0f 13 ff ff ff ff-ff ff ff ff ff ff ff ff
8 G/ ~' y v+ f9 |8006a2a4 ff 08 04 11 ff ff ff ff-ff ff ff ff ff ff ff ff& o: I7 S! T/ M) e2 |% Z5 e& \
8006a2b4 ff 09 05 01 ff ff ff ff-ff ff ff ff ff ff ff ff
0 ~% d6 p+ ~& s0 \8006a2c4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
7 j) U3 T, |. P/ |9 h1 n& H G8006a2d4 ff 08 ff ff ff ff ff ff-ff ff ff ff ff ff ff ff) U4 g+ t9 z. `$ q
8006a2e4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
2 l3 y8 x; c2 F! _8006a2f4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff & A4 s- N. L. i7 ^- o& ~
+ w% d- j3 a# B* U0 \3 `; C
: U5 `' A2 y7 F8 C0 H+ L, DvBucket:5 z4 J) i/ t: c! u i4 S1 v
8006ae30 02 02 02 03 03 03 03
4 S4 W" Y/ o) n, C* k! O
1 j& C3 o+ E6 U& C% F7 I4 | 举个例子来说明一下,在我虚拟机里SCSI Controller的IRQ是17(注意,已经大于16了),到重定向表中查找第17项,得到中断向量为0xa3,再看IDT,0xa3对应处理例程是SCSIPORT!ScsiPortInterrupt。; u$ J$ ^ k5 a$ E
) o" I: z/ h2 k0 e0 p vBucket数组干啥用的?它就是用来分配新的向量。分配算法很简单,当要分配一个新的向量时,就在vBucket数组从右到左搜索最小的一个数i,该数对应在vBucket中索引为Index,新向量为(0x50+Index*16+i+1),新向量对应的IRQL为(4+i+1),同时会把vBucket中这个i加1,i不等大于16。象给出的这个vBucket,下一次计算时i=2, index=2。不过这些用于硬件的向量在IO系统初始化时调用HalpGetSystemInterruptVector分配好了,然后通过IoConnectInterrupt把IDT中注册的向量位置的例程注册为中断处理程序。这里并不是每个注册的向量都会对应中断处理程序,象上面给出的例子中,0xa1、0xa2、0xb1等向量就没有对应。
' S. ^' f) G- [3 Q: V$ K5 e" J" N& `7 O0 B" P" p: O! `; F
IRQL机制为内核同步提供了很大的便利,既对驱动开发者隐藏了底层中断机制,也方便了驱动开发者的内核同步。LINUX从2.5内核开始引进的软中断和任务队列等机制,很大程度上也来自windows这套机制的借鉴。2 h: p. Z# m" w. X1 _$ r, N
7 w# e$ T" S- o7 W0 s! n9 c$ @/ m
终于考完试,解放了,呵呵。这个东西其实还有很多可写的,只是没空再深入去分析了。在未来的64位系统里,APIC这种基于中断引脚的机制很快也要被SAPIC这种基于消息的更强大的机制所取代 |
|