|
|
楼主 |
发表于 2008-2-27 14:35:05
|
显示全部楼层
从IRQ到IRQL(APIC版)
来自:http://www.nsfocus.net/index.php ... o=view&mid=25343 J2 B/ X9 ?$ W, ^5 m! @
4 |4 @8 W5 k2 I0 n' C# d从IRQ到IRQL(APIC版); {# Y; B, M' a$ o0 f* v4 i0 o( I
; m% s9 E4 y( [* B作者:SoBeIt! i% ?. s& m" E8 e- M3 |
出处:https://www.xfocus.net/bbs/index.php?act=ST&f=2&t=45502! j# E% }; x, ^% f+ |
日期:2005-02-04
" | p/ V- w3 ^$ k" ?9 o! u% Y( z3 @1 w+ A+ y, N3 D7 X
事实上,老久的PIC在很早以前就被淘汰了,取而代之的是APIC。由于APIC可以兼容PIC,所以在很多单处理器系统上我们看到的PIC实际是APIC的兼容PIC模式。APIC主要应用于多处理器操作系统,是为了解决IRQ太少和处理器间中断而产生的,当然,单处理器操作系统也可以使用APIC(不是模拟PIC)。APIC的HAL和PIC的HAL有很大的不同,很突出的一个特点就是APIC的HAL不用再象PIC的HAL那样虚拟一个中断控制器,IRQL的概念已经可以通过中断向量的形式被APIC支持。事实上,因为被APIC所支持,所以在APIC HAL里IRQL的实现比PIC HAL那样虚拟一个中断控制器要简单得多了。
( d% _ N. C3 f# Q5 S& _5 i
# D5 y: K1 q5 B( R 现在来简单介绍一下APIC的结构(关于APIC详细的描述请参考《IA-32 Inel Architecture Software Developer's Manual Volume 3 Chapter 8》)。整个APIC系统由本地APIC、IO APIC和APIC串行总线组成(在Pentium 4和Xeon以后,APIC总线放到了系统总线中)组成。每个处理器中集成了一个本地APIC,而IO APIC是系统芯片组中一部分,APIC总线负责连接IO APIC和各个本地APIC。本地APIC接收该处理器产生的本地中断比如时钟中断,以及由该处理器产生的处理器间中断,并从APIC串行总线接收来自IO APIC的消息;IO APIC负责接收所有外部的硬件中断,并翻译成消息选择发给接收中断的处理器,以及从本地APIC接收处理器间中断消息。
! M% N; r9 X# U' W/ @% |5 H
3 a1 {! C, C. m9 } Q 和PIC一样,控制本地APIC和IO APIC的方法是通过读写该单元中的相关寄存器。不过和PIC不一样的是,Intel把本地APIC和IO APIC的寄存器都映射到了物理地址空间,本地APIC默认映射到物理地址0xffe00000,IO APIC默认映射到物理地址0xfec00000。windows HAL再进一步把本地APIC映射到虚拟地址0xfffe0000,把IO APIC映射到虚拟地址0xffd06000,也就是说对该地址的读写实际就是对寄存器的读写,本地APIC里几个重要的寄存有EOI寄存器,任务优先级寄存器(TPR),处理器优先级寄存器(PPR),中断命令寄存器(ICR,64位),中断请求寄存器(IRR,256位,对应每个向量一位),中断在服务寄存器(ISR,256位)等。IO APIC里几个重要的寄存器有版本寄存器,I/O寄存器选择寄存器、I/O窗口寄存器(用要访问的I/O APIC寄存器的索引设置地址I/O寄存器选择寄存器,此时访问I/O窗口寄存器就是访问被选定的寄存器)还有很重要的是一个IO重定向表,每一个表项是一个64位寄存器,包括向量和目标模式、传输模式等相关位,每一个表项连接一条IRQ线,表项的数目随处理器的版本而不一样,在Pentium 4上为24个表项。表项的数目保存在IO APIC版本寄存器的[16:23]位。APIC系统支持255个中断向量,但Intel保留了0-15向量,可用的向量是16-255。并引进一个概念叫做任务优先级=中断向量/16,因为保留了16个向量,所以可用的优先级是2-15。当用一个指定的优先级设置本地APIC中的任务优先级寄存器TPR后,所有优先级低于TPR中优先级的中断都被屏蔽,是不是很象IRQL的机制?事实上,APIC HAL里的IRQL机制也就是靠着这个任务优先级寄存器得以实现。同一个任务优先级包括了16个中断向量,可以进一步细粒度地区分中断的优先级。# |, X6 Q; p' K* z
% M- h; F8 _8 d2 _5 y9 I* @+ ^' ~+ z
在HAL里虽然HalBeginSystemInterrupt仍然是IRQL机制的发动引擎,但是因为有APIC的支持,它和其它共同实现IRQL的函数要比PIC HAL里对应的函数功能简单得多。HalBeginSystemInterrupt通过用IRQL做索引在HalpIRQLtoTPR数组中获取该IRQL对应的任务优先级,用该优先级设置任务优先级寄存器TPR,并把TPR中原先的任务优先级/16做为索引在HalpVectorToIRQL数组中获取对应的原先的IRQL然后返回。若IRQL是从低于DISPATCH_LEVEL提升到高于DISPATCH_LEVEL,还需要设置KPCR+0x95(0xffdff095)为DISPATCH_LEVEL(0x2),表示是从DISPATCH_LEVEL以下的级别提升IRQL。HalEndSystemInterrupt向本地APIC的EOI寄存发送0,表示中断结束,可以接收新中断。并还要判断要降到的IRQL是否小于DISPATCH_LEVEL,若小于则进一步判断KPCR+0x96(0xffdff096)是否置位,若置位则表示有DPC中断在等待(在IRQL高于DISPATCH_LEVEL被引发,然后等待直到IRQL降到低于DISPATCH_LEVEL),则将KPCR+0x95和KPCR+0x96清0后调用KiDispatchInterrupt响应DPC软中断。否则做的工作就是和HalBeginSystemInterrupt一样的过程:把要降到的IRQL转换成任务优先级设置TRP,并把久的任务优先级转成IRQL返回。KfRaiseIrql、KfLowerIrql之类的函数也是这么一回事,把当前IRQL转成任务优先级修改TPR,并把原先TPR的值转成原先的IRQL并返回。而现在软中断的产生也有了APIC支持,APIC通过产生一个发向自己的处理器间中断,就可以产生一个软中断,因为可以指定该中断的向量,所以软中断就可以区分优先级别,如APC_LEVEL、DISPATCH_LEVEL。产生软中断的函数一样还是HalRequestSoftwareInterrupt,该函数会先判断KPCR+0x95是否和要产生的软中断IRQL一样,若是的话则置位KPCR+0x96并返回,表示现在IRQL大于DISPATCH_LEVEL所以不处理DPC中断。否则以要产生的软中断的IRQL为索引从HalpIRQLtoTPRHAL取出对应任务优先级,并或上0x4000,表示是发向自身的固定处理间中断,并用该值设置中断命令寄存器ICW的低32位,然后读取中断命令寄存器ICW的低32位是否为0x1000,确定中断消息已经发送后就返回,这时候软中断已经产生。值得注意的是APIC HAL里没有HalEndSoftwareInterrupt这个函数。HAL为软中断的IRQL提供了一个固定的中断向量:
1 Y# r& D4 j( d, M3 `5 G4 @+ {4 c. ~. Z$ ]2 e* Z
#define ZERO_VECTOR 0x00 // IRQL 00
' o" t! [( _/ F#define APC_VECTOR 0x3D // IRQL 01* F: M1 p$ |$ H% ]/ V
#define DPC_VECTOR 0x41 // IRQL 02/ m( V5 z w2 k* H# a- ^
#define APIC_GENERIC_VECTOR 0xC1 // IRQL 27" S+ C, C4 z- x4 q0 w- _: e5 G
#define APIC_CLOCK_VECTOR 0xD1 // IRQL 28
, \+ i0 F) o8 |, i# w8 [#define APIC_SYNCH_VECTOR 0xD1 // IRQL 28
% X! V- j$ Y0 E1 }7 \: b: J8 I7 \#define APIC_IPI_VECTOR 0xE1 // IRQL 29. ^0 z g O7 U/ S( A2 h
#define POWERFAIL_VECTOR 0xEF // IRQL 306 t: ? o2 t- z9 a- ?
#define APIC_PROFILE_VECTOR 0xFD // IRQL 31
1 q5 H V4 g( a; {
; {& m# M) O1 w& e0 p5 X/ n0 S! K
: }' t8 B9 C' E# H现在看一下一些重要的数据:
7 |1 u3 J% z* @4 _% p
7 m! F( D/ v, c9 }+ m这是我写的代码输出的IO APIC重定向表内容:8 i2 w. S; y9 |% p
( X$ |- q) p, t$ U
Redirect Table Index: 0x17' N; w1 O2 L3 g: I6 d
Redirect Table[ 0]: ff2 \) V% y+ s4 G
Redirect Table[ 1]: b3
+ V, A' {5 X* F) Z) f- [Redirect Table[ 2]: ff
& h/ W+ o9 Q2 T0 ~Redirect Table[ 3]: 51: O( |' g8 J3 L9 ^: h* L
Redirect Table[ 4]: ff
# i% O2 {/ O" |9 t/ _" ]Redirect Table[ 5]: ff5 \& e. C0 R' g* c1 |# {. g
Redirect Table[ 6]: 62: t5 w, R6 V# |$ p! a" r2 H* A
Redirect Table[ 7]: ff, D! u/ ]5 \) v Q$ Z. V' t5 D
Redirect Table[ 8]: d1/ z1 l7 I; r0 ^6 A* }- R
Redirect Table[ 9]: b1, Q i" l3 \! y2 @4 B' G1 @, U
Redirect Table[ a]: ff
9 z9 v+ I7 `6 ^4 YRedirect Table[ b]: ff
; P# ^& I0 {7 r( |& z8 FRedirect Table[ c]: 52
( G9 B0 X# A' x4 O4 DRedirect Table[ d]: ff: z- C& h8 }9 K5 n! }+ H! b# l
Redirect Table[ e]: ff S% j8 P: d% C
Redirect Table[ f]: 92 G S/ p/ m: l: l
Redirect Table[10]: ff
9 b: e- M! E, J# q' B0 M. BRedirect Table[11]: a3
# P. J: |6 X4 J* nRedirect Table[12]: 83' ^$ c# n' R4 g% B4 G! K# K% q
Redirect Table[13]: 93. W8 r% g e% J! e& ]0 }7 E: w
Redirect Table[14]: ff. y/ Z, u6 m E' x3 I
Redirect Table[15]: ff6 R0 G' c8 {9 F8 K! a) \4 s6 h6 m
Redirect Table[16]: ff( P& A3 ]4 m4 `. D' C0 j
Redirect Table[17]: ff
: g. u, l$ k0 c+ b* E# P: D+ q+ E$ s5 _1 q
这是IDT表中被注册的向量:
( E: Q0 F( _" }, p! v9 r) G0 r7 v7 N) ]2 Y3 ?5 ]" G
1f: 80064908 (hal!HalpApicSpuriousService)
$ e0 k: n. X4 @; h37: 800640b8 (hal!PicSpuriousService37)) H, o4 c2 ]# r3 i7 \3 |1 g
3d: 80065254 (hal!HalpApcInterrupt)0 }1 J7 V5 E+ M
41: 800650c8 (hal!HalpDispatchInterrupt), A$ K7 B" s, g* \6 v: A5 X
50: 80064190 (hal!HalpApicRebootService)+ Y6 Y5 z$ q" J4 D+ c
51: 817f59e4
C: u! I9 T& U z, l1 X' Y& N }(Vector:51,Irql:4,SyncIrql:4,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:serial!SerialCIsrSw(f3c607c7))1 y2 Y& A% H7 \" l
52: 817f5044 ' u4 ~4 r8 }5 R. Q' J
(Vector:52,Irql:4,SyncIrql:a,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:i8042prt!I8042MouseInterruptService(f3c57a2c))! H- J! M' C6 k: F$ A0 p ~9 z$ w
83: 817d2d44 : y, {0 M: b) G; `$ \6 R
(Vector:83,Irql:7,SyncIrql:7,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:NDIS!ndisMIsr(bff1b794))4 g2 ^. \& ?& H" r* X
92: 81821384 8 v3 J2 ^' P8 N- o1 s4 i9 N
(Vector:92,Irql:8,SyncIrql:8,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:atapi!ScsiPortInterrupt(bff892be))
/ }% i3 W/ c7 n o8 u# L* ?93: 8185ed64
( i% Q( O; C w- b(Vector:93,Irql:8,SyncIrql:8,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:uhcd!UHCD_InterruptService(f3f0253e))* Z6 G1 E& h* w
a3: 8186cdc4 8 w5 t- M9 L9 ?
(Vector:a3,Irql:9,SyncIrql:9,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:SCSIPORT!ScsiPortInterrupt(bff719f0))
8 C, \ a% q8 d1 a6 Gb1: 818902e4 " j; e& e7 G& Y' J/ F
(Vector:b1,Irql:a,SyncIrql:a,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:ACPI!ACPIInterruptServiceRoutine(bffe14b4))0 p( W7 I7 b2 E. T( P; Z
b3: 81881664 F2 x" z. l- e; A& ^
(Vector:b3,Irql:a,SyncIrql:a,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:i8042prt!I8042KeyboardInterruptService(f3c51918))! [$ Y& J" W0 X! F+ Z; V
c1: 800642fc (hal!HalpBroadcastCallService)
; V9 \) k6 P0 C3 C4 fd1: 80063964 (hal!HalpClockInterrupt)0 k- V, q& ?: e* n+ n8 p
e1: 80064858 (hal!HalpIpiHandler)
, q+ t% @4 k6 ~$ S5 r1 Ge3: 800645d4 (hal!HalpLocalApicErrorService)
& _' g6 B; X0 o) A% g& Ffd: 80064d64 (hal!HalpProfileInterrupt)- p' L( r$ {; H( V
fe: 80064eec (hal!HalpPerfInterrupt)% {* n, |* ?! F/ ?+ T* l
0 C; c" j- l0 H O. b
象a3、b1这类输出内容很多的是被硬件注册的中断向量,而象d1、e3这种输出内容少的是注册为了的HAL内部使用的中断向量和本地APIC中断向量
1 O9 {& {2 {9 M' d% ^
5 ~) Q' H& x. ^$ ?; \这是几个重要的数组:0 I5 H: k7 H Y/ h- {! c- m
/ i" f5 J' s& n- W. `6 K! XHalVectorToIrql(这个数组是以向量除于16做索引):
9 H- d) F4 B- c. V- x- J4 u8006a304 00 ff ff 01 02 04 05 06-07 08 09 0a 1b 1c 1d 1e
- A8 A( v2 z" Z! J( J2 I; K6 W7 F7 l( g
HalpIRQLtoTPR:3 ]8 P* k4 Z3 T( I% z, U
8006a1e4 00 3d 41 41 51 61 71 81-91 a1 b1 b1 b1 b1 b1 b1
* O& F ?, C$ M9 [8006a1f4 b1 b1 b1 b1 b1 b1 b1 b1-b1 b1 b1 c1 d1 e1 ef ff( {) N9 u( m1 Y. u2 R% c
1 k2 ?# D3 d, _/ J! nHalpINTItoVector:
$ F; P- d* w! {8 d. c8006ada0 00 b3 61 51 a2 b2 62 91-a1 b1 71 81 52 82 72 926 Z$ G R$ y# L* Q" ^( b( M% {
8006adb0 00 a3 83 93 00 00 00 00-00 00 00 00 00 00 00 008 K) L4 J5 F6 _7 Q
- R X" W6 B% M ]% N
HalVectorToINTI:; z5 g7 ], l& G g; G5 P. e% T1 H- ^ z
8006a204 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff( b2 ]' f, `6 @) Q; p% y* P
8006a214 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff: `& {. v# Q/ c/ |
8006a224 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
( p9 s! H6 ~( |; W8006a234 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
7 G/ L* O, r& k& c' c2 h- o8006a244 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff% `8 O, L+ N) w
8006a254 ff 03 0c ff ff ff ff ff-ff ff ff ff ff ff ff ff
" o' f1 s: X$ L: F G1 r0 J6 G8006a264 ff 02 06 ff ff ff ff ff-ff ff ff ff ff ff ff ff
) I3 M- k Q$ k! Y8006a274 ff 0a 0e ff ff ff ff ff-ff ff ff ff ff ff ff ff7 A0 R7 y9 [5 L4 y* D9 u
8006a284 ff 0b 0d 12 ff ff ff ff-ff ff ff ff ff ff ff ff
" p! \% m) d% ~2 |: x8006a294 ff 07 0f 13 ff ff ff ff-ff ff ff ff ff ff ff ff" ~ M* E0 Y: G& {! v
8006a2a4 ff 08 04 11 ff ff ff ff-ff ff ff ff ff ff ff ff
+ B0 x& c$ }3 Z p8 r8006a2b4 ff 09 05 01 ff ff ff ff-ff ff ff ff ff ff ff ff
& p; K+ w" o }! E. }8006a2c4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff( k P$ v" @" ^- B/ f9 g9 m
8006a2d4 ff 08 ff ff ff ff ff ff-ff ff ff ff ff ff ff ff/ l+ ]/ U4 g l
8006a2e4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
- D4 U8 k9 p: n C& P+ x& b8006a2f4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ) Y% w2 V9 A- ~. }# i1 f
v7 f4 R/ D! O% @+ r6 }. W
& c8 U6 g5 c% u1 m( i7 L
vBucket: \6 w6 X+ T- g1 B @
8006ae30 02 02 02 03 03 03 03* l( R# t; B. g k$ J d _
1 m: X2 V' S. ^ 举个例子来说明一下,在我虚拟机里SCSI Controller的IRQ是17(注意,已经大于16了),到重定向表中查找第17项,得到中断向量为0xa3,再看IDT,0xa3对应处理例程是SCSIPORT!ScsiPortInterrupt。7 s; n2 W8 C3 ~- U+ z f
7 J9 c' r7 E4 s0 u- P vBucket数组干啥用的?它就是用来分配新的向量。分配算法很简单,当要分配一个新的向量时,就在vBucket数组从右到左搜索最小的一个数i,该数对应在vBucket中索引为Index,新向量为(0x50+Index*16+i+1),新向量对应的IRQL为(4+i+1),同时会把vBucket中这个i加1,i不等大于16。象给出的这个vBucket,下一次计算时i=2, index=2。不过这些用于硬件的向量在IO系统初始化时调用HalpGetSystemInterruptVector分配好了,然后通过IoConnectInterrupt把IDT中注册的向量位置的例程注册为中断处理程序。这里并不是每个注册的向量都会对应中断处理程序,象上面给出的例子中,0xa1、0xa2、0xb1等向量就没有对应。/ P6 e; }; g4 V! T6 \6 B: Q
\0 N0 K- p0 w) `6 W; ?- F IRQL机制为内核同步提供了很大的便利,既对驱动开发者隐藏了底层中断机制,也方便了驱动开发者的内核同步。LINUX从2.5内核开始引进的软中断和任务队列等机制,很大程度上也来自windows这套机制的借鉴。
V y, q2 ]$ `$ @, e4 t4 \) A) S, |) j5 M# @: q/ k
终于考完试,解放了,呵呵。这个东西其实还有很多可写的,只是没空再深入去分析了。在未来的64位系统里,APIC这种基于中断引脚的机制很快也要被SAPIC这种基于消息的更强大的机制所取代 |
|