|
|
楼主 |
发表于 2008-2-27 14:35:05
|
显示全部楼层
从IRQ到IRQL(APIC版)
来自:http://www.nsfocus.net/index.php ... o=view&mid=25347 _" k. Q' V4 @! |( V, J: j: p# b3 O
1 A; X% {* \, c9 N4 [
从IRQ到IRQL(APIC版)5 S; W4 P3 G0 g! E6 W
4 t" ]0 I/ A% e* c, [% P
作者:SoBeIt4 K$ z4 O; w0 v6 p
出处:https://www.xfocus.net/bbs/index.php?act=ST&f=2&t=45502: ?9 K2 g+ W" M, F7 k1 j W
日期:2005-02-04& O+ v3 L$ h! a4 U; F' H2 n* [
# j( J. Q0 X6 W! }4 ]
事实上,老久的PIC在很早以前就被淘汰了,取而代之的是APIC。由于APIC可以兼容PIC,所以在很多单处理器系统上我们看到的PIC实际是APIC的兼容PIC模式。APIC主要应用于多处理器操作系统,是为了解决IRQ太少和处理器间中断而产生的,当然,单处理器操作系统也可以使用APIC(不是模拟PIC)。APIC的HAL和PIC的HAL有很大的不同,很突出的一个特点就是APIC的HAL不用再象PIC的HAL那样虚拟一个中断控制器,IRQL的概念已经可以通过中断向量的形式被APIC支持。事实上,因为被APIC所支持,所以在APIC HAL里IRQL的实现比PIC HAL那样虚拟一个中断控制器要简单得多了。
5 s2 ^+ ~0 d- Y
- L) I2 C. R2 H% L 现在来简单介绍一下APIC的结构(关于APIC详细的描述请参考《IA-32 Inel Architecture Software Developer's Manual Volume 3 Chapter 8》)。整个APIC系统由本地APIC、IO APIC和APIC串行总线组成(在Pentium 4和Xeon以后,APIC总线放到了系统总线中)组成。每个处理器中集成了一个本地APIC,而IO APIC是系统芯片组中一部分,APIC总线负责连接IO APIC和各个本地APIC。本地APIC接收该处理器产生的本地中断比如时钟中断,以及由该处理器产生的处理器间中断,并从APIC串行总线接收来自IO APIC的消息;IO APIC负责接收所有外部的硬件中断,并翻译成消息选择发给接收中断的处理器,以及从本地APIC接收处理器间中断消息。
- O: C6 E, \# h+ o" I# ~) ^: x2 _& Q, G, T
和PIC一样,控制本地APIC和IO APIC的方法是通过读写该单元中的相关寄存器。不过和PIC不一样的是,Intel把本地APIC和IO APIC的寄存器都映射到了物理地址空间,本地APIC默认映射到物理地址0xffe00000,IO APIC默认映射到物理地址0xfec00000。windows HAL再进一步把本地APIC映射到虚拟地址0xfffe0000,把IO APIC映射到虚拟地址0xffd06000,也就是说对该地址的读写实际就是对寄存器的读写,本地APIC里几个重要的寄存有EOI寄存器,任务优先级寄存器(TPR),处理器优先级寄存器(PPR),中断命令寄存器(ICR,64位),中断请求寄存器(IRR,256位,对应每个向量一位),中断在服务寄存器(ISR,256位)等。IO APIC里几个重要的寄存器有版本寄存器,I/O寄存器选择寄存器、I/O窗口寄存器(用要访问的I/O APIC寄存器的索引设置地址I/O寄存器选择寄存器,此时访问I/O窗口寄存器就是访问被选定的寄存器)还有很重要的是一个IO重定向表,每一个表项是一个64位寄存器,包括向量和目标模式、传输模式等相关位,每一个表项连接一条IRQ线,表项的数目随处理器的版本而不一样,在Pentium 4上为24个表项。表项的数目保存在IO APIC版本寄存器的[16:23]位。APIC系统支持255个中断向量,但Intel保留了0-15向量,可用的向量是16-255。并引进一个概念叫做任务优先级=中断向量/16,因为保留了16个向量,所以可用的优先级是2-15。当用一个指定的优先级设置本地APIC中的任务优先级寄存器TPR后,所有优先级低于TPR中优先级的中断都被屏蔽,是不是很象IRQL的机制?事实上,APIC HAL里的IRQL机制也就是靠着这个任务优先级寄存器得以实现。同一个任务优先级包括了16个中断向量,可以进一步细粒度地区分中断的优先级。
4 F: M/ f: Q# h7 F9 k1 W ?- Y# d4 Q' `' g/ j" J
在HAL里虽然HalBeginSystemInterrupt仍然是IRQL机制的发动引擎,但是因为有APIC的支持,它和其它共同实现IRQL的函数要比PIC HAL里对应的函数功能简单得多。HalBeginSystemInterrupt通过用IRQL做索引在HalpIRQLtoTPR数组中获取该IRQL对应的任务优先级,用该优先级设置任务优先级寄存器TPR,并把TPR中原先的任务优先级/16做为索引在HalpVectorToIRQL数组中获取对应的原先的IRQL然后返回。若IRQL是从低于DISPATCH_LEVEL提升到高于DISPATCH_LEVEL,还需要设置KPCR+0x95(0xffdff095)为DISPATCH_LEVEL(0x2),表示是从DISPATCH_LEVEL以下的级别提升IRQL。HalEndSystemInterrupt向本地APIC的EOI寄存发送0,表示中断结束,可以接收新中断。并还要判断要降到的IRQL是否小于DISPATCH_LEVEL,若小于则进一步判断KPCR+0x96(0xffdff096)是否置位,若置位则表示有DPC中断在等待(在IRQL高于DISPATCH_LEVEL被引发,然后等待直到IRQL降到低于DISPATCH_LEVEL),则将KPCR+0x95和KPCR+0x96清0后调用KiDispatchInterrupt响应DPC软中断。否则做的工作就是和HalBeginSystemInterrupt一样的过程:把要降到的IRQL转换成任务优先级设置TRP,并把久的任务优先级转成IRQL返回。KfRaiseIrql、KfLowerIrql之类的函数也是这么一回事,把当前IRQL转成任务优先级修改TPR,并把原先TPR的值转成原先的IRQL并返回。而现在软中断的产生也有了APIC支持,APIC通过产生一个发向自己的处理器间中断,就可以产生一个软中断,因为可以指定该中断的向量,所以软中断就可以区分优先级别,如APC_LEVEL、DISPATCH_LEVEL。产生软中断的函数一样还是HalRequestSoftwareInterrupt,该函数会先判断KPCR+0x95是否和要产生的软中断IRQL一样,若是的话则置位KPCR+0x96并返回,表示现在IRQL大于DISPATCH_LEVEL所以不处理DPC中断。否则以要产生的软中断的IRQL为索引从HalpIRQLtoTPRHAL取出对应任务优先级,并或上0x4000,表示是发向自身的固定处理间中断,并用该值设置中断命令寄存器ICW的低32位,然后读取中断命令寄存器ICW的低32位是否为0x1000,确定中断消息已经发送后就返回,这时候软中断已经产生。值得注意的是APIC HAL里没有HalEndSoftwareInterrupt这个函数。HAL为软中断的IRQL提供了一个固定的中断向量:( ]6 ~ g5 e# |6 F
" f+ N* X4 m8 i9 ?7 F x3 |
#define ZERO_VECTOR 0x00 // IRQL 00
! }3 @4 \2 l a& W# |#define APC_VECTOR 0x3D // IRQL 01% x' A. r5 H4 I& {
#define DPC_VECTOR 0x41 // IRQL 02
6 n, S9 I4 g+ Q V* o( ?#define APIC_GENERIC_VECTOR 0xC1 // IRQL 27* s ?: W6 U) O4 V& s3 M5 T) j
#define APIC_CLOCK_VECTOR 0xD1 // IRQL 28
$ C0 z9 R8 `6 N+ L* R4 d#define APIC_SYNCH_VECTOR 0xD1 // IRQL 28' W, Z0 r! s: L4 E2 g
#define APIC_IPI_VECTOR 0xE1 // IRQL 29
; A7 a2 O0 e2 Z6 h8 X#define POWERFAIL_VECTOR 0xEF // IRQL 30. G& M4 D6 O: X u% f1 ?
#define APIC_PROFILE_VECTOR 0xFD // IRQL 31
. x4 v, C* u6 R
4 `4 C8 Q3 F# E% ~
6 b6 q- `. q; H# S7 A现在看一下一些重要的数据:
% k9 S% q% J2 ?' ]" ?; A* H: E% u* [; ~
这是我写的代码输出的IO APIC重定向表内容:
# ]% }9 j" u! {! g$ i
$ [; L5 p# v5 V, t# nRedirect Table Index: 0x17. w) [. s9 {6 W$ ?5 m% Z
Redirect Table[ 0]: ff$ \, m5 N6 q8 c7 \ q& w
Redirect Table[ 1]: b3
6 K" s" p) n. J& oRedirect Table[ 2]: ff
3 K' U \) `- T9 q; x/ b6 K% ERedirect Table[ 3]: 51
7 J/ ]5 [- p0 @4 ZRedirect Table[ 4]: ff7 E# S: m% j+ i! {+ C; D% j
Redirect Table[ 5]: ff
% U" H5 r3 S8 x4 w5 J5 [) K' @$ ORedirect Table[ 6]: 62
2 j6 A* c8 h0 B* i- L7 e) k+ ]4 cRedirect Table[ 7]: ff
3 r$ d( P" a) _2 Y5 z4 A: _Redirect Table[ 8]: d1+ Z# n' P! C7 k
Redirect Table[ 9]: b1
% [1 l. a% W/ h' P8 m9 rRedirect Table[ a]: ff
/ J- R. t$ @; _. X: i7 ]2 f' k( ORedirect Table[ b]: ff% ?. n' a3 @. q
Redirect Table[ c]: 52" [ Z+ l2 V* G) |& ^ @
Redirect Table[ d]: ff E( ~/ n$ i, s7 C6 X
Redirect Table[ e]: ff' @0 `; Q5 o/ x4 f( a. }) Z2 G
Redirect Table[ f]: 92
! N( m4 I1 u! C0 q# n7 C0 zRedirect Table[10]: ff
3 b% h$ z$ P! u0 vRedirect Table[11]: a3& p( f+ B3 \/ s/ x. G+ W
Redirect Table[12]: 83
( c8 y* N: B) L+ ]6 l* k1 aRedirect Table[13]: 930 _% n# z- V9 b1 m3 z
Redirect Table[14]: ff
% T3 D+ ?, T5 u8 p6 W9 _$ lRedirect Table[15]: ff
. k0 Q0 \, q/ a) u, \' xRedirect Table[16]: ff8 f+ Y* H9 B' |& Y0 U4 Q0 X% y
Redirect Table[17]: ff) s3 n$ G& O; e1 n+ O* U5 o( m
% R" y' R& i2 T7 f0 ^; e
这是IDT表中被注册的向量:
3 k1 d( N3 P3 G2 I, T" T. E/ S+ q* A) y9 x
1f: 80064908 (hal!HalpApicSpuriousService)
9 X1 U6 Q: w6 z& p/ z37: 800640b8 (hal!PicSpuriousService37). ]5 \# U0 _! U2 R$ _* G
3d: 80065254 (hal!HalpApcInterrupt)
3 |: s9 S8 p2 M* B1 T* v41: 800650c8 (hal!HalpDispatchInterrupt)
6 h. X0 u: g$ f50: 80064190 (hal!HalpApicRebootService)1 A9 t: C6 |; Y$ [$ k
51: 817f59e4- } ^1 S% R% g i8 A( Z0 T
(Vector:51,Irql:4,SyncIrql:4,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:serial!SerialCIsrSw(f3c607c7))
8 D# i: a5 C; Z2 X# g52: 817f5044 / a: U, C5 ]9 F9 A, s
(Vector:52,Irql:4,SyncIrql:a,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:i8042prt!I8042MouseInterruptService(f3c57a2c))
8 y j/ e) Q" ?# m. t2 i" B6 F0 c83: 817d2d44 , e H' Q" [( X5 p9 j5 s
(Vector:83,Irql:7,SyncIrql:7,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:NDIS!ndisMIsr(bff1b794))" m( r/ e! ~5 `) c+ Y! h% W
92: 81821384
, B y/ N4 p5 e7 u' I3 w! y(Vector:92,Irql:8,SyncIrql:8,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:atapi!ScsiPortInterrupt(bff892be))
1 R3 h2 Q& s8 e7 b93: 8185ed64
: e" h) e9 k1 Y! A% O: N) J. J/ E5 n(Vector:93,Irql:8,SyncIrql:8,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:uhcd!UHCD_InterruptService(f3f0253e))
- P) O+ A& f1 N$ C1 Ra3: 8186cdc4 ( r$ G8 F" ^9 B. _9 i8 I& J& r
(Vector:a3,Irql:9,SyncIrql:9,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:SCSIPORT!ScsiPortInterrupt(bff719f0))
8 D7 U: x( b8 ~# lb1: 818902e4
4 Y, ?+ X6 L J* I$ w5 m(Vector:b1,Irql:a,SyncIrql:a,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:ACPI!ACPIInterruptServiceRoutine(bffe14b4))
j! j& T. b7 Q* nb3: 81881664
* I0 \% o2 G6 O1 ]( M(Vector:b3,Irql:a,SyncIrql:a,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:i8042prt!I8042KeyboardInterruptService(f3c51918))
3 V. y& v H4 t# z! E/ Uc1: 800642fc (hal!HalpBroadcastCallService)
/ R( [/ W! f3 \1 `; Zd1: 80063964 (hal!HalpClockInterrupt)! {# u! ^ @! G% e% H
e1: 80064858 (hal!HalpIpiHandler)
4 k1 g+ u" x: K: V8 ne3: 800645d4 (hal!HalpLocalApicErrorService)6 t8 G* y* F5 f( y( m# X7 Q4 g
fd: 80064d64 (hal!HalpProfileInterrupt)% E0 L% B* H9 d( n
fe: 80064eec (hal!HalpPerfInterrupt)
7 b1 X4 P: I$ O R8 M8 N/ e. R3 i- k* n: s
象a3、b1这类输出内容很多的是被硬件注册的中断向量,而象d1、e3这种输出内容少的是注册为了的HAL内部使用的中断向量和本地APIC中断向量8 B6 l% K3 F" Z- H, }$ `
5 {4 j, P5 v2 ^" H6 s这是几个重要的数组:8 Q: p6 K1 P: }4 j5 ?# k: A: R* u
$ K C; {6 C" U& f) VHalVectorToIrql(这个数组是以向量除于16做索引):
+ s: H, f. C5 {8 M8006a304 00 ff ff 01 02 04 05 06-07 08 09 0a 1b 1c 1d 1e5 ^, _4 n* Z$ `+ Z
. E9 z6 V) ?) H3 G g- W- CHalpIRQLtoTPR:
/ h' R/ L/ O$ n' D" N( c' E5 F8006a1e4 00 3d 41 41 51 61 71 81-91 a1 b1 b1 b1 b1 b1 b1" V5 u: i" _* h1 }. Y8 x# p8 P/ h7 H& i
8006a1f4 b1 b1 b1 b1 b1 b1 b1 b1-b1 b1 b1 c1 d1 e1 ef ff. Q( Y- I* x4 k9 a/ w
/ U k) [7 M, p7 i' K
HalpINTItoVector:+ e2 t5 r) T/ D+ |2 f" w
8006ada0 00 b3 61 51 a2 b2 62 91-a1 b1 71 81 52 82 72 92* K( c: |0 O) U. \1 o) t, m" c d1 n3 M
8006adb0 00 a3 83 93 00 00 00 00-00 00 00 00 00 00 00 00 C. D3 G8 v5 L: Q2 M$ o p' m& Q
1 ^" d$ m# r& ~; m4 \
HalVectorToINTI:
; [. @# ^( r' A/ F3 b8006a204 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff0 n7 o! U2 h) i9 F5 ^0 O8 q
8006a214 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff1 U s8 e' R& ^7 j8 w
8006a224 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff. H- Y% G+ U$ {& n; Q
8006a234 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
" y1 `9 Y, S2 A: q+ @& D8006a244 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
* G& Z3 p. S( h Y2 k4 `4 b4 t8006a254 ff 03 0c ff ff ff ff ff-ff ff ff ff ff ff ff ff
8 D0 [/ \( c6 g& r+ L; \8006a264 ff 02 06 ff ff ff ff ff-ff ff ff ff ff ff ff ff
* J" [. X, M% G* w8006a274 ff 0a 0e ff ff ff ff ff-ff ff ff ff ff ff ff ff% m/ t8 _7 _+ n3 ?* |+ _! B4 q
8006a284 ff 0b 0d 12 ff ff ff ff-ff ff ff ff ff ff ff ff- @; E8 a/ r# o. ]! p- R
8006a294 ff 07 0f 13 ff ff ff ff-ff ff ff ff ff ff ff ff
* R; {; b, Z8 y1 Z1 V- q8006a2a4 ff 08 04 11 ff ff ff ff-ff ff ff ff ff ff ff ff7 g0 ~8 v) m+ g# y
8006a2b4 ff 09 05 01 ff ff ff ff-ff ff ff ff ff ff ff ff
* z( Y( L" C6 l; s: L0 ?& [5 Z8006a2c4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
8 P7 e C/ {* v" y8006a2d4 ff 08 ff ff ff ff ff ff-ff ff ff ff ff ff ff ff2 O' ~1 Y7 [; C
8006a2e4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff9 h* Z4 ^' P, G9 ] r
8006a2f4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff
- q$ N0 `4 {* N
9 [' l6 ?+ f" t3 S( Q* W, R5 \+ \. N2 m6 X( U
vBucket:
* |# {3 ~: c" c' V1 J- ^& X$ ~8006ae30 02 02 02 03 03 03 03
+ `/ P. z2 |; e2 G5 v* D# k. D
- n! w9 \5 G' q5 {9 L9 w0 ^" ` 举个例子来说明一下,在我虚拟机里SCSI Controller的IRQ是17(注意,已经大于16了),到重定向表中查找第17项,得到中断向量为0xa3,再看IDT,0xa3对应处理例程是SCSIPORT!ScsiPortInterrupt。9 E$ U: G6 V0 E- y( X. D
9 L, k( l0 R+ @* i! C! F0 b
vBucket数组干啥用的?它就是用来分配新的向量。分配算法很简单,当要分配一个新的向量时,就在vBucket数组从右到左搜索最小的一个数i,该数对应在vBucket中索引为Index,新向量为(0x50+Index*16+i+1),新向量对应的IRQL为(4+i+1),同时会把vBucket中这个i加1,i不等大于16。象给出的这个vBucket,下一次计算时i=2, index=2。不过这些用于硬件的向量在IO系统初始化时调用HalpGetSystemInterruptVector分配好了,然后通过IoConnectInterrupt把IDT中注册的向量位置的例程注册为中断处理程序。这里并不是每个注册的向量都会对应中断处理程序,象上面给出的例子中,0xa1、0xa2、0xb1等向量就没有对应。
" F' Q7 m3 Z9 w4 Q% ?; b$ S( n' ?9 j
% p( w2 \3 U$ T( R" n. R IRQL机制为内核同步提供了很大的便利,既对驱动开发者隐藏了底层中断机制,也方便了驱动开发者的内核同步。LINUX从2.5内核开始引进的软中断和任务队列等机制,很大程度上也来自windows这套机制的借鉴。7 b, P: V+ a2 M7 o" D; s
! i, j; U0 ^# y+ D 终于考完试,解放了,呵呵。这个东西其实还有很多可写的,只是没空再深入去分析了。在未来的64位系统里,APIC这种基于中断引脚的机制很快也要被SAPIC这种基于消息的更强大的机制所取代 |
|