|
|
楼主 |
发表于 2008-2-27 14:35:05
|
显示全部楼层
从IRQ到IRQL(APIC版)
来自:http://www.nsfocus.net/index.php ... o=view&mid=2534
+ Q7 e0 q* u! }* f5 T3 I# S) k# c% r$ {( l
从IRQ到IRQL(APIC版)
! E2 @" G% R0 d! M: K0 Q6 _* F5 w4 M2 r1 E5 i* W
作者:SoBeIt
! K, L+ `- R: j# t) i出处:https://www.xfocus.net/bbs/index.php?act=ST&f=2&t=45502& c- N: \# z- e. u& P" @
日期:2005-02-04) g+ U( N6 c+ V P9 T% N) D, k
1 G: X. P; Q9 W; `6 Q$ d/ h
事实上,老久的PIC在很早以前就被淘汰了,取而代之的是APIC。由于APIC可以兼容PIC,所以在很多单处理器系统上我们看到的PIC实际是APIC的兼容PIC模式。APIC主要应用于多处理器操作系统,是为了解决IRQ太少和处理器间中断而产生的,当然,单处理器操作系统也可以使用APIC(不是模拟PIC)。APIC的HAL和PIC的HAL有很大的不同,很突出的一个特点就是APIC的HAL不用再象PIC的HAL那样虚拟一个中断控制器,IRQL的概念已经可以通过中断向量的形式被APIC支持。事实上,因为被APIC所支持,所以在APIC HAL里IRQL的实现比PIC HAL那样虚拟一个中断控制器要简单得多了。8 I& O# e2 Z9 `- x5 g
8 [5 _0 n: k, I" l% a& O1 s4 A 现在来简单介绍一下APIC的结构(关于APIC详细的描述请参考《IA-32 Inel Architecture Software Developer's Manual Volume 3 Chapter 8》)。整个APIC系统由本地APIC、IO APIC和APIC串行总线组成(在Pentium 4和Xeon以后,APIC总线放到了系统总线中)组成。每个处理器中集成了一个本地APIC,而IO APIC是系统芯片组中一部分,APIC总线负责连接IO APIC和各个本地APIC。本地APIC接收该处理器产生的本地中断比如时钟中断,以及由该处理器产生的处理器间中断,并从APIC串行总线接收来自IO APIC的消息;IO APIC负责接收所有外部的硬件中断,并翻译成消息选择发给接收中断的处理器,以及从本地APIC接收处理器间中断消息。! d1 j3 D. h; A- W# I3 k* v
; S% O5 K. C; X, q 和PIC一样,控制本地APIC和IO APIC的方法是通过读写该单元中的相关寄存器。不过和PIC不一样的是,Intel把本地APIC和IO APIC的寄存器都映射到了物理地址空间,本地APIC默认映射到物理地址0xffe00000,IO APIC默认映射到物理地址0xfec00000。windows HAL再进一步把本地APIC映射到虚拟地址0xfffe0000,把IO APIC映射到虚拟地址0xffd06000,也就是说对该地址的读写实际就是对寄存器的读写,本地APIC里几个重要的寄存有EOI寄存器,任务优先级寄存器(TPR),处理器优先级寄存器(PPR),中断命令寄存器(ICR,64位),中断请求寄存器(IRR,256位,对应每个向量一位),中断在服务寄存器(ISR,256位)等。IO APIC里几个重要的寄存器有版本寄存器,I/O寄存器选择寄存器、I/O窗口寄存器(用要访问的I/O APIC寄存器的索引设置地址I/O寄存器选择寄存器,此时访问I/O窗口寄存器就是访问被选定的寄存器)还有很重要的是一个IO重定向表,每一个表项是一个64位寄存器,包括向量和目标模式、传输模式等相关位,每一个表项连接一条IRQ线,表项的数目随处理器的版本而不一样,在Pentium 4上为24个表项。表项的数目保存在IO APIC版本寄存器的[16:23]位。APIC系统支持255个中断向量,但Intel保留了0-15向量,可用的向量是16-255。并引进一个概念叫做任务优先级=中断向量/16,因为保留了16个向量,所以可用的优先级是2-15。当用一个指定的优先级设置本地APIC中的任务优先级寄存器TPR后,所有优先级低于TPR中优先级的中断都被屏蔽,是不是很象IRQL的机制?事实上,APIC HAL里的IRQL机制也就是靠着这个任务优先级寄存器得以实现。同一个任务优先级包括了16个中断向量,可以进一步细粒度地区分中断的优先级。- m9 ^$ j! _/ v
0 r# ?' W' g# A( ~ 在HAL里虽然HalBeginSystemInterrupt仍然是IRQL机制的发动引擎,但是因为有APIC的支持,它和其它共同实现IRQL的函数要比PIC HAL里对应的函数功能简单得多。HalBeginSystemInterrupt通过用IRQL做索引在HalpIRQLtoTPR数组中获取该IRQL对应的任务优先级,用该优先级设置任务优先级寄存器TPR,并把TPR中原先的任务优先级/16做为索引在HalpVectorToIRQL数组中获取对应的原先的IRQL然后返回。若IRQL是从低于DISPATCH_LEVEL提升到高于DISPATCH_LEVEL,还需要设置KPCR+0x95(0xffdff095)为DISPATCH_LEVEL(0x2),表示是从DISPATCH_LEVEL以下的级别提升IRQL。HalEndSystemInterrupt向本地APIC的EOI寄存发送0,表示中断结束,可以接收新中断。并还要判断要降到的IRQL是否小于DISPATCH_LEVEL,若小于则进一步判断KPCR+0x96(0xffdff096)是否置位,若置位则表示有DPC中断在等待(在IRQL高于DISPATCH_LEVEL被引发,然后等待直到IRQL降到低于DISPATCH_LEVEL),则将KPCR+0x95和KPCR+0x96清0后调用KiDispatchInterrupt响应DPC软中断。否则做的工作就是和HalBeginSystemInterrupt一样的过程:把要降到的IRQL转换成任务优先级设置TRP,并把久的任务优先级转成IRQL返回。KfRaiseIrql、KfLowerIrql之类的函数也是这么一回事,把当前IRQL转成任务优先级修改TPR,并把原先TPR的值转成原先的IRQL并返回。而现在软中断的产生也有了APIC支持,APIC通过产生一个发向自己的处理器间中断,就可以产生一个软中断,因为可以指定该中断的向量,所以软中断就可以区分优先级别,如APC_LEVEL、DISPATCH_LEVEL。产生软中断的函数一样还是HalRequestSoftwareInterrupt,该函数会先判断KPCR+0x95是否和要产生的软中断IRQL一样,若是的话则置位KPCR+0x96并返回,表示现在IRQL大于DISPATCH_LEVEL所以不处理DPC中断。否则以要产生的软中断的IRQL为索引从HalpIRQLtoTPRHAL取出对应任务优先级,并或上0x4000,表示是发向自身的固定处理间中断,并用该值设置中断命令寄存器ICW的低32位,然后读取中断命令寄存器ICW的低32位是否为0x1000,确定中断消息已经发送后就返回,这时候软中断已经产生。值得注意的是APIC HAL里没有HalEndSoftwareInterrupt这个函数。HAL为软中断的IRQL提供了一个固定的中断向量:9 z- t' Q1 W* G% G8 w
4 m( D! u& N: l#define ZERO_VECTOR 0x00 // IRQL 00
* n$ Q5 t) Q4 j8 K#define APC_VECTOR 0x3D // IRQL 01% C8 B, R4 v" I& P
#define DPC_VECTOR 0x41 // IRQL 02
* ^) m7 i4 K' b/ z#define APIC_GENERIC_VECTOR 0xC1 // IRQL 27
3 V' B3 t! Z. e$ {! j5 \6 W0 q ?#define APIC_CLOCK_VECTOR 0xD1 // IRQL 281 M, V8 ^- `9 a1 p+ I
#define APIC_SYNCH_VECTOR 0xD1 // IRQL 28) L$ g$ A$ x% R1 @ [
#define APIC_IPI_VECTOR 0xE1 // IRQL 29% ]! n9 y7 u/ S0 C: ^- E. k7 }1 i
#define POWERFAIL_VECTOR 0xEF // IRQL 30
& h+ ~6 x6 V# z* y4 k#define APIC_PROFILE_VECTOR 0xFD // IRQL 31
# g {2 ?, f4 E
[; g; z! @, `$ p3 h7 F( T* @5 z; g
现在看一下一些重要的数据:, W: p, S/ V8 Q1 [
# S t( F. c& w/ C! b3 a
这是我写的代码输出的IO APIC重定向表内容:
. A/ s4 ~9 D5 C5 Q. X0 P* y, z) N; s# g8 V: K
Redirect Table Index: 0x17, p/ E0 P4 `) A0 Q
Redirect Table[ 0]: ff
: ~* W1 k: ~6 eRedirect Table[ 1]: b3
4 J+ ~; V' R1 `# E: n: [Redirect Table[ 2]: ff6 `& w! e+ A" X, W! N* ?
Redirect Table[ 3]: 51+ w) M. e0 \2 f+ T/ z; p b
Redirect Table[ 4]: ff. J7 L2 c B0 I; H% E- n8 B
Redirect Table[ 5]: ff
/ p0 s9 ], q5 y7 CRedirect Table[ 6]: 624 M# W) V/ p5 k" V0 c# N7 |* C0 p
Redirect Table[ 7]: ff
7 h: {2 [$ w3 @: aRedirect Table[ 8]: d1
/ ^6 F t% Y' n+ a i/ h$ SRedirect Table[ 9]: b1
& c2 \ m2 S- M2 ^Redirect Table[ a]: ff
. g6 y n+ B- x6 J" K5 TRedirect Table[ b]: ff
0 d) q6 w% J6 l! o; o2 HRedirect Table[ c]: 52$ v y7 q) [4 a! a5 P! V
Redirect Table[ d]: ff4 ?" L) [7 M. ^) j2 W
Redirect Table[ e]: ff. H3 R; h. H- G- G( x
Redirect Table[ f]: 92
! H+ V6 m0 a3 |! Q$ Y; e+ jRedirect Table[10]: ff8 H/ E1 g: w2 t$ C9 E6 }6 g
Redirect Table[11]: a3- `1 L: f& [) g9 Y8 i# c- V
Redirect Table[12]: 83
- F- d) ], u g& L$ X. YRedirect Table[13]: 93
1 R- e- }& i: x s1 URedirect Table[14]: ff! }. [# u3 g, i
Redirect Table[15]: ff+ L5 r0 G# q2 M! F
Redirect Table[16]: ff# f$ E1 o6 W( ]( O, f
Redirect Table[17]: ff& Q, M w/ f! n
! g: W. r# v* F/ h# R# N; u这是IDT表中被注册的向量:. ~; Y( p$ J3 [
, ]" D8 j0 t+ j5 a1f: 80064908 (hal!HalpApicSpuriousService)/ A1 O: N# k7 k& ]+ z1 [, v: t
37: 800640b8 (hal!PicSpuriousService37)
3 D% A: _% h2 G6 |0 k+ }7 _9 c1 o3d: 80065254 (hal!HalpApcInterrupt)7 U" R* e: J2 O8 T
41: 800650c8 (hal!HalpDispatchInterrupt)3 @' N! d1 L! c4 s o8 Q8 D$ N: J7 M, N
50: 80064190 (hal!HalpApicRebootService)0 m# z/ |0 ^" f& H& O; G
51: 817f59e4
* e0 W: H/ z! J3 u(Vector:51,Irql:4,SyncIrql:4,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:serial!SerialCIsrSw(f3c607c7)); N! J2 D0 {: g& H: Z/ }: P; C
52: 817f5044 # s ?/ e: }4 T& c) r
(Vector:52,Irql:4,SyncIrql:a,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:i8042prt!I8042MouseInterruptService(f3c57a2c))# H0 s5 @, ~5 f6 Y" V2 c
83: 817d2d44 - `/ u" \ z5 y7 \0 [$ \* G' z. y: Y
(Vector:83,Irql:7,SyncIrql:7,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:NDIS!ndisMIsr(bff1b794))
9 j: p+ T3 t; W2 x, h3 P3 m92: 81821384 # ]' t# o7 ]) m" f
(Vector:92,Irql:8,SyncIrql:8,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:atapi!ScsiPortInterrupt(bff892be)) B g5 F ?8 S# ~( C
93: 8185ed64
8 @' ~8 f( u3 K- o; @(Vector:93,Irql:8,SyncIrql:8,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:uhcd!UHCD_InterruptService(f3f0253e))
2 J; @- C4 a# L! qa3: 8186cdc4
0 w: c5 R2 h" h) A; B3 w(Vector:a3,Irql:9,SyncIrql:9,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:SCSIPORT!ScsiPortInterrupt(bff719f0))1 Z9 `$ l8 w0 l7 _7 y
b1: 818902e4 . p, c& n4 q9 }
(Vector:b1,Irql:a,SyncIrql:a,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:ACPI!ACPIInterruptServiceRoutine(bffe14b4))
) k* A- O; ?, _+ w* s4 ab3: 81881664
( Z9 F9 V2 }& M; M/ l4 n) `(Vector:b3,Irql:a,SyncIrql:a,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:i8042prt!I8042KeyboardInterruptService(f3c51918))
* M+ @0 ]" L8 N* x1 fc1: 800642fc (hal!HalpBroadcastCallService)4 `2 \5 y" a9 F# V' z
d1: 80063964 (hal!HalpClockInterrupt)
! f; g6 a* N* h3 [7 b5 ye1: 80064858 (hal!HalpIpiHandler)
/ G$ @2 s6 o: n7 \e3: 800645d4 (hal!HalpLocalApicErrorService)2 c& s( B$ l( B* ]
fd: 80064d64 (hal!HalpProfileInterrupt)9 h) T! ~7 G# g- r+ a
fe: 80064eec (hal!HalpPerfInterrupt)( N: \2 {% v& c+ r. U) Q& h
* T J7 b8 E. S2 B; G3 Q9 _* s) L
象a3、b1这类输出内容很多的是被硬件注册的中断向量,而象d1、e3这种输出内容少的是注册为了的HAL内部使用的中断向量和本地APIC中断向量9 H5 k& q9 q) Y
7 s* Z4 |, N7 \" C7 ~. Z这是几个重要的数组:
1 U# s& a3 S$ t: q% E D4 B
, Y$ z, {2 u/ T; J8 v8 g0 DHalVectorToIrql(这个数组是以向量除于16做索引):/ L8 ] ]2 H! S
8006a304 00 ff ff 01 02 04 05 06-07 08 09 0a 1b 1c 1d 1e
7 I5 D6 }% v& I8 j/ n
, S$ K- u7 V l) G3 Q( NHalpIRQLtoTPR:0 X" X2 W9 o' M9 b: X* k9 e
8006a1e4 00 3d 41 41 51 61 71 81-91 a1 b1 b1 b1 b1 b1 b1: v- e' r3 Y( @! V- Z9 {# L' `
8006a1f4 b1 b1 b1 b1 b1 b1 b1 b1-b1 b1 b1 c1 d1 e1 ef ff
( {; I. h5 K/ U" D' X3 T% X/ X, y" i$ E6 [' F
HalpINTItoVector:. l0 _7 ~, q2 \# b! }) G( `
8006ada0 00 b3 61 51 a2 b2 62 91-a1 b1 71 81 52 82 72 92! Z4 h5 Z0 A6 b7 l
8006adb0 00 a3 83 93 00 00 00 00-00 00 00 00 00 00 00 00
8 I3 t5 A& _/ O: N4 \5 g6 L( C5 E+ R5 c w8 D' {9 z6 N9 D/ [2 L4 u# U
HalVectorToINTI:( _$ S! @' I7 h
8006a204 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
5 u. G& i: |% _& g# V. y8006a214 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff1 y7 O* o7 v3 p8 Z1 \6 w2 Q. u1 @1 `
8006a224 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
: H6 J/ L' c2 `7 ]8006a234 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
9 s5 a+ c2 R) H& ]- ]7 ?* v8006a244 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff9 I/ y, k7 r# C1 Z8 h
8006a254 ff 03 0c ff ff ff ff ff-ff ff ff ff ff ff ff ff
+ q- a1 K# m0 R8006a264 ff 02 06 ff ff ff ff ff-ff ff ff ff ff ff ff ff2 L% ~! K R' }; Y3 z
8006a274 ff 0a 0e ff ff ff ff ff-ff ff ff ff ff ff ff ff
; \7 U1 n/ Q9 d# m! ` v8006a284 ff 0b 0d 12 ff ff ff ff-ff ff ff ff ff ff ff ff
0 p3 w2 ]* [' @6 T- c2 ]8006a294 ff 07 0f 13 ff ff ff ff-ff ff ff ff ff ff ff ff
& R+ @) i6 N; m0 q8006a2a4 ff 08 04 11 ff ff ff ff-ff ff ff ff ff ff ff ff# v! ]( k1 h N, v. `- w3 Y" J5 o3 i
8006a2b4 ff 09 05 01 ff ff ff ff-ff ff ff ff ff ff ff ff
) @5 `& Y+ d }) e8006a2c4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff) l: o& p) y4 r7 h
8006a2d4 ff 08 ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
' v3 i% q" m8 Z8006a2e4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff& }4 f0 b3 t% q- r
8006a2f4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff
, q0 h. F% j# G; ?) m, E1 W
0 R& [2 {* `' H+ b% u* {
?1 ?8 E9 ~2 X0 L0 G$ ]" @vBucket:
. \7 ~8 w' W z; z8 O) ^( ~: o8006ae30 02 02 02 03 03 03 034 E/ u! X- ]# A- a4 ?# P0 r
, O8 `9 }5 V" U% a 举个例子来说明一下,在我虚拟机里SCSI Controller的IRQ是17(注意,已经大于16了),到重定向表中查找第17项,得到中断向量为0xa3,再看IDT,0xa3对应处理例程是SCSIPORT!ScsiPortInterrupt。; d8 i7 ?- a3 x1 W, l
+ c7 P$ p: r0 f3 ~ vBucket数组干啥用的?它就是用来分配新的向量。分配算法很简单,当要分配一个新的向量时,就在vBucket数组从右到左搜索最小的一个数i,该数对应在vBucket中索引为Index,新向量为(0x50+Index*16+i+1),新向量对应的IRQL为(4+i+1),同时会把vBucket中这个i加1,i不等大于16。象给出的这个vBucket,下一次计算时i=2, index=2。不过这些用于硬件的向量在IO系统初始化时调用HalpGetSystemInterruptVector分配好了,然后通过IoConnectInterrupt把IDT中注册的向量位置的例程注册为中断处理程序。这里并不是每个注册的向量都会对应中断处理程序,象上面给出的例子中,0xa1、0xa2、0xb1等向量就没有对应。3 N K2 w2 i7 H7 a" A
6 j e( k9 j4 S
IRQL机制为内核同步提供了很大的便利,既对驱动开发者隐藏了底层中断机制,也方便了驱动开发者的内核同步。LINUX从2.5内核开始引进的软中断和任务队列等机制,很大程度上也来自windows这套机制的借鉴。' Q- B p: Y3 p1 m! u: L, x) H
! v5 F! d/ C8 d' j3 Q
终于考完试,解放了,呵呵。这个东西其实还有很多可写的,只是没空再深入去分析了。在未来的64位系统里,APIC这种基于中断引脚的机制很快也要被SAPIC这种基于消息的更强大的机制所取代 |
|