|
楼主 |
发表于 2008-2-27 14:35:05
|
显示全部楼层
从IRQ到IRQL(APIC版)
来自:http://www.nsfocus.net/index.php ... o=view&mid=2534
. K e$ c3 O" b- a) z' a' s4 {$ F- C: ~& X) I7 X: Y
从IRQ到IRQL(APIC版)
* |% ]2 z3 Q# ~. H9 T5 S' u: s- b. E! e7 A2 p" `' g3 N; y
作者:SoBeIt1 ~. W2 a2 m/ x* a- m% Z8 p
出处:https://www.xfocus.net/bbs/index.php?act=ST&f=2&t=45502; _: \# S5 n7 Q! e1 H
日期:2005-02-04
5 _! G) a) l2 @, Z$ Z8 V& p2 q. O! z, i% R5 R3 p# ?
事实上,老久的PIC在很早以前就被淘汰了,取而代之的是APIC。由于APIC可以兼容PIC,所以在很多单处理器系统上我们看到的PIC实际是APIC的兼容PIC模式。APIC主要应用于多处理器操作系统,是为了解决IRQ太少和处理器间中断而产生的,当然,单处理器操作系统也可以使用APIC(不是模拟PIC)。APIC的HAL和PIC的HAL有很大的不同,很突出的一个特点就是APIC的HAL不用再象PIC的HAL那样虚拟一个中断控制器,IRQL的概念已经可以通过中断向量的形式被APIC支持。事实上,因为被APIC所支持,所以在APIC HAL里IRQL的实现比PIC HAL那样虚拟一个中断控制器要简单得多了。% `# O$ c- f% N6 p& C% I) ~
5 x/ f" [8 E: c
现在来简单介绍一下APIC的结构(关于APIC详细的描述请参考《IA-32 Inel Architecture Software Developer's Manual Volume 3 Chapter 8》)。整个APIC系统由本地APIC、IO APIC和APIC串行总线组成(在Pentium 4和Xeon以后,APIC总线放到了系统总线中)组成。每个处理器中集成了一个本地APIC,而IO APIC是系统芯片组中一部分,APIC总线负责连接IO APIC和各个本地APIC。本地APIC接收该处理器产生的本地中断比如时钟中断,以及由该处理器产生的处理器间中断,并从APIC串行总线接收来自IO APIC的消息;IO APIC负责接收所有外部的硬件中断,并翻译成消息选择发给接收中断的处理器,以及从本地APIC接收处理器间中断消息。
% p1 C( e$ b8 a
. M% Q% V8 j3 c1 ~& G 和PIC一样,控制本地APIC和IO APIC的方法是通过读写该单元中的相关寄存器。不过和PIC不一样的是,Intel把本地APIC和IO APIC的寄存器都映射到了物理地址空间,本地APIC默认映射到物理地址0xffe00000,IO APIC默认映射到物理地址0xfec00000。windows HAL再进一步把本地APIC映射到虚拟地址0xfffe0000,把IO APIC映射到虚拟地址0xffd06000,也就是说对该地址的读写实际就是对寄存器的读写,本地APIC里几个重要的寄存有EOI寄存器,任务优先级寄存器(TPR),处理器优先级寄存器(PPR),中断命令寄存器(ICR,64位),中断请求寄存器(IRR,256位,对应每个向量一位),中断在服务寄存器(ISR,256位)等。IO APIC里几个重要的寄存器有版本寄存器,I/O寄存器选择寄存器、I/O窗口寄存器(用要访问的I/O APIC寄存器的索引设置地址I/O寄存器选择寄存器,此时访问I/O窗口寄存器就是访问被选定的寄存器)还有很重要的是一个IO重定向表,每一个表项是一个64位寄存器,包括向量和目标模式、传输模式等相关位,每一个表项连接一条IRQ线,表项的数目随处理器的版本而不一样,在Pentium 4上为24个表项。表项的数目保存在IO APIC版本寄存器的[16:23]位。APIC系统支持255个中断向量,但Intel保留了0-15向量,可用的向量是16-255。并引进一个概念叫做任务优先级=中断向量/16,因为保留了16个向量,所以可用的优先级是2-15。当用一个指定的优先级设置本地APIC中的任务优先级寄存器TPR后,所有优先级低于TPR中优先级的中断都被屏蔽,是不是很象IRQL的机制?事实上,APIC HAL里的IRQL机制也就是靠着这个任务优先级寄存器得以实现。同一个任务优先级包括了16个中断向量,可以进一步细粒度地区分中断的优先级。. ~/ k! d. ^3 _! i. `
: v' v& s, w( ~' Y2 S0 S 在HAL里虽然HalBeginSystemInterrupt仍然是IRQL机制的发动引擎,但是因为有APIC的支持,它和其它共同实现IRQL的函数要比PIC HAL里对应的函数功能简单得多。HalBeginSystemInterrupt通过用IRQL做索引在HalpIRQLtoTPR数组中获取该IRQL对应的任务优先级,用该优先级设置任务优先级寄存器TPR,并把TPR中原先的任务优先级/16做为索引在HalpVectorToIRQL数组中获取对应的原先的IRQL然后返回。若IRQL是从低于DISPATCH_LEVEL提升到高于DISPATCH_LEVEL,还需要设置KPCR+0x95(0xffdff095)为DISPATCH_LEVEL(0x2),表示是从DISPATCH_LEVEL以下的级别提升IRQL。HalEndSystemInterrupt向本地APIC的EOI寄存发送0,表示中断结束,可以接收新中断。并还要判断要降到的IRQL是否小于DISPATCH_LEVEL,若小于则进一步判断KPCR+0x96(0xffdff096)是否置位,若置位则表示有DPC中断在等待(在IRQL高于DISPATCH_LEVEL被引发,然后等待直到IRQL降到低于DISPATCH_LEVEL),则将KPCR+0x95和KPCR+0x96清0后调用KiDispatchInterrupt响应DPC软中断。否则做的工作就是和HalBeginSystemInterrupt一样的过程:把要降到的IRQL转换成任务优先级设置TRP,并把久的任务优先级转成IRQL返回。KfRaiseIrql、KfLowerIrql之类的函数也是这么一回事,把当前IRQL转成任务优先级修改TPR,并把原先TPR的值转成原先的IRQL并返回。而现在软中断的产生也有了APIC支持,APIC通过产生一个发向自己的处理器间中断,就可以产生一个软中断,因为可以指定该中断的向量,所以软中断就可以区分优先级别,如APC_LEVEL、DISPATCH_LEVEL。产生软中断的函数一样还是HalRequestSoftwareInterrupt,该函数会先判断KPCR+0x95是否和要产生的软中断IRQL一样,若是的话则置位KPCR+0x96并返回,表示现在IRQL大于DISPATCH_LEVEL所以不处理DPC中断。否则以要产生的软中断的IRQL为索引从HalpIRQLtoTPRHAL取出对应任务优先级,并或上0x4000,表示是发向自身的固定处理间中断,并用该值设置中断命令寄存器ICW的低32位,然后读取中断命令寄存器ICW的低32位是否为0x1000,确定中断消息已经发送后就返回,这时候软中断已经产生。值得注意的是APIC HAL里没有HalEndSoftwareInterrupt这个函数。HAL为软中断的IRQL提供了一个固定的中断向量:
% Q- N6 a% R- Z: v- c e- m) \6 i# g; I$ Y$ q
#define ZERO_VECTOR 0x00 // IRQL 00 7 h5 P* }9 W9 [8 Q( g3 K6 W# I. t
#define APC_VECTOR 0x3D // IRQL 01
% I: @0 @5 m# |#define DPC_VECTOR 0x41 // IRQL 02
$ |, j, @# b5 r9 t. X#define APIC_GENERIC_VECTOR 0xC1 // IRQL 271 ~! c8 E! |9 }6 t W
#define APIC_CLOCK_VECTOR 0xD1 // IRQL 28 X& i+ w/ a4 U9 l" q$ H7 \& W
#define APIC_SYNCH_VECTOR 0xD1 // IRQL 28" M7 K5 H0 H* C; e9 ]2 P7 _
#define APIC_IPI_VECTOR 0xE1 // IRQL 293 {. }0 e$ I$ [
#define POWERFAIL_VECTOR 0xEF // IRQL 30
8 Q$ W6 e4 L* z& e5 Z#define APIC_PROFILE_VECTOR 0xFD // IRQL 313 y+ f' F, S0 b
; B0 P0 s4 O+ G' B% m- {% |1 H
现在看一下一些重要的数据: n# g. s0 w6 ?8 Y- B2 Z- y k7 H& k
! Z" z- C" b( E7 V
这是我写的代码输出的IO APIC重定向表内容:1 e, A4 p: v' C( V5 b5 w B
1 V, V: E$ K7 |1 A
Redirect Table Index: 0x17$ C# [( _# L9 V. r# X' m' P3 T
Redirect Table[ 0]: ff2 q4 t6 x5 @0 Q/ v9 v2 p% S6 `
Redirect Table[ 1]: b3
5 A- _, V/ l$ H( q3 W- WRedirect Table[ 2]: ff
& K M, J) B$ e: G+ {+ J9 j5 ?6 NRedirect Table[ 3]: 511 Z ^( B* f/ i1 j% Q6 ]; G* e
Redirect Table[ 4]: ff9 y }1 q7 p4 J9 g
Redirect Table[ 5]: ff
; C! W! t' D# F- C5 sRedirect Table[ 6]: 62
6 M* _8 n/ [, }; YRedirect Table[ 7]: ff
8 D0 D1 ]! m& b: A% TRedirect Table[ 8]: d1
% F# L* b6 m+ z1 j6 l' cRedirect Table[ 9]: b1
+ H1 h# j- Y$ o: R$ f/ {* G7 u1 NRedirect Table[ a]: ff
/ P% e: D+ F1 K+ y9 ^( ~Redirect Table[ b]: ff" j; A9 G8 `, H) ?
Redirect Table[ c]: 522 G& z$ R: s7 [( ]% Q) C$ d
Redirect Table[ d]: ff
0 U @( J- `7 E- R7 ?8 }4 s6 sRedirect Table[ e]: ff
, ^. f, J6 C$ S: O3 E8 J3 y# J' iRedirect Table[ f]: 92; `( }& I8 d5 v; a e( i
Redirect Table[10]: ff
* s" o. E4 X a/ Y0 f5 sRedirect Table[11]: a3
4 N; O$ d0 J5 Q; BRedirect Table[12]: 83
; A' X0 O- _* jRedirect Table[13]: 93
- y+ _; [: Z6 B9 z; G2 hRedirect Table[14]: ff4 S$ _! s& g) }9 n* Q1 o$ z
Redirect Table[15]: ff
! n; b. J" m4 `7 G1 e5 nRedirect Table[16]: ff
& d, f7 ^" {. n4 q( y8 ]7 ^. ]0 h9 hRedirect Table[17]: ff
& j' D) ~3 I2 o: a& }
& `; u9 a, B; v5 H" z这是IDT表中被注册的向量:/ z" V* |0 `5 Q6 L
8 P+ o4 B ^3 U8 \2 \& r( Y; j1f: 80064908 (hal!HalpApicSpuriousService)0 I- _7 W4 a5 b) R& ]
37: 800640b8 (hal!PicSpuriousService37)
7 G5 a' M: i9 u0 D3d: 80065254 (hal!HalpApcInterrupt)
4 G5 e( ^, \5 `$ t! j C41: 800650c8 (hal!HalpDispatchInterrupt)7 L a/ o* l: U/ J+ A1 Q* d6 K
50: 80064190 (hal!HalpApicRebootService)0 {& b$ j- c5 o# u) y+ X* _. {
51: 817f59e48 Y* Z* u, ^' C) Q" E& V: B
(Vector:51,Irql:4,SyncIrql:4,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:serial!SerialCIsrSw(f3c607c7))4 ?" t0 c. w- T& `' d% S6 \) i
52: 817f5044
8 g. @% l7 K" [1 t3 X(Vector:52,Irql:4,SyncIrql:a,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:i8042prt!I8042MouseInterruptService(f3c57a2c))
; ?" c+ A& q! ?2 ~! Y: M- y83: 817d2d44 / C6 @+ J& K' L
(Vector:83,Irql:7,SyncIrql:7,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:NDIS!ndisMIsr(bff1b794))
* Z$ O3 C' N8 V5 o }& R92: 81821384 - _7 s% B! y# M
(Vector:92,Irql:8,SyncIrql:8,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:atapi!ScsiPortInterrupt(bff892be))
/ ^- D& l- `# d( _/ a! M4 L X93: 8185ed64
, B+ v4 x6 O B" T# S(Vector:93,Irql:8,SyncIrql:8,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:uhcd!UHCD_InterruptService(f3f0253e))
7 a/ }+ r, T+ D7 q; z2 \a3: 8186cdc4
! D2 [+ O [* E5 D2 G/ G(Vector:a3,Irql:9,SyncIrql:9,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:SCSIPORT!ScsiPortInterrupt(bff719f0))) o5 O, `9 c+ L. `$ w2 t6 d% d
b1: 818902e4 * O: \' T A B1 P8 }" Y3 d; n
(Vector:b1,Irql:a,SyncIrql:a,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:ACPI!ACPIInterruptServiceRoutine(bffe14b4))
8 x1 m. `) P' E* L7 Sb3: 81881664 8 I# i- @1 m) x( }* r
(Vector:b3,Irql:a,SyncIrql:a,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:i8042prt!I8042KeyboardInterruptService(f3c51918))
. G' o0 S& `6 G$ Z- \7 T5 Zc1: 800642fc (hal!HalpBroadcastCallService)
4 K6 }1 ?" X7 z/ e. Xd1: 80063964 (hal!HalpClockInterrupt)
/ E9 f! B: n7 a6 u% I7 Ue1: 80064858 (hal!HalpIpiHandler)8 { {/ l& g' w7 q
e3: 800645d4 (hal!HalpLocalApicErrorService)
9 J0 g$ c# W! Y1 Ufd: 80064d64 (hal!HalpProfileInterrupt)! q- Y. g: d# R) w5 \
fe: 80064eec (hal!HalpPerfInterrupt)9 x8 v% m7 M4 q
8 O5 ]+ `: Q% e$ ?. ?1 X6 B
象a3、b1这类输出内容很多的是被硬件注册的中断向量,而象d1、e3这种输出内容少的是注册为了的HAL内部使用的中断向量和本地APIC中断向量& p5 d( @) D1 r! o, V
9 P. ^8 ^/ H0 U1 P$ ~$ c这是几个重要的数组:& O, c! d, D+ o6 B# P* Y j4 g1 [
/ g+ ~9 m( b% ?3 L! e! ~HalVectorToIrql(这个数组是以向量除于16做索引):
9 i" I5 x! ?; g5 J9 S7 P' u8006a304 00 ff ff 01 02 04 05 06-07 08 09 0a 1b 1c 1d 1e
! T& {% ?8 y- w. l
& o* o' d4 d& x7 b# t0 BHalpIRQLtoTPR:9 L/ s$ ], D! r* I( K% m" g" @
8006a1e4 00 3d 41 41 51 61 71 81-91 a1 b1 b1 b1 b1 b1 b1$ U: A. P5 N) d: j# {: j5 J/ E. u/ e
8006a1f4 b1 b1 b1 b1 b1 b1 b1 b1-b1 b1 b1 c1 d1 e1 ef ff% D0 O; Z( t& { l4 p# D
0 N7 P) X5 i' H& FHalpINTItoVector:) V6 I3 D, O3 a
8006ada0 00 b3 61 51 a2 b2 62 91-a1 b1 71 81 52 82 72 92
; ^( a$ O) z% F4 S) b8006adb0 00 a3 83 93 00 00 00 00-00 00 00 00 00 00 00 00* [8 b3 A4 s/ l* k. |+ B3 Z4 l% f5 M
/ j% g2 s& P9 V1 J3 v9 C/ X
HalVectorToINTI:" v+ V9 N C* \
8006a204 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
0 ]2 }7 _# a( V+ l5 O# }8006a214 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
$ [/ l, g5 }3 ^( L* H! E% N B m8006a224 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff/ S7 d$ {* W. ~3 Y
8006a234 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
( U/ a9 f( H5 e6 h8006a244 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
8 R% Q" N, f& m- s: z1 {7 f8006a254 ff 03 0c ff ff ff ff ff-ff ff ff ff ff ff ff ff
" s7 A$ s/ K8 F9 _* i6 Y! D8006a264 ff 02 06 ff ff ff ff ff-ff ff ff ff ff ff ff ff
3 C/ [' @4 m7 b! u" O: y8006a274 ff 0a 0e ff ff ff ff ff-ff ff ff ff ff ff ff ff1 k1 b/ R. L0 S; F
8006a284 ff 0b 0d 12 ff ff ff ff-ff ff ff ff ff ff ff ff
+ f2 Q% a) ]- }" `( S8006a294 ff 07 0f 13 ff ff ff ff-ff ff ff ff ff ff ff ff
) U" H+ b' \+ |$ X. U8006a2a4 ff 08 04 11 ff ff ff ff-ff ff ff ff ff ff ff ff
& Q8 j! o) r% q% O0 \/ v8006a2b4 ff 09 05 01 ff ff ff ff-ff ff ff ff ff ff ff ff
& [& G7 K3 S/ B2 _+ a% Y" K8006a2c4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
. n5 E* [2 c; K }8006a2d4 ff 08 ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
$ x& Z0 ]1 Y D2 W) {# K4 D8006a2e4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
, @* S- ?6 J4 y! N/ z8006a2f4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff $ x8 {# o) i' b- \+ ]; u9 m# G+ w
( [2 C# }8 W7 n* }) m
z- S) T7 b) e2 u. w0 JvBucket:
2 U! [+ h/ p) z7 D) g8006ae30 02 02 02 03 03 03 03+ h6 W& z. w P# G
. R# p) x; S# x- T( u; U/ z 举个例子来说明一下,在我虚拟机里SCSI Controller的IRQ是17(注意,已经大于16了),到重定向表中查找第17项,得到中断向量为0xa3,再看IDT,0xa3对应处理例程是SCSIPORT!ScsiPortInterrupt。
% ?- M5 J- t, {" H& T) T- z$ ^. q6 o0 ~$ S3 x
vBucket数组干啥用的?它就是用来分配新的向量。分配算法很简单,当要分配一个新的向量时,就在vBucket数组从右到左搜索最小的一个数i,该数对应在vBucket中索引为Index,新向量为(0x50+Index*16+i+1),新向量对应的IRQL为(4+i+1),同时会把vBucket中这个i加1,i不等大于16。象给出的这个vBucket,下一次计算时i=2, index=2。不过这些用于硬件的向量在IO系统初始化时调用HalpGetSystemInterruptVector分配好了,然后通过IoConnectInterrupt把IDT中注册的向量位置的例程注册为中断处理程序。这里并不是每个注册的向量都会对应中断处理程序,象上面给出的例子中,0xa1、0xa2、0xb1等向量就没有对应。6 d0 ?2 i. B" A5 R3 t, y4 J3 D$ h
2 q5 l F/ ~4 `6 V+ W. S! Y IRQL机制为内核同步提供了很大的便利,既对驱动开发者隐藏了底层中断机制,也方便了驱动开发者的内核同步。LINUX从2.5内核开始引进的软中断和任务队列等机制,很大程度上也来自windows这套机制的借鉴。) R# m# c, `! X& }
9 H6 |: K* [. A4 l( ~8 S; d 终于考完试,解放了,呵呵。这个东西其实还有很多可写的,只是没空再深入去分析了。在未来的64位系统里,APIC这种基于中断引脚的机制很快也要被SAPIC这种基于消息的更强大的机制所取代 |
|