|
|
楼主 |
发表于 2008-2-27 14:35:05
|
显示全部楼层
从IRQ到IRQL(APIC版)
来自:http://www.nsfocus.net/index.php ... o=view&mid=2534
2 V" G# s1 F0 M2 J7 W# l- t
6 Q* C3 r$ D9 {1 P( S从IRQ到IRQL(APIC版)
3 v8 C# z t% ]8 R, t3 o3 z* Z! V
作者:SoBeIt Z" I6 }! [6 d0 ^, D' D, l; ~
出处:https://www.xfocus.net/bbs/index.php?act=ST&f=2&t=45502
8 W: {# \& N. p- V. ]/ q9 N1 Y日期:2005-02-04
6 m5 g' d4 v: w* Z/ Q, Q. W# @) N8 }+ M" D6 ], K
事实上,老久的PIC在很早以前就被淘汰了,取而代之的是APIC。由于APIC可以兼容PIC,所以在很多单处理器系统上我们看到的PIC实际是APIC的兼容PIC模式。APIC主要应用于多处理器操作系统,是为了解决IRQ太少和处理器间中断而产生的,当然,单处理器操作系统也可以使用APIC(不是模拟PIC)。APIC的HAL和PIC的HAL有很大的不同,很突出的一个特点就是APIC的HAL不用再象PIC的HAL那样虚拟一个中断控制器,IRQL的概念已经可以通过中断向量的形式被APIC支持。事实上,因为被APIC所支持,所以在APIC HAL里IRQL的实现比PIC HAL那样虚拟一个中断控制器要简单得多了。$ g: x ]5 }! y4 |2 w y$ N
7 ?/ E+ [) ]; K9 p( [1 _# i
现在来简单介绍一下APIC的结构(关于APIC详细的描述请参考《IA-32 Inel Architecture Software Developer's Manual Volume 3 Chapter 8》)。整个APIC系统由本地APIC、IO APIC和APIC串行总线组成(在Pentium 4和Xeon以后,APIC总线放到了系统总线中)组成。每个处理器中集成了一个本地APIC,而IO APIC是系统芯片组中一部分,APIC总线负责连接IO APIC和各个本地APIC。本地APIC接收该处理器产生的本地中断比如时钟中断,以及由该处理器产生的处理器间中断,并从APIC串行总线接收来自IO APIC的消息;IO APIC负责接收所有外部的硬件中断,并翻译成消息选择发给接收中断的处理器,以及从本地APIC接收处理器间中断消息。+ B/ U' C7 D, {5 n# }
0 }& U( Y; p# M$ }8 u5 }* p" Z( }) V E
和PIC一样,控制本地APIC和IO APIC的方法是通过读写该单元中的相关寄存器。不过和PIC不一样的是,Intel把本地APIC和IO APIC的寄存器都映射到了物理地址空间,本地APIC默认映射到物理地址0xffe00000,IO APIC默认映射到物理地址0xfec00000。windows HAL再进一步把本地APIC映射到虚拟地址0xfffe0000,把IO APIC映射到虚拟地址0xffd06000,也就是说对该地址的读写实际就是对寄存器的读写,本地APIC里几个重要的寄存有EOI寄存器,任务优先级寄存器(TPR),处理器优先级寄存器(PPR),中断命令寄存器(ICR,64位),中断请求寄存器(IRR,256位,对应每个向量一位),中断在服务寄存器(ISR,256位)等。IO APIC里几个重要的寄存器有版本寄存器,I/O寄存器选择寄存器、I/O窗口寄存器(用要访问的I/O APIC寄存器的索引设置地址I/O寄存器选择寄存器,此时访问I/O窗口寄存器就是访问被选定的寄存器)还有很重要的是一个IO重定向表,每一个表项是一个64位寄存器,包括向量和目标模式、传输模式等相关位,每一个表项连接一条IRQ线,表项的数目随处理器的版本而不一样,在Pentium 4上为24个表项。表项的数目保存在IO APIC版本寄存器的[16:23]位。APIC系统支持255个中断向量,但Intel保留了0-15向量,可用的向量是16-255。并引进一个概念叫做任务优先级=中断向量/16,因为保留了16个向量,所以可用的优先级是2-15。当用一个指定的优先级设置本地APIC中的任务优先级寄存器TPR后,所有优先级低于TPR中优先级的中断都被屏蔽,是不是很象IRQL的机制?事实上,APIC HAL里的IRQL机制也就是靠着这个任务优先级寄存器得以实现。同一个任务优先级包括了16个中断向量,可以进一步细粒度地区分中断的优先级。6 _) H+ e5 `) B0 K! B
8 v1 `; M( s* y7 W% n/ s- K
在HAL里虽然HalBeginSystemInterrupt仍然是IRQL机制的发动引擎,但是因为有APIC的支持,它和其它共同实现IRQL的函数要比PIC HAL里对应的函数功能简单得多。HalBeginSystemInterrupt通过用IRQL做索引在HalpIRQLtoTPR数组中获取该IRQL对应的任务优先级,用该优先级设置任务优先级寄存器TPR,并把TPR中原先的任务优先级/16做为索引在HalpVectorToIRQL数组中获取对应的原先的IRQL然后返回。若IRQL是从低于DISPATCH_LEVEL提升到高于DISPATCH_LEVEL,还需要设置KPCR+0x95(0xffdff095)为DISPATCH_LEVEL(0x2),表示是从DISPATCH_LEVEL以下的级别提升IRQL。HalEndSystemInterrupt向本地APIC的EOI寄存发送0,表示中断结束,可以接收新中断。并还要判断要降到的IRQL是否小于DISPATCH_LEVEL,若小于则进一步判断KPCR+0x96(0xffdff096)是否置位,若置位则表示有DPC中断在等待(在IRQL高于DISPATCH_LEVEL被引发,然后等待直到IRQL降到低于DISPATCH_LEVEL),则将KPCR+0x95和KPCR+0x96清0后调用KiDispatchInterrupt响应DPC软中断。否则做的工作就是和HalBeginSystemInterrupt一样的过程:把要降到的IRQL转换成任务优先级设置TRP,并把久的任务优先级转成IRQL返回。KfRaiseIrql、KfLowerIrql之类的函数也是这么一回事,把当前IRQL转成任务优先级修改TPR,并把原先TPR的值转成原先的IRQL并返回。而现在软中断的产生也有了APIC支持,APIC通过产生一个发向自己的处理器间中断,就可以产生一个软中断,因为可以指定该中断的向量,所以软中断就可以区分优先级别,如APC_LEVEL、DISPATCH_LEVEL。产生软中断的函数一样还是HalRequestSoftwareInterrupt,该函数会先判断KPCR+0x95是否和要产生的软中断IRQL一样,若是的话则置位KPCR+0x96并返回,表示现在IRQL大于DISPATCH_LEVEL所以不处理DPC中断。否则以要产生的软中断的IRQL为索引从HalpIRQLtoTPRHAL取出对应任务优先级,并或上0x4000,表示是发向自身的固定处理间中断,并用该值设置中断命令寄存器ICW的低32位,然后读取中断命令寄存器ICW的低32位是否为0x1000,确定中断消息已经发送后就返回,这时候软中断已经产生。值得注意的是APIC HAL里没有HalEndSoftwareInterrupt这个函数。HAL为软中断的IRQL提供了一个固定的中断向量:8 x: ~0 j5 ~" ] J3 v3 H. z4 p
$ ^9 b, J0 z0 a# m4 `
#define ZERO_VECTOR 0x00 // IRQL 00
% Y. n4 [, U2 `* `( O#define APC_VECTOR 0x3D // IRQL 01
5 q2 C2 V% J: p#define DPC_VECTOR 0x41 // IRQL 02
/ l3 _( p& l+ F2 ^4 h#define APIC_GENERIC_VECTOR 0xC1 // IRQL 27
: j5 j. v1 ]/ e/ \ }#define APIC_CLOCK_VECTOR 0xD1 // IRQL 28% T9 y! q" v4 U. ^/ t
#define APIC_SYNCH_VECTOR 0xD1 // IRQL 28) ?! @3 G- k" p- h Y
#define APIC_IPI_VECTOR 0xE1 // IRQL 29& p$ G5 }5 s7 V% w
#define POWERFAIL_VECTOR 0xEF // IRQL 30
1 M, f D/ I) X! o# b* @#define APIC_PROFILE_VECTOR 0xFD // IRQL 31) q g* g8 _- Z5 R4 |; M) G/ }
. }) d6 j' b0 Q: T) c" I5 |
! D' Q# H1 P1 m& O% u现在看一下一些重要的数据:
2 `* k" d9 j8 e8 t, h1 \( j, p& k( q
这是我写的代码输出的IO APIC重定向表内容:6 p4 L o& s$ B: Q- q N2 g2 K8 d
2 j: s8 G: q& k6 a4 {8 j% ^6 qRedirect Table Index: 0x17+ U1 v1 L- c8 m# r% O7 p9 O' f0 c
Redirect Table[ 0]: ff
: H6 S- J& F7 rRedirect Table[ 1]: b3
; {; Q! r0 B6 PRedirect Table[ 2]: ff
9 R7 v& W& ?. Z1 YRedirect Table[ 3]: 51! [) T$ G8 m8 C4 J) V1 U
Redirect Table[ 4]: ff
! N- }3 C$ Q3 P$ F# K8 J7 F& HRedirect Table[ 5]: ff
1 B$ }8 m* F4 R/ c' T, J4 G h# }2 qRedirect Table[ 6]: 62
# D8 n3 O) B* vRedirect Table[ 7]: ff- B) k8 r/ E" Z/ K+ I. z0 S
Redirect Table[ 8]: d1, r1 B+ | l7 s. v) H/ B
Redirect Table[ 9]: b1' j$ ]; m$ a- D& Y8 M" p
Redirect Table[ a]: ff' `+ I) L6 P/ d1 D2 ~
Redirect Table[ b]: ff7 U$ K9 S7 d+ g1 j! k
Redirect Table[ c]: 52 b: N$ k. R; W& y! V
Redirect Table[ d]: ff8 @& U k: @& Z W/ z# `
Redirect Table[ e]: ff
% G% a2 J8 m% LRedirect Table[ f]: 926 E# _$ o# S( U5 B, n+ s) b
Redirect Table[10]: ff
. p. C G% y3 A1 q, \, E4 f, \Redirect Table[11]: a3
/ U( Z& L4 b# u% @Redirect Table[12]: 835 }- g, _ x8 W
Redirect Table[13]: 93
1 b9 w1 ]$ h! ~0 ^; i! t- h9 a5 b7 |Redirect Table[14]: ff
0 i' ~% q$ D+ T+ E1 e( o$ ~, T' T9 IRedirect Table[15]: ff& g% w( I1 k* k0 y" G" |: s
Redirect Table[16]: ff
* U l$ C+ s, N: ~" hRedirect Table[17]: ff
/ c2 K! q0 Q% l# m, Y$ s7 a, P' `" W& i, g
这是IDT表中被注册的向量:- [- z9 z) J* J; x b0 U, ~
& M: g; G* C9 A& {
1f: 80064908 (hal!HalpApicSpuriousService)5 `) p6 S/ k5 Q9 y e/ u
37: 800640b8 (hal!PicSpuriousService37)
; s6 g* ]: |* I$ Z3d: 80065254 (hal!HalpApcInterrupt)# g' b- W/ n! k% D! a+ u
41: 800650c8 (hal!HalpDispatchInterrupt)) ?* E# w$ B2 X: r0 H0 J9 [; n
50: 80064190 (hal!HalpApicRebootService)* ?8 K7 c8 B. d
51: 817f59e40 ^8 r/ E; V5 g7 I
(Vector:51,Irql:4,SyncIrql:4,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:serial!SerialCIsrSw(f3c607c7))
7 e7 X: b# y6 Z+ E4 Y52: 817f5044
5 k% q; ^; m( X' q$ a! `( E(Vector:52,Irql:4,SyncIrql:a,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:i8042prt!I8042MouseInterruptService(f3c57a2c))
+ \% I& J6 U5 P9 Y$ u4 a6 {% ]1 ~5 w83: 817d2d44
I, v' S* Z( R7 ?$ G c(Vector:83,Irql:7,SyncIrql:7,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:NDIS!ndisMIsr(bff1b794))- Q/ a0 K z$ ?5 @. f1 T1 Z
92: 81821384 1 O- z9 C. x/ R& }' I" f5 ?
(Vector:92,Irql:8,SyncIrql:8,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:atapi!ScsiPortInterrupt(bff892be))
4 e {5 I* ?3 }- R93: 8185ed64
! x9 p4 `/ p( w3 h! L, G(Vector:93,Irql:8,SyncIrql:8,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:uhcd!UHCD_InterruptService(f3f0253e))# y- Z* D* D) Y3 |- x I
a3: 8186cdc4 ) t% p0 R5 R2 [/ ?
(Vector:a3,Irql:9,SyncIrql:9,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:SCSIPORT!ScsiPortInterrupt(bff719f0))6 i; @! p; v+ A4 m% ]
b1: 818902e4
) x0 P! Y/ z% v! c/ w% h(Vector:b1,Irql:a,SyncIrql:a,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:ACPI!ACPIInterruptServiceRoutine(bffe14b4))
/ q! U( p, C! k0 B: D) Y7 Cb3: 81881664 7 I8 q3 p( ^# M; R A
(Vector:b3,Irql:a,SyncIrql:a,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:i8042prt!I8042KeyboardInterruptService(f3c51918))
5 Z( C9 S6 }% f$ u/ s: cc1: 800642fc (hal!HalpBroadcastCallService)
% t [9 X" d) |1 w4 xd1: 80063964 (hal!HalpClockInterrupt)/ i# s, t v+ c6 e: Y
e1: 80064858 (hal!HalpIpiHandler)) @+ [: E5 h* u3 b+ U/ {* H% c; s
e3: 800645d4 (hal!HalpLocalApicErrorService)
! I( K% w5 u& S( ?) r0 Zfd: 80064d64 (hal!HalpProfileInterrupt): f' r l, M' f' `
fe: 80064eec (hal!HalpPerfInterrupt)
* P" n4 P1 T! T) P2 [6 u! N1 D; ?" W# p- h5 {. j: [
象a3、b1这类输出内容很多的是被硬件注册的中断向量,而象d1、e3这种输出内容少的是注册为了的HAL内部使用的中断向量和本地APIC中断向量( Q/ h* s2 F5 q1 y9 A2 y7 e
! s# _) l9 N( x
这是几个重要的数组:
6 Z& }4 b2 Z! n! h( f1 y
3 k! `2 I: x0 p3 l* k; sHalVectorToIrql(这个数组是以向量除于16做索引):0 }6 w" r! }/ g
8006a304 00 ff ff 01 02 04 05 06-07 08 09 0a 1b 1c 1d 1e( x/ \! j5 s# J/ j
: q% s5 x; H: H) KHalpIRQLtoTPR:8 s6 ?8 d1 a$ v9 Q4 \2 C
8006a1e4 00 3d 41 41 51 61 71 81-91 a1 b1 b1 b1 b1 b1 b1
5 B' }, p1 @$ H; ^( [ J/ O8006a1f4 b1 b1 b1 b1 b1 b1 b1 b1-b1 b1 b1 c1 d1 e1 ef ff; B; u) C. P, n! b: t% _3 m6 d! Q
W1 {+ u/ t& V8 y1 D# P+ |
HalpINTItoVector:
$ I% u) z# ^$ T# o: @6 j$ y8 M7 H8006ada0 00 b3 61 51 a2 b2 62 91-a1 b1 71 81 52 82 72 92
" J% V5 E+ T7 I9 _/ V, n/ H( Z6 c8006adb0 00 a3 83 93 00 00 00 00-00 00 00 00 00 00 00 00) X6 @" U& r& j+ {
) P7 `7 K. E+ {' c) ~3 y; i
HalVectorToINTI:6 J& W7 i2 Y- C6 t' ]
8006a204 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
' g4 M" S% h9 R( S8006a214 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
: a9 f3 v( `' K8006a224 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
9 J; Z" l4 B; c# Y& O @+ I8006a234 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
! i* [7 A. @! W, O. H8006a244 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
$ w% N( V9 z4 [7 V' w8006a254 ff 03 0c ff ff ff ff ff-ff ff ff ff ff ff ff ff8 n# s% @; p* z3 A
8006a264 ff 02 06 ff ff ff ff ff-ff ff ff ff ff ff ff ff
T4 c7 g3 i, _$ t0 q8006a274 ff 0a 0e ff ff ff ff ff-ff ff ff ff ff ff ff ff
+ C- x" a0 x: u* M1 |; x8006a284 ff 0b 0d 12 ff ff ff ff-ff ff ff ff ff ff ff ff
+ q, L" Q3 a" ^+ r8006a294 ff 07 0f 13 ff ff ff ff-ff ff ff ff ff ff ff ff7 o! J: ]: v# V$ [' B$ C! F8 X+ M
8006a2a4 ff 08 04 11 ff ff ff ff-ff ff ff ff ff ff ff ff2 S& W& `8 Y) ~: Z+ M: X& {& N& i$ D0 O
8006a2b4 ff 09 05 01 ff ff ff ff-ff ff ff ff ff ff ff ff
Y/ a! R# g! I8 m8006a2c4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
3 T4 @: t; g) P- w; X. n; i8 V: F2 R8006a2d4 ff 08 ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
, t# G9 k% J" E7 l3 `" [3 p$ S8006a2e4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff0 ` S' X5 b% T* h
8006a2f4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ' [; L6 j! q) g* n, T
* ^' `! K/ Y, l3 b. W% A U, [( e% V+ t+ I6 u- E% a
vBucket:
4 i- e$ ]0 R$ B8 M; U* @* P1 o/ y8006ae30 02 02 02 03 03 03 03% _0 ~5 J1 A/ I. A
& s( p- f/ B% g. `9 }# O& h$ E
举个例子来说明一下,在我虚拟机里SCSI Controller的IRQ是17(注意,已经大于16了),到重定向表中查找第17项,得到中断向量为0xa3,再看IDT,0xa3对应处理例程是SCSIPORT!ScsiPortInterrupt。
! i1 F7 [) B: V! C: P1 p
$ J* j; b' {6 P( O, r. c& g vBucket数组干啥用的?它就是用来分配新的向量。分配算法很简单,当要分配一个新的向量时,就在vBucket数组从右到左搜索最小的一个数i,该数对应在vBucket中索引为Index,新向量为(0x50+Index*16+i+1),新向量对应的IRQL为(4+i+1),同时会把vBucket中这个i加1,i不等大于16。象给出的这个vBucket,下一次计算时i=2, index=2。不过这些用于硬件的向量在IO系统初始化时调用HalpGetSystemInterruptVector分配好了,然后通过IoConnectInterrupt把IDT中注册的向量位置的例程注册为中断处理程序。这里并不是每个注册的向量都会对应中断处理程序,象上面给出的例子中,0xa1、0xa2、0xb1等向量就没有对应。& \- I( |2 [* U/ ~, r. @9 ^1 M
! @: @6 x; \+ I! J4 l" B
IRQL机制为内核同步提供了很大的便利,既对驱动开发者隐藏了底层中断机制,也方便了驱动开发者的内核同步。LINUX从2.5内核开始引进的软中断和任务队列等机制,很大程度上也来自windows这套机制的借鉴。1 j3 C; `( Y% ~# p0 R
7 P* K. W2 p; Z& h/ ~4 S ] 终于考完试,解放了,呵呵。这个东西其实还有很多可写的,只是没空再深入去分析了。在未来的64位系统里,APIC这种基于中断引脚的机制很快也要被SAPIC这种基于消息的更强大的机制所取代 |
|