|
|
楼主 |
发表于 2008-2-27 14:35:05
|
显示全部楼层
从IRQ到IRQL(APIC版)
来自:http://www.nsfocus.net/index.php ... o=view&mid=2534
, `4 \! N/ H1 W
8 Q- d8 G% R7 w1 ^& ^/ r. e9 ~5 i从IRQ到IRQL(APIC版): A1 j! e& m8 `6 S; n
$ F5 T% L7 L0 I' @
作者:SoBeIt2 U) X- U7 e. O
出处:https://www.xfocus.net/bbs/index.php?act=ST&f=2&t=45502# {4 X: H4 I$ E, y/ U) j
日期:2005-02-04
) y# H. {$ t* x2 v* g
, _3 n6 J! _6 A+ V事实上,老久的PIC在很早以前就被淘汰了,取而代之的是APIC。由于APIC可以兼容PIC,所以在很多单处理器系统上我们看到的PIC实际是APIC的兼容PIC模式。APIC主要应用于多处理器操作系统,是为了解决IRQ太少和处理器间中断而产生的,当然,单处理器操作系统也可以使用APIC(不是模拟PIC)。APIC的HAL和PIC的HAL有很大的不同,很突出的一个特点就是APIC的HAL不用再象PIC的HAL那样虚拟一个中断控制器,IRQL的概念已经可以通过中断向量的形式被APIC支持。事实上,因为被APIC所支持,所以在APIC HAL里IRQL的实现比PIC HAL那样虚拟一个中断控制器要简单得多了。
+ m) R% b T1 W
. I% m' r# n( V' K 现在来简单介绍一下APIC的结构(关于APIC详细的描述请参考《IA-32 Inel Architecture Software Developer's Manual Volume 3 Chapter 8》)。整个APIC系统由本地APIC、IO APIC和APIC串行总线组成(在Pentium 4和Xeon以后,APIC总线放到了系统总线中)组成。每个处理器中集成了一个本地APIC,而IO APIC是系统芯片组中一部分,APIC总线负责连接IO APIC和各个本地APIC。本地APIC接收该处理器产生的本地中断比如时钟中断,以及由该处理器产生的处理器间中断,并从APIC串行总线接收来自IO APIC的消息;IO APIC负责接收所有外部的硬件中断,并翻译成消息选择发给接收中断的处理器,以及从本地APIC接收处理器间中断消息。
9 P* L$ Z. X) T; e7 R( @
9 D' f5 x8 q3 ~3 w. C! X) Q 和PIC一样,控制本地APIC和IO APIC的方法是通过读写该单元中的相关寄存器。不过和PIC不一样的是,Intel把本地APIC和IO APIC的寄存器都映射到了物理地址空间,本地APIC默认映射到物理地址0xffe00000,IO APIC默认映射到物理地址0xfec00000。windows HAL再进一步把本地APIC映射到虚拟地址0xfffe0000,把IO APIC映射到虚拟地址0xffd06000,也就是说对该地址的读写实际就是对寄存器的读写,本地APIC里几个重要的寄存有EOI寄存器,任务优先级寄存器(TPR),处理器优先级寄存器(PPR),中断命令寄存器(ICR,64位),中断请求寄存器(IRR,256位,对应每个向量一位),中断在服务寄存器(ISR,256位)等。IO APIC里几个重要的寄存器有版本寄存器,I/O寄存器选择寄存器、I/O窗口寄存器(用要访问的I/O APIC寄存器的索引设置地址I/O寄存器选择寄存器,此时访问I/O窗口寄存器就是访问被选定的寄存器)还有很重要的是一个IO重定向表,每一个表项是一个64位寄存器,包括向量和目标模式、传输模式等相关位,每一个表项连接一条IRQ线,表项的数目随处理器的版本而不一样,在Pentium 4上为24个表项。表项的数目保存在IO APIC版本寄存器的[16:23]位。APIC系统支持255个中断向量,但Intel保留了0-15向量,可用的向量是16-255。并引进一个概念叫做任务优先级=中断向量/16,因为保留了16个向量,所以可用的优先级是2-15。当用一个指定的优先级设置本地APIC中的任务优先级寄存器TPR后,所有优先级低于TPR中优先级的中断都被屏蔽,是不是很象IRQL的机制?事实上,APIC HAL里的IRQL机制也就是靠着这个任务优先级寄存器得以实现。同一个任务优先级包括了16个中断向量,可以进一步细粒度地区分中断的优先级。
. A$ u, d, K1 ]
! ? A$ L( ^; A; V i 在HAL里虽然HalBeginSystemInterrupt仍然是IRQL机制的发动引擎,但是因为有APIC的支持,它和其它共同实现IRQL的函数要比PIC HAL里对应的函数功能简单得多。HalBeginSystemInterrupt通过用IRQL做索引在HalpIRQLtoTPR数组中获取该IRQL对应的任务优先级,用该优先级设置任务优先级寄存器TPR,并把TPR中原先的任务优先级/16做为索引在HalpVectorToIRQL数组中获取对应的原先的IRQL然后返回。若IRQL是从低于DISPATCH_LEVEL提升到高于DISPATCH_LEVEL,还需要设置KPCR+0x95(0xffdff095)为DISPATCH_LEVEL(0x2),表示是从DISPATCH_LEVEL以下的级别提升IRQL。HalEndSystemInterrupt向本地APIC的EOI寄存发送0,表示中断结束,可以接收新中断。并还要判断要降到的IRQL是否小于DISPATCH_LEVEL,若小于则进一步判断KPCR+0x96(0xffdff096)是否置位,若置位则表示有DPC中断在等待(在IRQL高于DISPATCH_LEVEL被引发,然后等待直到IRQL降到低于DISPATCH_LEVEL),则将KPCR+0x95和KPCR+0x96清0后调用KiDispatchInterrupt响应DPC软中断。否则做的工作就是和HalBeginSystemInterrupt一样的过程:把要降到的IRQL转换成任务优先级设置TRP,并把久的任务优先级转成IRQL返回。KfRaiseIrql、KfLowerIrql之类的函数也是这么一回事,把当前IRQL转成任务优先级修改TPR,并把原先TPR的值转成原先的IRQL并返回。而现在软中断的产生也有了APIC支持,APIC通过产生一个发向自己的处理器间中断,就可以产生一个软中断,因为可以指定该中断的向量,所以软中断就可以区分优先级别,如APC_LEVEL、DISPATCH_LEVEL。产生软中断的函数一样还是HalRequestSoftwareInterrupt,该函数会先判断KPCR+0x95是否和要产生的软中断IRQL一样,若是的话则置位KPCR+0x96并返回,表示现在IRQL大于DISPATCH_LEVEL所以不处理DPC中断。否则以要产生的软中断的IRQL为索引从HalpIRQLtoTPRHAL取出对应任务优先级,并或上0x4000,表示是发向自身的固定处理间中断,并用该值设置中断命令寄存器ICW的低32位,然后读取中断命令寄存器ICW的低32位是否为0x1000,确定中断消息已经发送后就返回,这时候软中断已经产生。值得注意的是APIC HAL里没有HalEndSoftwareInterrupt这个函数。HAL为软中断的IRQL提供了一个固定的中断向量:8 {' Q# O7 o" w; D: |9 G
" m: K1 b' V @4 }
#define ZERO_VECTOR 0x00 // IRQL 00 5 t/ X2 P. G( X5 w: D/ |
#define APC_VECTOR 0x3D // IRQL 01
1 A3 _9 H0 ?; @0 A1 m#define DPC_VECTOR 0x41 // IRQL 02# M% ~5 T$ X6 B. G5 T7 ^( }- A* Y/ u9 d
#define APIC_GENERIC_VECTOR 0xC1 // IRQL 27
6 `& T1 H0 _$ `, D#define APIC_CLOCK_VECTOR 0xD1 // IRQL 28/ G: u4 t0 t( g
#define APIC_SYNCH_VECTOR 0xD1 // IRQL 280 k( D' D- x. ]
#define APIC_IPI_VECTOR 0xE1 // IRQL 29
* D, P0 R3 q3 v0 t) Y: Z3 l. U) D#define POWERFAIL_VECTOR 0xEF // IRQL 30. T! d Z# K5 j& ?/ k
#define APIC_PROFILE_VECTOR 0xFD // IRQL 31, R8 c& X) E: P1 |1 m# ?- W7 h
; h% N: Y8 c3 c! z: }, c+ L& {! {8 q. v* X
现在看一下一些重要的数据:
O, P! e7 A0 o7 ]4 C3 q8 \! ]6 v+ w6 B; u; y4 p, s
这是我写的代码输出的IO APIC重定向表内容:
; N, e- ]) R) M( T9 O; _6 d- H6 ]7 o @/ R# x" a
Redirect Table Index: 0x17
, o& @% u4 s+ f: ]5 YRedirect Table[ 0]: ff
1 a$ W- T; G. ~ n5 nRedirect Table[ 1]: b3' N3 V. }* T: N! l9 z, K
Redirect Table[ 2]: ff$ h% Q- ~% n F3 K
Redirect Table[ 3]: 51
" E0 n/ P q" [! B. j) r3 z* kRedirect Table[ 4]: ff
( @9 T! E; D$ PRedirect Table[ 5]: ff
6 Y+ |6 Z9 w2 k1 t& QRedirect Table[ 6]: 62% s9 J- Q8 q+ O3 B! L! @. h5 N' f
Redirect Table[ 7]: ff% C* Z% C) @, n: y( s
Redirect Table[ 8]: d1$ X3 l5 @- M( w
Redirect Table[ 9]: b1 A3 [: e5 L6 g% ^( S, A! n
Redirect Table[ a]: ff
- C/ ]0 g+ I& {6 v: k* m* O3 s3 V* `Redirect Table[ b]: ff; `4 q4 H$ e( g/ Z8 ^4 T
Redirect Table[ c]: 520 {) v7 p4 O6 K7 m1 p% F
Redirect Table[ d]: ff3 x- R$ ^8 ?6 h% b# P8 Z# f
Redirect Table[ e]: ff
) A$ p. x6 ]* G. Z& P& V, x# @Redirect Table[ f]: 926 ?/ S& O3 V/ T* n, T. C, q
Redirect Table[10]: ff) ]. q& | c6 A; A: ?- T
Redirect Table[11]: a3
: |' g J8 z- z6 G) w, E6 FRedirect Table[12]: 834 R# i- H* u6 M1 R
Redirect Table[13]: 93
9 x/ G; \" G$ l7 Z" {Redirect Table[14]: ff! Q% H* x2 ^! ~& R: v* y
Redirect Table[15]: ff
4 Y6 ^4 o9 I# k8 s8 n' dRedirect Table[16]: ff
% p7 Q# Y u4 U1 f" nRedirect Table[17]: ff2 h) I- A: z( q' D# q* X: ]
: F6 [+ V* r0 E0 ^: u9 Q这是IDT表中被注册的向量:6 y4 i& ]) v$ j
. E& Y/ z7 H- u1 r' r& E
1f: 80064908 (hal!HalpApicSpuriousService)
5 r: c [7 V, l; y/ t$ O* j! ?37: 800640b8 (hal!PicSpuriousService37)
; o% h% B z# G* X) ]* |. n3d: 80065254 (hal!HalpApcInterrupt)% H. \& m F/ D9 ]1 {+ D; W" j
41: 800650c8 (hal!HalpDispatchInterrupt)
L& A2 V$ s9 D+ h50: 80064190 (hal!HalpApicRebootService)
2 T: p' s9 q& Z- u7 ^51: 817f59e46 B6 q" ]; ~. ?0 s/ i3 e6 x6 H
(Vector:51,Irql:4,SyncIrql:4,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:serial!SerialCIsrSw(f3c607c7))* A3 u) k2 d- l9 U" N
52: 817f5044
9 a- C+ Y; L/ S( b8 A! _1 c* m3 ?(Vector:52,Irql:4,SyncIrql:a,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:i8042prt!I8042MouseInterruptService(f3c57a2c))' u- h& a8 D$ z ?* u3 x- y, a
83: 817d2d44
4 {; g3 T* T3 W& b5 d(Vector:83,Irql:7,SyncIrql:7,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:NDIS!ndisMIsr(bff1b794))( R- I; [- P7 c# A8 N
92: 81821384 : J5 i5 o/ w5 {# e7 L2 V% x
(Vector:92,Irql:8,SyncIrql:8,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:atapi!ScsiPortInterrupt(bff892be))- r+ o$ v+ G/ q# T1 v3 ]
93: 8185ed64
5 _, v4 J* \0 l9 ~(Vector:93,Irql:8,SyncIrql:8,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:uhcd!UHCD_InterruptService(f3f0253e))9 }2 X5 [; @ H' |' ~
a3: 8186cdc4 * S* W$ X1 [$ H( ?
(Vector:a3,Irql:9,SyncIrql:9,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:SCSIPORT!ScsiPortInterrupt(bff719f0))8 O& L G2 K J& w9 _( @) D
b1: 818902e4 1 o, P( v& x7 }& @. ^% @3 O4 p
(Vector:b1,Irql:a,SyncIrql:a,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:ACPI!ACPIInterruptServiceRoutine(bffe14b4))
9 E$ }2 d1 `- Z/ O* m) L7 Tb3: 81881664
3 v" G# _0 M& G/ f(Vector:b3,Irql:a,SyncIrql:a,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:i8042prt!I8042KeyboardInterruptService(f3c51918))
1 E$ |7 V4 r2 [. ^& i9 i: y tc1: 800642fc (hal!HalpBroadcastCallService)1 Q7 \4 y/ r/ ]5 |" ]) F5 n
d1: 80063964 (hal!HalpClockInterrupt)- F0 G! x% ? j2 ~) B6 I2 p
e1: 80064858 (hal!HalpIpiHandler)
5 x7 O5 n0 I" N' `5 F) x# `9 f- fe3: 800645d4 (hal!HalpLocalApicErrorService)* g4 k( t( ?; P% ]( \( l1 ] G
fd: 80064d64 (hal!HalpProfileInterrupt): M2 Q7 d( C6 j
fe: 80064eec (hal!HalpPerfInterrupt)
* ~) F6 t& P4 d6 J$ h2 S/ f. F
0 Q" ~9 b1 O/ s象a3、b1这类输出内容很多的是被硬件注册的中断向量,而象d1、e3这种输出内容少的是注册为了的HAL内部使用的中断向量和本地APIC中断向量
8 o5 N) } J- g2 G
2 \. _/ r c3 _" C; e这是几个重要的数组:
5 V- t8 S/ N; J$ e I2 V# o& e
9 g3 E- _9 U2 x% k4 f M- u+ CHalVectorToIrql(这个数组是以向量除于16做索引):, J6 }3 ^+ B5 \/ z! {% h
8006a304 00 ff ff 01 02 04 05 06-07 08 09 0a 1b 1c 1d 1e E1 s' S2 z9 M: I
" ]6 B$ L, X) r. t( B" L2 _& A7 O
HalpIRQLtoTPR:9 t3 F- i* U1 o# _% O
8006a1e4 00 3d 41 41 51 61 71 81-91 a1 b1 b1 b1 b1 b1 b1
/ S8 W% N; N) ]( \: Z- G! a! \# c8006a1f4 b1 b1 b1 b1 b1 b1 b1 b1-b1 b1 b1 c1 d1 e1 ef ff
) r! f9 ?4 E6 M# d3 J6 @7 Q0 I$ n: o" }5 q
HalpINTItoVector:
6 G4 ?7 M0 N% U+ U8006ada0 00 b3 61 51 a2 b2 62 91-a1 b1 71 81 52 82 72 92
' o2 z3 n) P( F* e7 v5 X2 \. @8006adb0 00 a3 83 93 00 00 00 00-00 00 00 00 00 00 00 008 R- o9 Z& c3 t @" p/ i
, ]% a; O }; B4 P2 v
HalVectorToINTI:
1 Y# z7 k1 g5 S6 f8006a204 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff2 `$ U- {/ n+ Y) Y2 i7 F
8006a214 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
! |! E& [6 }4 x' T' m8006a224 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
+ s0 z! G) m4 e6 M; z0 e: W( M8006a234 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff6 F6 i4 J; j1 X
8006a244 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff1 h, O8 @! i- k, u
8006a254 ff 03 0c ff ff ff ff ff-ff ff ff ff ff ff ff ff# I5 e, K$ ?8 f* O
8006a264 ff 02 06 ff ff ff ff ff-ff ff ff ff ff ff ff ff
! T3 L: d" C3 d0 |% N/ o% V4 Y3 t8006a274 ff 0a 0e ff ff ff ff ff-ff ff ff ff ff ff ff ff
6 ?8 J! f% N, K5 i) Y. f8006a284 ff 0b 0d 12 ff ff ff ff-ff ff ff ff ff ff ff ff9 E8 e4 U: j8 X& C' h& J
8006a294 ff 07 0f 13 ff ff ff ff-ff ff ff ff ff ff ff ff& j# T, W) {* Y8 f( J
8006a2a4 ff 08 04 11 ff ff ff ff-ff ff ff ff ff ff ff ff
" a7 M8 h0 I: L8 b; a& ?" P8006a2b4 ff 09 05 01 ff ff ff ff-ff ff ff ff ff ff ff ff
' F/ x& t, G8 y% m; b8006a2c4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff' {- [! f* m6 ?9 s4 K- P
8006a2d4 ff 08 ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
. V C" N, V; H8 R, p: C8006a2e4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
% m* i( B3 d0 C D, A. F! |2 G, Y8006a2f4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff
- A0 n; P, o# h% Q9 D
& o9 o; `) m; i1 |
' Q# y% a6 y" g0 {8 xvBucket:2 J. E3 k1 q% [( I) a
8006ae30 02 02 02 03 03 03 03+ H! |& l$ r1 U; D' t" r
5 e5 m0 K/ e9 F& s
举个例子来说明一下,在我虚拟机里SCSI Controller的IRQ是17(注意,已经大于16了),到重定向表中查找第17项,得到中断向量为0xa3,再看IDT,0xa3对应处理例程是SCSIPORT!ScsiPortInterrupt。% O, l' O( i8 B3 R4 c
( u: j: ?; }" Y! T7 I
vBucket数组干啥用的?它就是用来分配新的向量。分配算法很简单,当要分配一个新的向量时,就在vBucket数组从右到左搜索最小的一个数i,该数对应在vBucket中索引为Index,新向量为(0x50+Index*16+i+1),新向量对应的IRQL为(4+i+1),同时会把vBucket中这个i加1,i不等大于16。象给出的这个vBucket,下一次计算时i=2, index=2。不过这些用于硬件的向量在IO系统初始化时调用HalpGetSystemInterruptVector分配好了,然后通过IoConnectInterrupt把IDT中注册的向量位置的例程注册为中断处理程序。这里并不是每个注册的向量都会对应中断处理程序,象上面给出的例子中,0xa1、0xa2、0xb1等向量就没有对应。 [9 a* n% w2 v
* J) z' o+ v6 i1 u9 W IRQL机制为内核同步提供了很大的便利,既对驱动开发者隐藏了底层中断机制,也方便了驱动开发者的内核同步。LINUX从2.5内核开始引进的软中断和任务队列等机制,很大程度上也来自windows这套机制的借鉴。- v& j3 [7 y' z0 O& d9 i7 g$ K1 |
, `& D3 g S/ Q1 P: S* P7 J1 z3 Z 终于考完试,解放了,呵呵。这个东西其实还有很多可写的,只是没空再深入去分析了。在未来的64位系统里,APIC这种基于中断引脚的机制很快也要被SAPIC这种基于消息的更强大的机制所取代 |
|