|
楼主 |
发表于 2008-2-27 14:35:05
|
显示全部楼层
从IRQ到IRQL(APIC版)
来自:http://www.nsfocus.net/index.php ... o=view&mid=2534$ _8 B8 L/ L2 d2 H# H* ^( ^
* @; P7 a e% v/ T, O从IRQ到IRQL(APIC版)
+ z' V+ W7 n$ i
' V4 O( \& G" \$ F作者:SoBeIt) b8 k2 v4 s, J% E& G. J- c& H/ O
出处:https://www.xfocus.net/bbs/index.php?act=ST&f=2&t=455026 A/ ?! Y/ Y% t* y2 ?( p. h
日期:2005-02-04
3 [" X& D9 b U' C1 b7 v% d. z7 Z7 g% `" y6 Q' o0 }5 g
事实上,老久的PIC在很早以前就被淘汰了,取而代之的是APIC。由于APIC可以兼容PIC,所以在很多单处理器系统上我们看到的PIC实际是APIC的兼容PIC模式。APIC主要应用于多处理器操作系统,是为了解决IRQ太少和处理器间中断而产生的,当然,单处理器操作系统也可以使用APIC(不是模拟PIC)。APIC的HAL和PIC的HAL有很大的不同,很突出的一个特点就是APIC的HAL不用再象PIC的HAL那样虚拟一个中断控制器,IRQL的概念已经可以通过中断向量的形式被APIC支持。事实上,因为被APIC所支持,所以在APIC HAL里IRQL的实现比PIC HAL那样虚拟一个中断控制器要简单得多了。 u2 \. b! d5 G. S% X$ |
& \* M; ~( ]- u$ ] 现在来简单介绍一下APIC的结构(关于APIC详细的描述请参考《IA-32 Inel Architecture Software Developer's Manual Volume 3 Chapter 8》)。整个APIC系统由本地APIC、IO APIC和APIC串行总线组成(在Pentium 4和Xeon以后,APIC总线放到了系统总线中)组成。每个处理器中集成了一个本地APIC,而IO APIC是系统芯片组中一部分,APIC总线负责连接IO APIC和各个本地APIC。本地APIC接收该处理器产生的本地中断比如时钟中断,以及由该处理器产生的处理器间中断,并从APIC串行总线接收来自IO APIC的消息;IO APIC负责接收所有外部的硬件中断,并翻译成消息选择发给接收中断的处理器,以及从本地APIC接收处理器间中断消息。
4 P$ r; p( |* Q5 v
/ {+ |+ y ] k 和PIC一样,控制本地APIC和IO APIC的方法是通过读写该单元中的相关寄存器。不过和PIC不一样的是,Intel把本地APIC和IO APIC的寄存器都映射到了物理地址空间,本地APIC默认映射到物理地址0xffe00000,IO APIC默认映射到物理地址0xfec00000。windows HAL再进一步把本地APIC映射到虚拟地址0xfffe0000,把IO APIC映射到虚拟地址0xffd06000,也就是说对该地址的读写实际就是对寄存器的读写,本地APIC里几个重要的寄存有EOI寄存器,任务优先级寄存器(TPR),处理器优先级寄存器(PPR),中断命令寄存器(ICR,64位),中断请求寄存器(IRR,256位,对应每个向量一位),中断在服务寄存器(ISR,256位)等。IO APIC里几个重要的寄存器有版本寄存器,I/O寄存器选择寄存器、I/O窗口寄存器(用要访问的I/O APIC寄存器的索引设置地址I/O寄存器选择寄存器,此时访问I/O窗口寄存器就是访问被选定的寄存器)还有很重要的是一个IO重定向表,每一个表项是一个64位寄存器,包括向量和目标模式、传输模式等相关位,每一个表项连接一条IRQ线,表项的数目随处理器的版本而不一样,在Pentium 4上为24个表项。表项的数目保存在IO APIC版本寄存器的[16:23]位。APIC系统支持255个中断向量,但Intel保留了0-15向量,可用的向量是16-255。并引进一个概念叫做任务优先级=中断向量/16,因为保留了16个向量,所以可用的优先级是2-15。当用一个指定的优先级设置本地APIC中的任务优先级寄存器TPR后,所有优先级低于TPR中优先级的中断都被屏蔽,是不是很象IRQL的机制?事实上,APIC HAL里的IRQL机制也就是靠着这个任务优先级寄存器得以实现。同一个任务优先级包括了16个中断向量,可以进一步细粒度地区分中断的优先级。
) g" `, I( T2 s/ f; ?" S4 V: V# p8 h% I( }: x* r
在HAL里虽然HalBeginSystemInterrupt仍然是IRQL机制的发动引擎,但是因为有APIC的支持,它和其它共同实现IRQL的函数要比PIC HAL里对应的函数功能简单得多。HalBeginSystemInterrupt通过用IRQL做索引在HalpIRQLtoTPR数组中获取该IRQL对应的任务优先级,用该优先级设置任务优先级寄存器TPR,并把TPR中原先的任务优先级/16做为索引在HalpVectorToIRQL数组中获取对应的原先的IRQL然后返回。若IRQL是从低于DISPATCH_LEVEL提升到高于DISPATCH_LEVEL,还需要设置KPCR+0x95(0xffdff095)为DISPATCH_LEVEL(0x2),表示是从DISPATCH_LEVEL以下的级别提升IRQL。HalEndSystemInterrupt向本地APIC的EOI寄存发送0,表示中断结束,可以接收新中断。并还要判断要降到的IRQL是否小于DISPATCH_LEVEL,若小于则进一步判断KPCR+0x96(0xffdff096)是否置位,若置位则表示有DPC中断在等待(在IRQL高于DISPATCH_LEVEL被引发,然后等待直到IRQL降到低于DISPATCH_LEVEL),则将KPCR+0x95和KPCR+0x96清0后调用KiDispatchInterrupt响应DPC软中断。否则做的工作就是和HalBeginSystemInterrupt一样的过程:把要降到的IRQL转换成任务优先级设置TRP,并把久的任务优先级转成IRQL返回。KfRaiseIrql、KfLowerIrql之类的函数也是这么一回事,把当前IRQL转成任务优先级修改TPR,并把原先TPR的值转成原先的IRQL并返回。而现在软中断的产生也有了APIC支持,APIC通过产生一个发向自己的处理器间中断,就可以产生一个软中断,因为可以指定该中断的向量,所以软中断就可以区分优先级别,如APC_LEVEL、DISPATCH_LEVEL。产生软中断的函数一样还是HalRequestSoftwareInterrupt,该函数会先判断KPCR+0x95是否和要产生的软中断IRQL一样,若是的话则置位KPCR+0x96并返回,表示现在IRQL大于DISPATCH_LEVEL所以不处理DPC中断。否则以要产生的软中断的IRQL为索引从HalpIRQLtoTPRHAL取出对应任务优先级,并或上0x4000,表示是发向自身的固定处理间中断,并用该值设置中断命令寄存器ICW的低32位,然后读取中断命令寄存器ICW的低32位是否为0x1000,确定中断消息已经发送后就返回,这时候软中断已经产生。值得注意的是APIC HAL里没有HalEndSoftwareInterrupt这个函数。HAL为软中断的IRQL提供了一个固定的中断向量:! a: p+ [0 |1 f
4 f8 t1 m) w' ]5 ^( q/ K, B8 r+ {
#define ZERO_VECTOR 0x00 // IRQL 00
- l5 @9 _- H+ d' H#define APC_VECTOR 0x3D // IRQL 01
( h* ?+ L- a: J$ k9 F+ }#define DPC_VECTOR 0x41 // IRQL 02: k7 X, K' W" p9 j5 w) {
#define APIC_GENERIC_VECTOR 0xC1 // IRQL 27
. o7 N" @) M$ s* J4 O#define APIC_CLOCK_VECTOR 0xD1 // IRQL 287 G2 d; ]" S6 g- Z" w
#define APIC_SYNCH_VECTOR 0xD1 // IRQL 28+ j0 T4 s% T% W8 W. R9 k( ~4 e
#define APIC_IPI_VECTOR 0xE1 // IRQL 29
% e7 R b1 I$ k0 s8 G- k) v#define POWERFAIL_VECTOR 0xEF // IRQL 30
4 y; T* A, u. J#define APIC_PROFILE_VECTOR 0xFD // IRQL 31
! g" ~) A- L. d( ]' u4 ~% {4 ?+ z0 }7 q0 N$ L/ E! N9 C
' S4 H6 O9 B% I& e, \) p" m
现在看一下一些重要的数据:- {3 ]' \- c3 Z' f' y
6 d5 v- S2 ?9 n6 _3 Q2 l
这是我写的代码输出的IO APIC重定向表内容:
* q. h( p1 [/ a' X
1 p4 N$ x7 c" y& aRedirect Table Index: 0x17
5 n3 w0 o, m/ T1 h" RRedirect Table[ 0]: ff7 J! U5 [! |* O: Y0 n5 I+ V' J
Redirect Table[ 1]: b3
, ^6 [" ? Q% C) dRedirect Table[ 2]: ff2 Y, `! f3 G# H1 ?! G
Redirect Table[ 3]: 51
1 B( z8 t$ I0 U% v' gRedirect Table[ 4]: ff
5 [# k- f( A! e) M `+ xRedirect Table[ 5]: ff
6 W% A! }1 E& q( E( PRedirect Table[ 6]: 62, `% c3 q7 C; Q: Z/ |! V' g
Redirect Table[ 7]: ff
. L' r, z9 l! f2 k/ `! KRedirect Table[ 8]: d1
. w0 t$ M9 s) E) y2 JRedirect Table[ 9]: b1( A6 I! U1 ^6 ]
Redirect Table[ a]: ff" H3 U3 {+ r ^: @0 d
Redirect Table[ b]: ff
2 G B4 I2 ?) _" c5 lRedirect Table[ c]: 52
& l) I' d8 {" z3 X7 G5 f, R' _Redirect Table[ d]: ff( Y- V. h' t6 ?+ y% J
Redirect Table[ e]: ff
- L9 W. L) S6 s$ T; bRedirect Table[ f]: 926 z% ~& U6 S- h& E) u" H+ ?
Redirect Table[10]: ff* z; X" w2 z, k# n
Redirect Table[11]: a3
: \7 h7 I5 @ B9 g& l5 A8 i2 N8 [Redirect Table[12]: 83: r+ w5 ~! Y. P$ }9 f/ c
Redirect Table[13]: 93- O0 L1 }0 N+ R& E9 F
Redirect Table[14]: ff
# {6 v8 W7 S6 i% t" X! `# \4 L- G# ]% gRedirect Table[15]: ff
3 M- I6 U4 ~/ F; s& KRedirect Table[16]: ff, d6 L0 U$ a% `3 L7 v
Redirect Table[17]: ff) d* p6 m+ k% z* s% H B2 _* i3 U' p
; v8 U: j/ @$ l% Y
这是IDT表中被注册的向量:
: @; A0 @# o5 S8 [8 U. [+ ]6 o) |+ d- {7 U
1f: 80064908 (hal!HalpApicSpuriousService); [+ O2 d" o* _6 O+ u+ V4 P) x
37: 800640b8 (hal!PicSpuriousService37)
! b0 J1 P; |+ k, v8 D" O" T" S3d: 80065254 (hal!HalpApcInterrupt)% T0 D! G4 F) U. N, ^; Q$ d
41: 800650c8 (hal!HalpDispatchInterrupt)2 t% _& [1 i' D* T3 k, A' u$ w
50: 80064190 (hal!HalpApicRebootService)
8 ^5 U, u a) \3 d& m! `; s51: 817f59e4. ~# U' N1 n7 r6 \& @0 v
(Vector:51,Irql:4,SyncIrql:4,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:serial!SerialCIsrSw(f3c607c7)); M( [- X# I2 f" c3 ]6 _1 p m9 A
52: 817f5044
9 Z: w! |4 f# g5 z6 O/ _; U- w(Vector:52,Irql:4,SyncIrql:a,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:i8042prt!I8042MouseInterruptService(f3c57a2c))6 `% W; Q" x0 t% p3 x
83: 817d2d44
2 U, [3 }& P: E5 J3 n" b(Vector:83,Irql:7,SyncIrql:7,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:NDIS!ndisMIsr(bff1b794))' v/ R$ Q- _' P
92: 81821384
7 R; M/ l8 W2 Z) m, P(Vector:92,Irql:8,SyncIrql:8,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:atapi!ScsiPortInterrupt(bff892be)), ^& V* }# S/ ?( f* F
93: 8185ed64
, }0 E( M. Q7 t9 W% N7 D(Vector:93,Irql:8,SyncIrql:8,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:uhcd!UHCD_InterruptService(f3f0253e))
; {! d* a# m2 k- B9 fa3: 8186cdc4 , C6 ]1 m- ^( `3 v! c. K B, V" O
(Vector:a3,Irql:9,SyncIrql:9,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:SCSIPORT!ScsiPortInterrupt(bff719f0)). w E/ G8 s. S3 N& _7 G
b1: 818902e4 % R! p, q& R) t. K: @
(Vector:b1,Irql:a,SyncIrql:a,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:ACPI!ACPIInterruptServiceRoutine(bffe14b4))
$ S/ w# k" n: a- b- L9 J! [b3: 81881664 & I) I6 j4 L- W4 |" Y0 d0 z
(Vector:b3,Irql:a,SyncIrql:a,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:i8042prt!I8042KeyboardInterruptService(f3c51918))* s* |3 o; H& ?) j4 L a5 z
c1: 800642fc (hal!HalpBroadcastCallService)/ d4 \0 N6 G- b+ Z: M9 \: N
d1: 80063964 (hal!HalpClockInterrupt)
, x- h/ z. O1 n. s* M- K0 [4 i+ ^e1: 80064858 (hal!HalpIpiHandler)
3 {& K9 \& ?/ }( D2 _e3: 800645d4 (hal!HalpLocalApicErrorService)
4 D6 ?$ p3 l. C' c2 @fd: 80064d64 (hal!HalpProfileInterrupt). N- F& m w2 K" ]( |* V
fe: 80064eec (hal!HalpPerfInterrupt)1 ?6 j; Y5 M J3 O8 x
7 L9 ]6 r# a0 V$ q7 P; [1 n1 K m
象a3、b1这类输出内容很多的是被硬件注册的中断向量,而象d1、e3这种输出内容少的是注册为了的HAL内部使用的中断向量和本地APIC中断向量
! A! v2 k. q9 n! X$ u0 M, }# U3 ]1 k9 {; E$ P/ S4 j* m1 q
这是几个重要的数组:( X+ @+ [8 @. M
8 h$ W H& a) h6 Z2 @1 w
HalVectorToIrql(这个数组是以向量除于16做索引):: t) V) c6 A( Z/ J' V4 V( X T
8006a304 00 ff ff 01 02 04 05 06-07 08 09 0a 1b 1c 1d 1e _6 r2 C1 U( M7 D
" b/ F4 B* L L J" p
HalpIRQLtoTPR:. }* E. ?1 A* `) q% s8 \, `
8006a1e4 00 3d 41 41 51 61 71 81-91 a1 b1 b1 b1 b1 b1 b1
7 c: A2 R9 |1 i! s& L1 U- j0 c T8006a1f4 b1 b1 b1 b1 b1 b1 b1 b1-b1 b1 b1 c1 d1 e1 ef ff
% s) c. B& {( T! r) e5 u8 i V) j9 a: M6 I* t* ?6 T
HalpINTItoVector:; E1 ?- E" {# j. n- b/ s, U/ U
8006ada0 00 b3 61 51 a2 b2 62 91-a1 b1 71 81 52 82 72 92) B8 t9 v! i5 T# p% E9 G
8006adb0 00 a3 83 93 00 00 00 00-00 00 00 00 00 00 00 002 _; h6 Y# z) E9 j
+ m4 u$ O) E$ _$ h2 S" n4 O% o
HalVectorToINTI:
( ^: I1 z/ g |1 _. E8006a204 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
7 X* ^) U& _6 a4 U- s: Q0 p8006a214 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
, x# G6 i. R: a9 j/ p8006a224 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
. [; `" v. k0 k- W m; J" `8006a234 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
' n+ O7 T) @& I; Z- A2 M8 C6 Y8006a244 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
$ O3 l1 N; y+ u6 t6 \/ R, v8006a254 ff 03 0c ff ff ff ff ff-ff ff ff ff ff ff ff ff
% o! U9 s1 Z/ I8006a264 ff 02 06 ff ff ff ff ff-ff ff ff ff ff ff ff ff
8 l d5 w" K% j9 ?0 \4 V8006a274 ff 0a 0e ff ff ff ff ff-ff ff ff ff ff ff ff ff2 a( M4 W2 I3 Y& k; a
8006a284 ff 0b 0d 12 ff ff ff ff-ff ff ff ff ff ff ff ff
' b; l6 d/ f: F) d( y0 @. {8 k6 C3 u8006a294 ff 07 0f 13 ff ff ff ff-ff ff ff ff ff ff ff ff: J) i/ P" I/ p8 N) O9 t/ ^9 r4 S
8006a2a4 ff 08 04 11 ff ff ff ff-ff ff ff ff ff ff ff ff
) t \7 _( ?9 a* e3 b% U8006a2b4 ff 09 05 01 ff ff ff ff-ff ff ff ff ff ff ff ff
1 k7 q+ } B% c/ m8006a2c4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff/ N6 D& |! L2 m. l( S
8006a2d4 ff 08 ff ff ff ff ff ff-ff ff ff ff ff ff ff ff" i3 r" _" X0 T+ X
8006a2e4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff/ l+ E3 h! Y* D) N. e& I: y
8006a2f4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff & V0 e/ b" I( p. N( `" M
9 D# e& C" c6 s. i5 Z: V
) G/ E/ O: b4 X: W2 a% S5 RvBucket:
4 _& U/ a3 s% i: g% B8006ae30 02 02 02 03 03 03 03
3 g: f+ v& Y# b) v B1 K- K5 e( @- G& S% B- w0 H) B
举个例子来说明一下,在我虚拟机里SCSI Controller的IRQ是17(注意,已经大于16了),到重定向表中查找第17项,得到中断向量为0xa3,再看IDT,0xa3对应处理例程是SCSIPORT!ScsiPortInterrupt。" Y. v8 u6 Q; u1 A! G
& P( _! J H2 D; w vBucket数组干啥用的?它就是用来分配新的向量。分配算法很简单,当要分配一个新的向量时,就在vBucket数组从右到左搜索最小的一个数i,该数对应在vBucket中索引为Index,新向量为(0x50+Index*16+i+1),新向量对应的IRQL为(4+i+1),同时会把vBucket中这个i加1,i不等大于16。象给出的这个vBucket,下一次计算时i=2, index=2。不过这些用于硬件的向量在IO系统初始化时调用HalpGetSystemInterruptVector分配好了,然后通过IoConnectInterrupt把IDT中注册的向量位置的例程注册为中断处理程序。这里并不是每个注册的向量都会对应中断处理程序,象上面给出的例子中,0xa1、0xa2、0xb1等向量就没有对应。2 M2 ~+ ~, u* I" d. P
$ O9 |0 ~% ^ Y% q2 l% E' l
IRQL机制为内核同步提供了很大的便利,既对驱动开发者隐藏了底层中断机制,也方便了驱动开发者的内核同步。LINUX从2.5内核开始引进的软中断和任务队列等机制,很大程度上也来自windows这套机制的借鉴。) u5 K' W. L# ^
3 u1 W6 R- [7 @5 t- M: j( h3 H$ J e
终于考完试,解放了,呵呵。这个东西其实还有很多可写的,只是没空再深入去分析了。在未来的64位系统里,APIC这种基于中断引脚的机制很快也要被SAPIC这种基于消息的更强大的机制所取代 |
|