|
|
楼主 |
发表于 2008-2-27 14:35:05
|
显示全部楼层
从IRQ到IRQL(APIC版)
来自:http://www.nsfocus.net/index.php ... o=view&mid=2534
; L, _* h# \, |8 \$ t, c8 Z+ M% o3 K& z/ |$ _/ R' P2 l5 K
从IRQ到IRQL(APIC版) B r) [# f/ ]- o( g1 A4 h) R
5 f: Q9 L+ i' _1 n4 F$ w' j作者:SoBeIt
( i R; K$ P& Z, m( J2 Z2 h出处:https://www.xfocus.net/bbs/index.php?act=ST&f=2&t=45502" E) g6 T9 O: }1 I9 L1 s# s
日期:2005-02-04
, U/ y _; p4 o! O5 y1 g6 c$ i6 ~; y8 I6 T
事实上,老久的PIC在很早以前就被淘汰了,取而代之的是APIC。由于APIC可以兼容PIC,所以在很多单处理器系统上我们看到的PIC实际是APIC的兼容PIC模式。APIC主要应用于多处理器操作系统,是为了解决IRQ太少和处理器间中断而产生的,当然,单处理器操作系统也可以使用APIC(不是模拟PIC)。APIC的HAL和PIC的HAL有很大的不同,很突出的一个特点就是APIC的HAL不用再象PIC的HAL那样虚拟一个中断控制器,IRQL的概念已经可以通过中断向量的形式被APIC支持。事实上,因为被APIC所支持,所以在APIC HAL里IRQL的实现比PIC HAL那样虚拟一个中断控制器要简单得多了。
& m0 q X& c+ f6 i1 g- ]) ?6 K* Q6 R$ {: x1 P: q( Q2 m$ [2 c
现在来简单介绍一下APIC的结构(关于APIC详细的描述请参考《IA-32 Inel Architecture Software Developer's Manual Volume 3 Chapter 8》)。整个APIC系统由本地APIC、IO APIC和APIC串行总线组成(在Pentium 4和Xeon以后,APIC总线放到了系统总线中)组成。每个处理器中集成了一个本地APIC,而IO APIC是系统芯片组中一部分,APIC总线负责连接IO APIC和各个本地APIC。本地APIC接收该处理器产生的本地中断比如时钟中断,以及由该处理器产生的处理器间中断,并从APIC串行总线接收来自IO APIC的消息;IO APIC负责接收所有外部的硬件中断,并翻译成消息选择发给接收中断的处理器,以及从本地APIC接收处理器间中断消息。, i( C3 S+ y% l5 N3 V* G4 K
7 Y, I# O: _6 E9 O Y& V 和PIC一样,控制本地APIC和IO APIC的方法是通过读写该单元中的相关寄存器。不过和PIC不一样的是,Intel把本地APIC和IO APIC的寄存器都映射到了物理地址空间,本地APIC默认映射到物理地址0xffe00000,IO APIC默认映射到物理地址0xfec00000。windows HAL再进一步把本地APIC映射到虚拟地址0xfffe0000,把IO APIC映射到虚拟地址0xffd06000,也就是说对该地址的读写实际就是对寄存器的读写,本地APIC里几个重要的寄存有EOI寄存器,任务优先级寄存器(TPR),处理器优先级寄存器(PPR),中断命令寄存器(ICR,64位),中断请求寄存器(IRR,256位,对应每个向量一位),中断在服务寄存器(ISR,256位)等。IO APIC里几个重要的寄存器有版本寄存器,I/O寄存器选择寄存器、I/O窗口寄存器(用要访问的I/O APIC寄存器的索引设置地址I/O寄存器选择寄存器,此时访问I/O窗口寄存器就是访问被选定的寄存器)还有很重要的是一个IO重定向表,每一个表项是一个64位寄存器,包括向量和目标模式、传输模式等相关位,每一个表项连接一条IRQ线,表项的数目随处理器的版本而不一样,在Pentium 4上为24个表项。表项的数目保存在IO APIC版本寄存器的[16:23]位。APIC系统支持255个中断向量,但Intel保留了0-15向量,可用的向量是16-255。并引进一个概念叫做任务优先级=中断向量/16,因为保留了16个向量,所以可用的优先级是2-15。当用一个指定的优先级设置本地APIC中的任务优先级寄存器TPR后,所有优先级低于TPR中优先级的中断都被屏蔽,是不是很象IRQL的机制?事实上,APIC HAL里的IRQL机制也就是靠着这个任务优先级寄存器得以实现。同一个任务优先级包括了16个中断向量,可以进一步细粒度地区分中断的优先级。
. n. r& x) e9 E) G
% E) C* ]0 G, N8 ^+ B 在HAL里虽然HalBeginSystemInterrupt仍然是IRQL机制的发动引擎,但是因为有APIC的支持,它和其它共同实现IRQL的函数要比PIC HAL里对应的函数功能简单得多。HalBeginSystemInterrupt通过用IRQL做索引在HalpIRQLtoTPR数组中获取该IRQL对应的任务优先级,用该优先级设置任务优先级寄存器TPR,并把TPR中原先的任务优先级/16做为索引在HalpVectorToIRQL数组中获取对应的原先的IRQL然后返回。若IRQL是从低于DISPATCH_LEVEL提升到高于DISPATCH_LEVEL,还需要设置KPCR+0x95(0xffdff095)为DISPATCH_LEVEL(0x2),表示是从DISPATCH_LEVEL以下的级别提升IRQL。HalEndSystemInterrupt向本地APIC的EOI寄存发送0,表示中断结束,可以接收新中断。并还要判断要降到的IRQL是否小于DISPATCH_LEVEL,若小于则进一步判断KPCR+0x96(0xffdff096)是否置位,若置位则表示有DPC中断在等待(在IRQL高于DISPATCH_LEVEL被引发,然后等待直到IRQL降到低于DISPATCH_LEVEL),则将KPCR+0x95和KPCR+0x96清0后调用KiDispatchInterrupt响应DPC软中断。否则做的工作就是和HalBeginSystemInterrupt一样的过程:把要降到的IRQL转换成任务优先级设置TRP,并把久的任务优先级转成IRQL返回。KfRaiseIrql、KfLowerIrql之类的函数也是这么一回事,把当前IRQL转成任务优先级修改TPR,并把原先TPR的值转成原先的IRQL并返回。而现在软中断的产生也有了APIC支持,APIC通过产生一个发向自己的处理器间中断,就可以产生一个软中断,因为可以指定该中断的向量,所以软中断就可以区分优先级别,如APC_LEVEL、DISPATCH_LEVEL。产生软中断的函数一样还是HalRequestSoftwareInterrupt,该函数会先判断KPCR+0x95是否和要产生的软中断IRQL一样,若是的话则置位KPCR+0x96并返回,表示现在IRQL大于DISPATCH_LEVEL所以不处理DPC中断。否则以要产生的软中断的IRQL为索引从HalpIRQLtoTPRHAL取出对应任务优先级,并或上0x4000,表示是发向自身的固定处理间中断,并用该值设置中断命令寄存器ICW的低32位,然后读取中断命令寄存器ICW的低32位是否为0x1000,确定中断消息已经发送后就返回,这时候软中断已经产生。值得注意的是APIC HAL里没有HalEndSoftwareInterrupt这个函数。HAL为软中断的IRQL提供了一个固定的中断向量:
8 h3 Y0 n6 _' a
% f i% W' b% r5 ?+ o$ e9 _& q" t7 [#define ZERO_VECTOR 0x00 // IRQL 00
% g% `3 q: W0 ?9 c: j( h& x#define APC_VECTOR 0x3D // IRQL 01
. z) D6 g2 `5 S" z! e q#define DPC_VECTOR 0x41 // IRQL 02
. @8 j& F/ |1 G( M+ r# c#define APIC_GENERIC_VECTOR 0xC1 // IRQL 27
! m4 F9 N. D- t#define APIC_CLOCK_VECTOR 0xD1 // IRQL 28' g3 r( t ~4 A. q+ V- [1 L% Z
#define APIC_SYNCH_VECTOR 0xD1 // IRQL 28: L% D- z7 q4 q
#define APIC_IPI_VECTOR 0xE1 // IRQL 293 i; j! ? i4 i
#define POWERFAIL_VECTOR 0xEF // IRQL 30& S) @) v2 |. n) L
#define APIC_PROFILE_VECTOR 0xFD // IRQL 31
9 i9 x8 j+ {! J: z' ^
) D9 V4 ~5 q8 G4 l; s. [9 a$ q+ h. n1 Z' |5 S! t8 W' V
现在看一下一些重要的数据:' ? F. M, [4 `+ y1 e( M, _
% L3 Y& Z8 j% o& K H这是我写的代码输出的IO APIC重定向表内容:0 \8 x, k4 w. Q3 V! B7 o# n4 e
" B0 g9 M, ?7 @7 D8 }Redirect Table Index: 0x17
$ f1 d/ K3 C2 n1 E& x1 LRedirect Table[ 0]: ff
8 G3 N( R2 b& E3 QRedirect Table[ 1]: b3" ~% m2 z; L: ?$ y! x
Redirect Table[ 2]: ff$ q |8 S% Y, W5 S m, _4 I- G; h# W# G
Redirect Table[ 3]: 51
5 n: X( V- i5 _; U% V/ x4 E8 ?Redirect Table[ 4]: ff' g5 |0 B' k6 y/ `7 K
Redirect Table[ 5]: ff
( {# A! |# X( E& xRedirect Table[ 6]: 62
X' V5 U! Y% H; ?! MRedirect Table[ 7]: ff, J- j: ^0 t# m# p3 T4 x
Redirect Table[ 8]: d1( Y M1 K% ^- X& K$ D
Redirect Table[ 9]: b1) H# Z/ Z$ I! o& u9 z
Redirect Table[ a]: ff2 [# h" ~" x7 M& `( p9 O) x
Redirect Table[ b]: ff
% A9 E7 R! m' c# B# c2 V0 fRedirect Table[ c]: 52# Y! i5 b. B) m1 ^1 z' Z
Redirect Table[ d]: ff
: F. _) x' v" Z8 q! r& \" MRedirect Table[ e]: ff7 }& L( ?& m9 l6 Q" s% V
Redirect Table[ f]: 92* l: }6 p/ q. S4 {. ?7 V7 _
Redirect Table[10]: ff
5 j& e* f7 Y mRedirect Table[11]: a3
5 e v0 ]; h& R4 URedirect Table[12]: 83$ u$ {+ W3 N, f R5 r
Redirect Table[13]: 93
3 M% w& g2 U% h" g8 SRedirect Table[14]: ff
: F( D, j6 `8 }3 d& h% l/ vRedirect Table[15]: ff- N0 z0 T9 j7 `. U
Redirect Table[16]: ff
5 U& N$ P: T+ I# m0 \Redirect Table[17]: ff
8 g! J* z: R: j& M3 |- R- U7 `
# M$ y& Q/ Q' a" l- [. a. P) _9 H这是IDT表中被注册的向量:
9 i0 M! @+ u) g: K3 c7 \& L6 \2 @3 v9 j7 e4 ~1 r4 o/ G
1f: 80064908 (hal!HalpApicSpuriousService)1 x5 x9 ], `2 I( M+ `+ A
37: 800640b8 (hal!PicSpuriousService37)4 N+ r( h8 A4 n0 P. t7 Q _' m+ K, y
3d: 80065254 (hal!HalpApcInterrupt)
+ c3 p6 t$ e9 g41: 800650c8 (hal!HalpDispatchInterrupt)2 a: U; s- j/ P6 O$ D7 A
50: 80064190 (hal!HalpApicRebootService)9 f" B4 d( d6 T
51: 817f59e4
2 l1 `( i, i% I, t! q(Vector:51,Irql:4,SyncIrql:4,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:serial!SerialCIsrSw(f3c607c7))4 `' _3 x3 B; }+ o/ c
52: 817f5044 5 r. l( m9 y) ^# J
(Vector:52,Irql:4,SyncIrql:a,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:i8042prt!I8042MouseInterruptService(f3c57a2c))
/ n4 @- I3 {( C: Y& P. H83: 817d2d44
6 y! B" L0 {4 F q" h(Vector:83,Irql:7,SyncIrql:7,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:NDIS!ndisMIsr(bff1b794))
, I$ N; V- Z E& y( F92: 81821384 ! `! `! J( t2 E7 Q+ Z
(Vector:92,Irql:8,SyncIrql:8,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:atapi!ScsiPortInterrupt(bff892be))
" a: K8 t. N, U+ N* Z4 e+ L93: 8185ed64 - W8 _7 T, T( O8 m+ n. f1 M
(Vector:93,Irql:8,SyncIrql:8,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:uhcd!UHCD_InterruptService(f3f0253e))
+ d; B' V7 ?( v. @- ka3: 8186cdc4
U g7 N& q3 @# m5 W0 `(Vector:a3,Irql:9,SyncIrql:9,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:SCSIPORT!ScsiPortInterrupt(bff719f0))2 o/ ^) o7 e( p$ ^: @! z) B
b1: 818902e4 # j% V0 B9 P6 ~- X
(Vector:b1,Irql:a,SyncIrql:a,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:ACPI!ACPIInterruptServiceRoutine(bffe14b4))
' s' ^8 G" _- x: ^b3: 81881664
+ h8 B |$ [/ L" [+ u(Vector:b3,Irql:a,SyncIrql:a,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:i8042prt!I8042KeyboardInterruptService(f3c51918))
D1 W. z% C9 Y6 lc1: 800642fc (hal!HalpBroadcastCallService)7 t5 Q/ {# _% A% [% g. C
d1: 80063964 (hal!HalpClockInterrupt)
& f' M# y2 \0 r3 K& r: T4 Be1: 80064858 (hal!HalpIpiHandler)" W e2 J- H; l; w2 T# J2 \! r9 @
e3: 800645d4 (hal!HalpLocalApicErrorService) B* w# K) _' U9 x1 o
fd: 80064d64 (hal!HalpProfileInterrupt); x8 h" g0 s; w o
fe: 80064eec (hal!HalpPerfInterrupt)
9 H" F6 e9 E: J1 f+ Y
* i0 \ A& `' s; {8 q2 y' ?象a3、b1这类输出内容很多的是被硬件注册的中断向量,而象d1、e3这种输出内容少的是注册为了的HAL内部使用的中断向量和本地APIC中断向量
, y" ?- A9 d) D; D! T" g
: L9 L# X, E: r! z+ C: _: ?这是几个重要的数组:
( T1 P0 M g4 c; T1 ^
' u0 m! X5 M; z' @6 GHalVectorToIrql(这个数组是以向量除于16做索引):
6 k6 i; f6 N/ U! F. B% w C8006a304 00 ff ff 01 02 04 05 06-07 08 09 0a 1b 1c 1d 1e. O+ N, Y2 I0 d
/ b7 B. }$ [ X
HalpIRQLtoTPR:
, J2 `0 M) P8 q. r8006a1e4 00 3d 41 41 51 61 71 81-91 a1 b1 b1 b1 b1 b1 b1
( g- B1 ?8 \# i8006a1f4 b1 b1 b1 b1 b1 b1 b1 b1-b1 b1 b1 c1 d1 e1 ef ff
- o0 i) u4 U: J7 z- k9 \) _
% p: ]! k7 c& `7 c2 _% SHalpINTItoVector:! Y: P/ s# m1 c. n8 v
8006ada0 00 b3 61 51 a2 b2 62 91-a1 b1 71 81 52 82 72 92% ~2 E/ N9 Y$ v) @
8006adb0 00 a3 83 93 00 00 00 00-00 00 00 00 00 00 00 00
# m# R5 g! h/ U& }! L* w; [0 e" m w; K/ r
HalVectorToINTI:
& b* ~" p; w5 z$ \# O8 U# x8006a204 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff$ X7 g3 W c! m4 u, f8 u& k5 a. ?+ D7 W
8006a214 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff) ]* @4 ^- ?3 c: s9 E
8006a224 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff5 w+ }* {" R4 @5 `4 P& V' b5 K
8006a234 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff5 g9 g5 L& J( L
8006a244 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff; w& p$ ]- Q N4 D
8006a254 ff 03 0c ff ff ff ff ff-ff ff ff ff ff ff ff ff
! H! i: Z k& f6 H. b8 A- p8006a264 ff 02 06 ff ff ff ff ff-ff ff ff ff ff ff ff ff: r" V* A; W7 C- p* v* q* T
8006a274 ff 0a 0e ff ff ff ff ff-ff ff ff ff ff ff ff ff
/ N$ b: c3 a' q# R. }8006a284 ff 0b 0d 12 ff ff ff ff-ff ff ff ff ff ff ff ff
7 H' W& Y U C; |8006a294 ff 07 0f 13 ff ff ff ff-ff ff ff ff ff ff ff ff- `" B6 c* |1 J; c, G
8006a2a4 ff 08 04 11 ff ff ff ff-ff ff ff ff ff ff ff ff( S \1 n6 p- ?! N' o
8006a2b4 ff 09 05 01 ff ff ff ff-ff ff ff ff ff ff ff ff
2 x8 }- _ {# W! ~" c8006a2c4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff( o/ z P, K& e0 t) m$ Q
8006a2d4 ff 08 ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
3 S. U0 b' ^) {9 X3 h8006a2e4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff1 D) {2 Q6 h$ Z! W5 Q# m
8006a2f4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff
, t! j9 M% N6 Z! D3 v5 v% I T! }1 c1 r& @: N! `4 x
3 m/ E) z! d1 ]. H/ I: pvBucket:4 u# i+ i+ I8 E6 a2 m1 I* \( x, w, Y
8006ae30 02 02 02 03 03 03 03
1 z9 R" n9 ~1 W+ e9 @7 l9 ~3 D# J2 i3 ^1 Y- e, v
举个例子来说明一下,在我虚拟机里SCSI Controller的IRQ是17(注意,已经大于16了),到重定向表中查找第17项,得到中断向量为0xa3,再看IDT,0xa3对应处理例程是SCSIPORT!ScsiPortInterrupt。
# s8 D$ U/ Z0 r7 q" v3 J! n" v1 n/ s4 |, k5 c6 U
vBucket数组干啥用的?它就是用来分配新的向量。分配算法很简单,当要分配一个新的向量时,就在vBucket数组从右到左搜索最小的一个数i,该数对应在vBucket中索引为Index,新向量为(0x50+Index*16+i+1),新向量对应的IRQL为(4+i+1),同时会把vBucket中这个i加1,i不等大于16。象给出的这个vBucket,下一次计算时i=2, index=2。不过这些用于硬件的向量在IO系统初始化时调用HalpGetSystemInterruptVector分配好了,然后通过IoConnectInterrupt把IDT中注册的向量位置的例程注册为中断处理程序。这里并不是每个注册的向量都会对应中断处理程序,象上面给出的例子中,0xa1、0xa2、0xb1等向量就没有对应。
. B' C. f: p+ u0 W4 a# Y5 x4 I/ W! h+ V- f
IRQL机制为内核同步提供了很大的便利,既对驱动开发者隐藏了底层中断机制,也方便了驱动开发者的内核同步。LINUX从2.5内核开始引进的软中断和任务队列等机制,很大程度上也来自windows这套机制的借鉴。
5 P; ]' Q2 M, L6 X G7 U/ h- L- V: R, g' {# a9 O4 g
终于考完试,解放了,呵呵。这个东西其实还有很多可写的,只是没空再深入去分析了。在未来的64位系统里,APIC这种基于中断引脚的机制很快也要被SAPIC这种基于消息的更强大的机制所取代 |
|