|
楼主 |
发表于 2008-2-27 14:35:05
|
显示全部楼层
从IRQ到IRQL(APIC版)
来自:http://www.nsfocus.net/index.php ... o=view&mid=2534
$ q6 F* X- [4 ~
& y& L' m) j. l4 {+ j从IRQ到IRQL(APIC版)
$ t. M) x/ o8 R, D5 `) i% t. t5 \% [+ Y9 o, R I
作者:SoBeIt
) W: I( _& e% e: V J4 K" E, r出处:https://www.xfocus.net/bbs/index.php?act=ST&f=2&t=45502" ?% `: I( h# O' J
日期:2005-02-04% T3 L/ B- `" J& _* l/ C: u
6 v' B7 e9 m! S7 r8 J
事实上,老久的PIC在很早以前就被淘汰了,取而代之的是APIC。由于APIC可以兼容PIC,所以在很多单处理器系统上我们看到的PIC实际是APIC的兼容PIC模式。APIC主要应用于多处理器操作系统,是为了解决IRQ太少和处理器间中断而产生的,当然,单处理器操作系统也可以使用APIC(不是模拟PIC)。APIC的HAL和PIC的HAL有很大的不同,很突出的一个特点就是APIC的HAL不用再象PIC的HAL那样虚拟一个中断控制器,IRQL的概念已经可以通过中断向量的形式被APIC支持。事实上,因为被APIC所支持,所以在APIC HAL里IRQL的实现比PIC HAL那样虚拟一个中断控制器要简单得多了。
, E1 P$ X0 s& M5 I; F, h+ X+ A J! Y4 d9 P
现在来简单介绍一下APIC的结构(关于APIC详细的描述请参考《IA-32 Inel Architecture Software Developer's Manual Volume 3 Chapter 8》)。整个APIC系统由本地APIC、IO APIC和APIC串行总线组成(在Pentium 4和Xeon以后,APIC总线放到了系统总线中)组成。每个处理器中集成了一个本地APIC,而IO APIC是系统芯片组中一部分,APIC总线负责连接IO APIC和各个本地APIC。本地APIC接收该处理器产生的本地中断比如时钟中断,以及由该处理器产生的处理器间中断,并从APIC串行总线接收来自IO APIC的消息;IO APIC负责接收所有外部的硬件中断,并翻译成消息选择发给接收中断的处理器,以及从本地APIC接收处理器间中断消息。' d) ^' p3 d" }. `# B3 e7 X, J
! [4 S9 |9 Z7 t Q4 G4 I( H
和PIC一样,控制本地APIC和IO APIC的方法是通过读写该单元中的相关寄存器。不过和PIC不一样的是,Intel把本地APIC和IO APIC的寄存器都映射到了物理地址空间,本地APIC默认映射到物理地址0xffe00000,IO APIC默认映射到物理地址0xfec00000。windows HAL再进一步把本地APIC映射到虚拟地址0xfffe0000,把IO APIC映射到虚拟地址0xffd06000,也就是说对该地址的读写实际就是对寄存器的读写,本地APIC里几个重要的寄存有EOI寄存器,任务优先级寄存器(TPR),处理器优先级寄存器(PPR),中断命令寄存器(ICR,64位),中断请求寄存器(IRR,256位,对应每个向量一位),中断在服务寄存器(ISR,256位)等。IO APIC里几个重要的寄存器有版本寄存器,I/O寄存器选择寄存器、I/O窗口寄存器(用要访问的I/O APIC寄存器的索引设置地址I/O寄存器选择寄存器,此时访问I/O窗口寄存器就是访问被选定的寄存器)还有很重要的是一个IO重定向表,每一个表项是一个64位寄存器,包括向量和目标模式、传输模式等相关位,每一个表项连接一条IRQ线,表项的数目随处理器的版本而不一样,在Pentium 4上为24个表项。表项的数目保存在IO APIC版本寄存器的[16:23]位。APIC系统支持255个中断向量,但Intel保留了0-15向量,可用的向量是16-255。并引进一个概念叫做任务优先级=中断向量/16,因为保留了16个向量,所以可用的优先级是2-15。当用一个指定的优先级设置本地APIC中的任务优先级寄存器TPR后,所有优先级低于TPR中优先级的中断都被屏蔽,是不是很象IRQL的机制?事实上,APIC HAL里的IRQL机制也就是靠着这个任务优先级寄存器得以实现。同一个任务优先级包括了16个中断向量,可以进一步细粒度地区分中断的优先级。! R1 x; \7 d9 j8 b: u# A2 i
0 c- c+ Y2 s( ]( P& K 在HAL里虽然HalBeginSystemInterrupt仍然是IRQL机制的发动引擎,但是因为有APIC的支持,它和其它共同实现IRQL的函数要比PIC HAL里对应的函数功能简单得多。HalBeginSystemInterrupt通过用IRQL做索引在HalpIRQLtoTPR数组中获取该IRQL对应的任务优先级,用该优先级设置任务优先级寄存器TPR,并把TPR中原先的任务优先级/16做为索引在HalpVectorToIRQL数组中获取对应的原先的IRQL然后返回。若IRQL是从低于DISPATCH_LEVEL提升到高于DISPATCH_LEVEL,还需要设置KPCR+0x95(0xffdff095)为DISPATCH_LEVEL(0x2),表示是从DISPATCH_LEVEL以下的级别提升IRQL。HalEndSystemInterrupt向本地APIC的EOI寄存发送0,表示中断结束,可以接收新中断。并还要判断要降到的IRQL是否小于DISPATCH_LEVEL,若小于则进一步判断KPCR+0x96(0xffdff096)是否置位,若置位则表示有DPC中断在等待(在IRQL高于DISPATCH_LEVEL被引发,然后等待直到IRQL降到低于DISPATCH_LEVEL),则将KPCR+0x95和KPCR+0x96清0后调用KiDispatchInterrupt响应DPC软中断。否则做的工作就是和HalBeginSystemInterrupt一样的过程:把要降到的IRQL转换成任务优先级设置TRP,并把久的任务优先级转成IRQL返回。KfRaiseIrql、KfLowerIrql之类的函数也是这么一回事,把当前IRQL转成任务优先级修改TPR,并把原先TPR的值转成原先的IRQL并返回。而现在软中断的产生也有了APIC支持,APIC通过产生一个发向自己的处理器间中断,就可以产生一个软中断,因为可以指定该中断的向量,所以软中断就可以区分优先级别,如APC_LEVEL、DISPATCH_LEVEL。产生软中断的函数一样还是HalRequestSoftwareInterrupt,该函数会先判断KPCR+0x95是否和要产生的软中断IRQL一样,若是的话则置位KPCR+0x96并返回,表示现在IRQL大于DISPATCH_LEVEL所以不处理DPC中断。否则以要产生的软中断的IRQL为索引从HalpIRQLtoTPRHAL取出对应任务优先级,并或上0x4000,表示是发向自身的固定处理间中断,并用该值设置中断命令寄存器ICW的低32位,然后读取中断命令寄存器ICW的低32位是否为0x1000,确定中断消息已经发送后就返回,这时候软中断已经产生。值得注意的是APIC HAL里没有HalEndSoftwareInterrupt这个函数。HAL为软中断的IRQL提供了一个固定的中断向量:
# t4 k+ w# L! o! W
: T. e% j6 m! T% ]0 l#define ZERO_VECTOR 0x00 // IRQL 00
/ ?0 H0 b( w$ d! A( a#define APC_VECTOR 0x3D // IRQL 01
2 [9 N$ }' V7 }- w1 r#define DPC_VECTOR 0x41 // IRQL 02; r7 j" D% A3 p# i, h' I3 r7 j
#define APIC_GENERIC_VECTOR 0xC1 // IRQL 27. B1 \0 I. r' q6 Y( X8 S
#define APIC_CLOCK_VECTOR 0xD1 // IRQL 28
. F: P5 F1 p4 ]5 N+ L+ g7 D G8 L7 l#define APIC_SYNCH_VECTOR 0xD1 // IRQL 28
( O; z! M1 Q5 F) e# U#define APIC_IPI_VECTOR 0xE1 // IRQL 29
, }$ L5 I" F- x" T4 b#define POWERFAIL_VECTOR 0xEF // IRQL 30/ x" x B) l4 J# c# p0 [
#define APIC_PROFILE_VECTOR 0xFD // IRQL 317 K4 \; }! V; x( O& }/ G4 |
+ z5 f' X' i, Z+ V) v- U% f- J1 y4 i8 i. @/ J# \& d
现在看一下一些重要的数据:2 ~% y$ x& d' B
+ Q5 D5 t7 E' s) X8 B, j
这是我写的代码输出的IO APIC重定向表内容:+ j$ z' z# |, S
; P( Z5 I$ U) |! ]+ O
Redirect Table Index: 0x178 J! c& Y& F+ S3 h: f. Y1 \) P
Redirect Table[ 0]: ff$ p; J$ f& T3 p& @" ?. }
Redirect Table[ 1]: b3
9 t t Q& n& s2 \3 e) IRedirect Table[ 2]: ff7 r& u9 Q( B& Z9 @ H
Redirect Table[ 3]: 51
! k9 }$ M V' t- K4 E/ XRedirect Table[ 4]: ff2 C* `: ~8 i9 [* _" N- a, ?7 O5 M" a
Redirect Table[ 5]: ff( U( V7 `2 x2 j- F
Redirect Table[ 6]: 62' b3 h& r5 @% n4 k7 y& ~
Redirect Table[ 7]: ff% d6 T3 O0 q& a- {
Redirect Table[ 8]: d18 e, N o4 e' Q& {. F& M- D* l
Redirect Table[ 9]: b1
: B; P' | b0 W$ r+ i5 g( RRedirect Table[ a]: ff
7 T' C4 J* A" l. \2 dRedirect Table[ b]: ff
. t" I: `" G' i$ x* i+ |( oRedirect Table[ c]: 52
: ]3 i! d5 ?7 V% ], b. fRedirect Table[ d]: ff
/ ^% U( E0 J! [' l7 B! R- ERedirect Table[ e]: ff
4 l% w. e! l; F+ ^" [3 d: NRedirect Table[ f]: 92
6 ~ a: T+ G4 u+ d: [Redirect Table[10]: ff
1 S; }5 D. H* ERedirect Table[11]: a3! Q( d3 {/ \; g6 W
Redirect Table[12]: 834 j5 [+ \; P, L5 Y, z" b
Redirect Table[13]: 931 i; j) Z; q8 a7 t4 R5 l
Redirect Table[14]: ff
% k4 l$ V$ _" o NRedirect Table[15]: ff
7 U1 \% U0 p7 y5 V4 @2 ARedirect Table[16]: ff
1 L! S3 R0 t! ^ R- K% \Redirect Table[17]: ff5 t8 K5 Q; |" |0 G4 B' H
$ Y0 `3 a! m3 T/ a这是IDT表中被注册的向量:1 `8 h2 h0 Y9 i3 V2 D( d, I
" M/ U; a& J/ |1f: 80064908 (hal!HalpApicSpuriousService)6 k" w( u+ z$ W( ~
37: 800640b8 (hal!PicSpuriousService37)
$ _( r& `9 h0 Q+ W" n# x: |) @3d: 80065254 (hal!HalpApcInterrupt)
/ v5 }* {; f8 ]4 {41: 800650c8 (hal!HalpDispatchInterrupt)
5 |: N. F) W8 R50: 80064190 (hal!HalpApicRebootService)
7 [( o8 \1 n1 P# X+ ^51: 817f59e4+ ~3 r# { r) [* E6 x( \ f" s
(Vector:51,Irql:4,SyncIrql:4,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:serial!SerialCIsrSw(f3c607c7))
2 ]# |5 o( n/ Y- i8 _52: 817f5044
2 o8 U1 M; D* S, M. a& e6 X(Vector:52,Irql:4,SyncIrql:a,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:i8042prt!I8042MouseInterruptService(f3c57a2c))! [* V$ A. Q m" g6 b# h
83: 817d2d44
0 L# u( l9 S. o$ ^8 V* @(Vector:83,Irql:7,SyncIrql:7,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:NDIS!ndisMIsr(bff1b794))) A4 r1 R& h d& |2 A6 o
92: 81821384 2 Q" r/ M) D: Z* Y% V+ o- T, y: H% j
(Vector:92,Irql:8,SyncIrql:8,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:atapi!ScsiPortInterrupt(bff892be))
1 |, l5 \; l) G: Y$ x# J( ]93: 8185ed64 ( |! q }; w* t( [8 @7 J
(Vector:93,Irql:8,SyncIrql:8,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:uhcd!UHCD_InterruptService(f3f0253e))1 f, b$ H4 A5 m) k" R
a3: 8186cdc4
" y* ?/ L# v. D3 x# u(Vector:a3,Irql:9,SyncIrql:9,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:SCSIPORT!ScsiPortInterrupt(bff719f0)); d1 H/ E$ u2 y: k0 a
b1: 818902e4
5 |. F9 I" p. G# I/ j2 q(Vector:b1,Irql:a,SyncIrql:a,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:ACPI!ACPIInterruptServiceRoutine(bffe14b4))2 h# r1 l& p8 k
b3: 81881664
: d( `- I, B( |5 \; h& W(Vector:b3,Irql:a,SyncIrql:a,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:i8042prt!I8042KeyboardInterruptService(f3c51918))
. _' w$ r/ j- r2 ?c1: 800642fc (hal!HalpBroadcastCallService)
d8 T T# f# g ~0 ~" vd1: 80063964 (hal!HalpClockInterrupt)
6 ~8 ]: x8 J- D: v ke1: 80064858 (hal!HalpIpiHandler)
, w2 p: c* n; X$ me3: 800645d4 (hal!HalpLocalApicErrorService)
+ f/ m, n% m; g bfd: 80064d64 (hal!HalpProfileInterrupt)" y/ p; K' |+ f* t0 l+ f* ^/ s
fe: 80064eec (hal!HalpPerfInterrupt)
1 _" H- K# Y% Z% E) S; t$ K
3 h- A+ m$ F& Z- _象a3、b1这类输出内容很多的是被硬件注册的中断向量,而象d1、e3这种输出内容少的是注册为了的HAL内部使用的中断向量和本地APIC中断向量
) E3 h6 _$ t9 R1 O$ ?1 _5 b/ l# b j3 g/ R& Z& Q* K
这是几个重要的数组:
; c- E7 E) H8 t
@$ f; H1 j/ w( u* f. \, HHalVectorToIrql(这个数组是以向量除于16做索引):- ?& E; d) y# g
8006a304 00 ff ff 01 02 04 05 06-07 08 09 0a 1b 1c 1d 1e9 D# |5 ~' X& ?; L* u
+ }# M9 g- O: V y/ G/ Z* @" d
HalpIRQLtoTPR:
4 j1 d( j' ^& u8006a1e4 00 3d 41 41 51 61 71 81-91 a1 b1 b1 b1 b1 b1 b1
% g4 g# m7 p' {0 n+ C2 A; _8006a1f4 b1 b1 b1 b1 b1 b1 b1 b1-b1 b1 b1 c1 d1 e1 ef ff
* t$ m. r) [- R( o3 \1 Q5 P3 `3 b" Q0 F# H1 }8 T
HalpINTItoVector:, N, o. ]3 @: O: m. E- [4 C3 q
8006ada0 00 b3 61 51 a2 b2 62 91-a1 b1 71 81 52 82 72 92; G6 e, A7 i' L: t: V) M" d' a
8006adb0 00 a3 83 93 00 00 00 00-00 00 00 00 00 00 00 00
, p) h' ?, u2 b3 e8 N# L! Z* B5 G9 b, p
HalVectorToINTI:
0 ?* D; F- G" F6 w8 U9 P8006a204 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
) i: _3 d4 G0 C( J8006a214 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
# V2 M3 }3 E6 ~; t& t& L F" M8006a224 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
/ k2 } _+ v0 a8 C I7 ^. x, M8 O& m! f* f8006a234 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
; T: ]$ }7 ?9 u3 E+ T8 I8006a244 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff4 h; w! t7 ~: n; z' H
8006a254 ff 03 0c ff ff ff ff ff-ff ff ff ff ff ff ff ff! q+ y: _$ h: u# w( {
8006a264 ff 02 06 ff ff ff ff ff-ff ff ff ff ff ff ff ff
/ E" j9 d' e5 @' h& K2 n: Z8006a274 ff 0a 0e ff ff ff ff ff-ff ff ff ff ff ff ff ff
8 [7 n2 S: C3 U4 K; n% v8006a284 ff 0b 0d 12 ff ff ff ff-ff ff ff ff ff ff ff ff
3 p% [9 x1 e- K6 @) c8006a294 ff 07 0f 13 ff ff ff ff-ff ff ff ff ff ff ff ff
! ^: H" {2 I& h1 ~' _: p8006a2a4 ff 08 04 11 ff ff ff ff-ff ff ff ff ff ff ff ff
3 a1 i0 T2 ~! W9 h& h7 B. Q8006a2b4 ff 09 05 01 ff ff ff ff-ff ff ff ff ff ff ff ff8 T0 n' m2 j2 A' L
8006a2c4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff* S5 b9 v5 q$ v2 Q+ K8 u2 j1 u9 A/ \- \
8006a2d4 ff 08 ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
. \3 x) z0 c* Y1 O6 W) @6 ]& Y8006a2e4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff4 G8 D9 k, [: B6 _( g
8006a2f4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff
/ Y- s$ b! b, z+ Z
" u6 m' K8 ~2 o, I# G A$ g/ j* ?" d8 @1 ?
vBucket:: I% n8 C, l' d) T9 y
8006ae30 02 02 02 03 03 03 03
9 i* }3 H9 z$ N7 L! J: x# T' M6 @5 C
举个例子来说明一下,在我虚拟机里SCSI Controller的IRQ是17(注意,已经大于16了),到重定向表中查找第17项,得到中断向量为0xa3,再看IDT,0xa3对应处理例程是SCSIPORT!ScsiPortInterrupt。
. @& H! i' [ R# l% J2 s0 w6 X) @9 D' q" z: E/ F* a
vBucket数组干啥用的?它就是用来分配新的向量。分配算法很简单,当要分配一个新的向量时,就在vBucket数组从右到左搜索最小的一个数i,该数对应在vBucket中索引为Index,新向量为(0x50+Index*16+i+1),新向量对应的IRQL为(4+i+1),同时会把vBucket中这个i加1,i不等大于16。象给出的这个vBucket,下一次计算时i=2, index=2。不过这些用于硬件的向量在IO系统初始化时调用HalpGetSystemInterruptVector分配好了,然后通过IoConnectInterrupt把IDT中注册的向量位置的例程注册为中断处理程序。这里并不是每个注册的向量都会对应中断处理程序,象上面给出的例子中,0xa1、0xa2、0xb1等向量就没有对应。
. j3 a8 G$ w( f
- n* p1 i; i* }- ?% y) j IRQL机制为内核同步提供了很大的便利,既对驱动开发者隐藏了底层中断机制,也方便了驱动开发者的内核同步。LINUX从2.5内核开始引进的软中断和任务队列等机制,很大程度上也来自windows这套机制的借鉴。
8 n# Z- U7 c0 `( d! L/ V# G' o `! }& V. x
终于考完试,解放了,呵呵。这个东西其实还有很多可写的,只是没空再深入去分析了。在未来的64位系统里,APIC这种基于中断引脚的机制很快也要被SAPIC这种基于消息的更强大的机制所取代 |
|