|
楼主 |
发表于 2008-2-27 14:35:05
|
显示全部楼层
从IRQ到IRQL(APIC版)
来自:http://www.nsfocus.net/index.php ... o=view&mid=2534
% p6 E J2 E, U- S. b6 U4 K* o! q$ w R& `! g
从IRQ到IRQL(APIC版)$ L+ f# `( M8 ^, d
% M; D" [( T8 B$ T
作者:SoBeIt5 d) z4 r2 c7 @( u
出处:https://www.xfocus.net/bbs/index.php?act=ST&f=2&t=45502
6 v( ^+ o2 f. |1 k日期:2005-02-04
) n# q: s m. s7 F: t- ^
) y% o5 K5 C W3 J5 @6 l1 Y$ @事实上,老久的PIC在很早以前就被淘汰了,取而代之的是APIC。由于APIC可以兼容PIC,所以在很多单处理器系统上我们看到的PIC实际是APIC的兼容PIC模式。APIC主要应用于多处理器操作系统,是为了解决IRQ太少和处理器间中断而产生的,当然,单处理器操作系统也可以使用APIC(不是模拟PIC)。APIC的HAL和PIC的HAL有很大的不同,很突出的一个特点就是APIC的HAL不用再象PIC的HAL那样虚拟一个中断控制器,IRQL的概念已经可以通过中断向量的形式被APIC支持。事实上,因为被APIC所支持,所以在APIC HAL里IRQL的实现比PIC HAL那样虚拟一个中断控制器要简单得多了。5 H2 D, d5 S6 s5 b/ V8 |$ w, E( ~! M
* R! X; C! S1 N% j3 G. v; e8 ]3 K 现在来简单介绍一下APIC的结构(关于APIC详细的描述请参考《IA-32 Inel Architecture Software Developer's Manual Volume 3 Chapter 8》)。整个APIC系统由本地APIC、IO APIC和APIC串行总线组成(在Pentium 4和Xeon以后,APIC总线放到了系统总线中)组成。每个处理器中集成了一个本地APIC,而IO APIC是系统芯片组中一部分,APIC总线负责连接IO APIC和各个本地APIC。本地APIC接收该处理器产生的本地中断比如时钟中断,以及由该处理器产生的处理器间中断,并从APIC串行总线接收来自IO APIC的消息;IO APIC负责接收所有外部的硬件中断,并翻译成消息选择发给接收中断的处理器,以及从本地APIC接收处理器间中断消息。8 O# b, G& Y7 S+ J+ k8 t# A8 }* j
: Z* s* o& n6 o, q' f6 U! [ 和PIC一样,控制本地APIC和IO APIC的方法是通过读写该单元中的相关寄存器。不过和PIC不一样的是,Intel把本地APIC和IO APIC的寄存器都映射到了物理地址空间,本地APIC默认映射到物理地址0xffe00000,IO APIC默认映射到物理地址0xfec00000。windows HAL再进一步把本地APIC映射到虚拟地址0xfffe0000,把IO APIC映射到虚拟地址0xffd06000,也就是说对该地址的读写实际就是对寄存器的读写,本地APIC里几个重要的寄存有EOI寄存器,任务优先级寄存器(TPR),处理器优先级寄存器(PPR),中断命令寄存器(ICR,64位),中断请求寄存器(IRR,256位,对应每个向量一位),中断在服务寄存器(ISR,256位)等。IO APIC里几个重要的寄存器有版本寄存器,I/O寄存器选择寄存器、I/O窗口寄存器(用要访问的I/O APIC寄存器的索引设置地址I/O寄存器选择寄存器,此时访问I/O窗口寄存器就是访问被选定的寄存器)还有很重要的是一个IO重定向表,每一个表项是一个64位寄存器,包括向量和目标模式、传输模式等相关位,每一个表项连接一条IRQ线,表项的数目随处理器的版本而不一样,在Pentium 4上为24个表项。表项的数目保存在IO APIC版本寄存器的[16:23]位。APIC系统支持255个中断向量,但Intel保留了0-15向量,可用的向量是16-255。并引进一个概念叫做任务优先级=中断向量/16,因为保留了16个向量,所以可用的优先级是2-15。当用一个指定的优先级设置本地APIC中的任务优先级寄存器TPR后,所有优先级低于TPR中优先级的中断都被屏蔽,是不是很象IRQL的机制?事实上,APIC HAL里的IRQL机制也就是靠着这个任务优先级寄存器得以实现。同一个任务优先级包括了16个中断向量,可以进一步细粒度地区分中断的优先级。, x; P( t, \$ h5 k/ H
1 z7 j, x- F# b$ R! B) T, a
在HAL里虽然HalBeginSystemInterrupt仍然是IRQL机制的发动引擎,但是因为有APIC的支持,它和其它共同实现IRQL的函数要比PIC HAL里对应的函数功能简单得多。HalBeginSystemInterrupt通过用IRQL做索引在HalpIRQLtoTPR数组中获取该IRQL对应的任务优先级,用该优先级设置任务优先级寄存器TPR,并把TPR中原先的任务优先级/16做为索引在HalpVectorToIRQL数组中获取对应的原先的IRQL然后返回。若IRQL是从低于DISPATCH_LEVEL提升到高于DISPATCH_LEVEL,还需要设置KPCR+0x95(0xffdff095)为DISPATCH_LEVEL(0x2),表示是从DISPATCH_LEVEL以下的级别提升IRQL。HalEndSystemInterrupt向本地APIC的EOI寄存发送0,表示中断结束,可以接收新中断。并还要判断要降到的IRQL是否小于DISPATCH_LEVEL,若小于则进一步判断KPCR+0x96(0xffdff096)是否置位,若置位则表示有DPC中断在等待(在IRQL高于DISPATCH_LEVEL被引发,然后等待直到IRQL降到低于DISPATCH_LEVEL),则将KPCR+0x95和KPCR+0x96清0后调用KiDispatchInterrupt响应DPC软中断。否则做的工作就是和HalBeginSystemInterrupt一样的过程:把要降到的IRQL转换成任务优先级设置TRP,并把久的任务优先级转成IRQL返回。KfRaiseIrql、KfLowerIrql之类的函数也是这么一回事,把当前IRQL转成任务优先级修改TPR,并把原先TPR的值转成原先的IRQL并返回。而现在软中断的产生也有了APIC支持,APIC通过产生一个发向自己的处理器间中断,就可以产生一个软中断,因为可以指定该中断的向量,所以软中断就可以区分优先级别,如APC_LEVEL、DISPATCH_LEVEL。产生软中断的函数一样还是HalRequestSoftwareInterrupt,该函数会先判断KPCR+0x95是否和要产生的软中断IRQL一样,若是的话则置位KPCR+0x96并返回,表示现在IRQL大于DISPATCH_LEVEL所以不处理DPC中断。否则以要产生的软中断的IRQL为索引从HalpIRQLtoTPRHAL取出对应任务优先级,并或上0x4000,表示是发向自身的固定处理间中断,并用该值设置中断命令寄存器ICW的低32位,然后读取中断命令寄存器ICW的低32位是否为0x1000,确定中断消息已经发送后就返回,这时候软中断已经产生。值得注意的是APIC HAL里没有HalEndSoftwareInterrupt这个函数。HAL为软中断的IRQL提供了一个固定的中断向量:
8 M- L, w+ n: h4 }* |7 j0 A
# P, Q. G, \: U7 j% T- F* M2 r4 j( p5 K#define ZERO_VECTOR 0x00 // IRQL 00 7 d6 }- i$ q/ g7 f
#define APC_VECTOR 0x3D // IRQL 013 r0 ]* v( `& K2 Z
#define DPC_VECTOR 0x41 // IRQL 02
" V! n4 [& H- p: \8 D#define APIC_GENERIC_VECTOR 0xC1 // IRQL 27
3 B! ^" N: V) k+ M#define APIC_CLOCK_VECTOR 0xD1 // IRQL 28* j. I5 c" m9 P2 P: J
#define APIC_SYNCH_VECTOR 0xD1 // IRQL 28
$ j8 v- E' h* q1 m& L; J7 ^) c, @#define APIC_IPI_VECTOR 0xE1 // IRQL 29' S3 {- L- ]0 z* U* y' {0 P8 X
#define POWERFAIL_VECTOR 0xEF // IRQL 30) p* }4 C% a0 ~4 w9 I
#define APIC_PROFILE_VECTOR 0xFD // IRQL 312 @% _4 O0 ?! g
! W9 k2 N3 D) |
# u, F4 a: ?8 D* { D! o; e现在看一下一些重要的数据:" N0 D+ e% [9 {+ `
9 E0 ^1 X% C% J6 v1 l) Z9 I
这是我写的代码输出的IO APIC重定向表内容:
9 ~2 _7 Z0 x/ `4 h/ _' ]: ?; n8 t" I w9 Q) ~. ?
Redirect Table Index: 0x17+ c; m$ R. y; K. k$ @) ~
Redirect Table[ 0]: ff7 c8 z. U0 _( @, L' O
Redirect Table[ 1]: b3
8 c* @4 \! ^+ b8 [% uRedirect Table[ 2]: ff6 \/ x( @& U' T: a
Redirect Table[ 3]: 513 Q" ?/ c4 @, B
Redirect Table[ 4]: ff' L. o0 H: t% J6 W# T* {% C
Redirect Table[ 5]: ff
! h6 T0 x2 O, V6 o/ Z* V9 ERedirect Table[ 6]: 625 i) l) @) l b# n' c, ^
Redirect Table[ 7]: ff& r* b1 e; L" S4 g
Redirect Table[ 8]: d17 }1 B3 `& q, l; M/ X
Redirect Table[ 9]: b1! _4 j& V% F! B, k. s! A
Redirect Table[ a]: ff
4 G$ [4 v2 N: ?* k' _9 m, h. l% qRedirect Table[ b]: ff
4 ~$ ?# w" z; ?( o/ a5 JRedirect Table[ c]: 52+ R$ C N- G! z' q8 i$ t
Redirect Table[ d]: ff
1 G5 t7 T* J, G0 [+ `0 k; MRedirect Table[ e]: ff
6 _# q8 H. w; B; ^7 bRedirect Table[ f]: 92
2 s' ?* K, o$ }5 s# U9 CRedirect Table[10]: ff6 h: Q! a5 h5 \6 w6 \+ [4 U [
Redirect Table[11]: a3
`3 Z. W5 }, i4 d' C6 LRedirect Table[12]: 835 z0 j, c) a/ p/ ?2 C
Redirect Table[13]: 93
. m* {6 k% z# J' ~Redirect Table[14]: ff; c, |5 q) q9 V( a% i. B
Redirect Table[15]: ff
! ]4 E0 N, E1 Y; w8 x! A6 t' ZRedirect Table[16]: ff
7 I0 I' V& m& E" O- c9 URedirect Table[17]: ff
- K' b- N9 U% L6 w3 X- o' q/ Y e8 x9 \& T
这是IDT表中被注册的向量:
' Q( _9 ~8 l# u$ L! A9 r. {# c5 K' R) ~1 d3 u" ] I
1f: 80064908 (hal!HalpApicSpuriousService)
6 C8 Y; |4 K$ {37: 800640b8 (hal!PicSpuriousService37)' w7 X9 o2 P/ C1 |
3d: 80065254 (hal!HalpApcInterrupt): s( m# d) k/ o) }0 r3 r
41: 800650c8 (hal!HalpDispatchInterrupt)
$ K: V$ j5 \+ v+ B! O9 `50: 80064190 (hal!HalpApicRebootService)7 @, w& X8 L9 l
51: 817f59e4; I) _. a$ [, j& j
(Vector:51,Irql:4,SyncIrql:4,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:serial!SerialCIsrSw(f3c607c7))1 y9 ?7 T% r, T$ s+ a5 ?5 C
52: 817f5044
1 w% h5 y' {* X. q4 ~! }0 r(Vector:52,Irql:4,SyncIrql:a,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:i8042prt!I8042MouseInterruptService(f3c57a2c))7 a1 |& L9 n5 ~
83: 817d2d44
( F/ F( ^+ X3 m; n! w! y(Vector:83,Irql:7,SyncIrql:7,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:NDIS!ndisMIsr(bff1b794))
8 N8 q: ?9 t4 s5 U* b5 z92: 81821384
2 F( ]0 f# A1 V& i* B# W: t(Vector:92,Irql:8,SyncIrql:8,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:atapi!ScsiPortInterrupt(bff892be))$ g" U3 ~# Y }
93: 8185ed64
5 \- U% T+ _( E1 V(Vector:93,Irql:8,SyncIrql:8,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:uhcd!UHCD_InterruptService(f3f0253e))
& U: _+ [# f& Y: o# j, oa3: 8186cdc4
- a- j' e; X$ h' u% e5 n* O(Vector:a3,Irql:9,SyncIrql:9,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:SCSIPORT!ScsiPortInterrupt(bff719f0))
7 K1 u. U; M& E9 W' @b1: 818902e4
) E: a) X& F) C# v: A% z+ N+ b(Vector:b1,Irql:a,SyncIrql:a,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:ACPI!ACPIInterruptServiceRoutine(bffe14b4))
1 _4 p/ |. n4 _% n' cb3: 81881664
2 k; o ^( d6 Q, A( O: @(Vector:b3,Irql:a,SyncIrql:a,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:i8042prt!I8042KeyboardInterruptService(f3c51918))2 E2 b1 Q* D8 f) [) R
c1: 800642fc (hal!HalpBroadcastCallService)* B. F0 }" P$ g) M
d1: 80063964 (hal!HalpClockInterrupt)
- j9 a' @$ ]& R5 R: `$ v: V8 Ie1: 80064858 (hal!HalpIpiHandler)
% J8 e r; ?+ t1 [; d( i% ~e3: 800645d4 (hal!HalpLocalApicErrorService)6 D* w4 [9 M0 [, K4 |
fd: 80064d64 (hal!HalpProfileInterrupt)9 ?9 L, d/ J" p8 X
fe: 80064eec (hal!HalpPerfInterrupt)
& ~8 J0 |, `/ x5 H% j6 v8 o
& S d; V% r Q/ M7 e' T象a3、b1这类输出内容很多的是被硬件注册的中断向量,而象d1、e3这种输出内容少的是注册为了的HAL内部使用的中断向量和本地APIC中断向量
" C+ q7 H2 u' X- r% g2 b/ n8 h
, A# T1 U. d- F: M+ T这是几个重要的数组:3 N/ s; {& E' E# v* o3 L3 s
( u: ?* T6 N3 | G6 xHalVectorToIrql(这个数组是以向量除于16做索引):+ ~3 P$ ~+ _$ \, o
8006a304 00 ff ff 01 02 04 05 06-07 08 09 0a 1b 1c 1d 1e% a" J3 {0 ~' L6 e" t
( L* I. v f2 _& B# |
HalpIRQLtoTPR:
' T& j+ i$ q% @1 y8006a1e4 00 3d 41 41 51 61 71 81-91 a1 b1 b1 b1 b1 b1 b1+ h# V" P5 V) S2 p' a3 e9 H+ H
8006a1f4 b1 b1 b1 b1 b1 b1 b1 b1-b1 b1 b1 c1 d1 e1 ef ff# K) y8 V2 u1 q$ G2 f0 Q7 H5 j! y
; ^( d6 c3 J0 Y3 W; b' [HalpINTItoVector:
2 h. ^3 Z" U/ x/ J& r8006ada0 00 b3 61 51 a2 b2 62 91-a1 b1 71 81 52 82 72 92
9 z' n |4 P+ {$ |! c M4 |8006adb0 00 a3 83 93 00 00 00 00-00 00 00 00 00 00 00 00+ j# X; V& Q) O+ F+ Z+ H, X6 D
3 R X% @- J, O
HalVectorToINTI:, ~7 N( B/ R7 y
8006a204 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
. ^2 q$ I9 D4 r f+ z0 b8006a214 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff, B( v" g5 g+ T
8006a224 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
$ l7 O9 q: D3 z7 k! [8006a234 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff* x: T1 N' X& C8 O
8006a244 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
+ G$ ?7 h8 V# ^0 y/ I( P! k8006a254 ff 03 0c ff ff ff ff ff-ff ff ff ff ff ff ff ff
! c$ c& ]( s. ^$ P8 s4 K. s: C A8 r8006a264 ff 02 06 ff ff ff ff ff-ff ff ff ff ff ff ff ff3 ]8 V. Z0 N2 ]# t" F$ S8 k0 u6 L0 J
8006a274 ff 0a 0e ff ff ff ff ff-ff ff ff ff ff ff ff ff
$ N$ k3 X" E4 j; ]8006a284 ff 0b 0d 12 ff ff ff ff-ff ff ff ff ff ff ff ff) R& S& V H: b9 b
8006a294 ff 07 0f 13 ff ff ff ff-ff ff ff ff ff ff ff ff
) h6 U; e8 L: A$ |8006a2a4 ff 08 04 11 ff ff ff ff-ff ff ff ff ff ff ff ff. E4 B4 n* D0 B& Q5 {# N
8006a2b4 ff 09 05 01 ff ff ff ff-ff ff ff ff ff ff ff ff m! m" Y; d, ~; x- |# m
8006a2c4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
, ^# ]3 R4 s1 Y8006a2d4 ff 08 ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
) J* n n3 m. ^! q" h9 D' o: e" r8006a2e4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff6 C6 E. u1 i- [; Y6 y0 Q6 P3 Q" F6 w5 O9 t
8006a2f4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff # r' }6 F; m: k9 y6 j
+ `) n7 B6 K+ ?$ F/ E8 M' m* ?/ i6 S* w9 b& u
vBucket:
/ ?, w8 ^% b' A2 z' M8006ae30 02 02 02 03 03 03 03
* d* b8 G' l' h3 x. d( Z3 [6 o) j5 s1 \ L m
举个例子来说明一下,在我虚拟机里SCSI Controller的IRQ是17(注意,已经大于16了),到重定向表中查找第17项,得到中断向量为0xa3,再看IDT,0xa3对应处理例程是SCSIPORT!ScsiPortInterrupt。
( c4 |6 o: m. v% l
- y: d# C* j# p* p0 P4 o9 @) n vBucket数组干啥用的?它就是用来分配新的向量。分配算法很简单,当要分配一个新的向量时,就在vBucket数组从右到左搜索最小的一个数i,该数对应在vBucket中索引为Index,新向量为(0x50+Index*16+i+1),新向量对应的IRQL为(4+i+1),同时会把vBucket中这个i加1,i不等大于16。象给出的这个vBucket,下一次计算时i=2, index=2。不过这些用于硬件的向量在IO系统初始化时调用HalpGetSystemInterruptVector分配好了,然后通过IoConnectInterrupt把IDT中注册的向量位置的例程注册为中断处理程序。这里并不是每个注册的向量都会对应中断处理程序,象上面给出的例子中,0xa1、0xa2、0xb1等向量就没有对应。
1 o* Y7 `+ `. Q$ {2 P6 q/ y! k7 G3 f& N: y0 @4 o6 Q
IRQL机制为内核同步提供了很大的便利,既对驱动开发者隐藏了底层中断机制,也方便了驱动开发者的内核同步。LINUX从2.5内核开始引进的软中断和任务队列等机制,很大程度上也来自windows这套机制的借鉴。
. [' ~, ~/ n- V& i# k7 ?; A& F" m# D8 ]) U# k/ I8 {# P5 t: r
终于考完试,解放了,呵呵。这个东西其实还有很多可写的,只是没空再深入去分析了。在未来的64位系统里,APIC这种基于中断引脚的机制很快也要被SAPIC这种基于消息的更强大的机制所取代 |
|