|
|
楼主 |
发表于 2008-2-27 14:35:05
|
显示全部楼层
从IRQ到IRQL(APIC版)
来自:http://www.nsfocus.net/index.php ... o=view&mid=2534
. |4 ?0 r# W' N2 ^3 \; |, h$ d; _$ q+ H0 n) r( C" o
从IRQ到IRQL(APIC版)) S& b, n# \6 ^& K
4 z z1 Y( u+ \4 S3 {' U6 q! u/ C
作者:SoBeIt
2 I$ o8 {, |% ~) R( E出处:https://www.xfocus.net/bbs/index.php?act=ST&f=2&t=45502! g4 |5 z, k0 h4 X3 \# O" h1 }3 D
日期:2005-02-04
% }+ Z7 d# Z5 V- l) G6 v2 L7 |' v
事实上,老久的PIC在很早以前就被淘汰了,取而代之的是APIC。由于APIC可以兼容PIC,所以在很多单处理器系统上我们看到的PIC实际是APIC的兼容PIC模式。APIC主要应用于多处理器操作系统,是为了解决IRQ太少和处理器间中断而产生的,当然,单处理器操作系统也可以使用APIC(不是模拟PIC)。APIC的HAL和PIC的HAL有很大的不同,很突出的一个特点就是APIC的HAL不用再象PIC的HAL那样虚拟一个中断控制器,IRQL的概念已经可以通过中断向量的形式被APIC支持。事实上,因为被APIC所支持,所以在APIC HAL里IRQL的实现比PIC HAL那样虚拟一个中断控制器要简单得多了。 V$ x# ~4 F3 P8 b
9 s: A* C: m- f9 M( L4 w! T 现在来简单介绍一下APIC的结构(关于APIC详细的描述请参考《IA-32 Inel Architecture Software Developer's Manual Volume 3 Chapter 8》)。整个APIC系统由本地APIC、IO APIC和APIC串行总线组成(在Pentium 4和Xeon以后,APIC总线放到了系统总线中)组成。每个处理器中集成了一个本地APIC,而IO APIC是系统芯片组中一部分,APIC总线负责连接IO APIC和各个本地APIC。本地APIC接收该处理器产生的本地中断比如时钟中断,以及由该处理器产生的处理器间中断,并从APIC串行总线接收来自IO APIC的消息;IO APIC负责接收所有外部的硬件中断,并翻译成消息选择发给接收中断的处理器,以及从本地APIC接收处理器间中断消息。1 c3 j; ~+ L. y& R' F& S: F
) P* @9 M( e* T9 ]5 D# ^' p) Y
和PIC一样,控制本地APIC和IO APIC的方法是通过读写该单元中的相关寄存器。不过和PIC不一样的是,Intel把本地APIC和IO APIC的寄存器都映射到了物理地址空间,本地APIC默认映射到物理地址0xffe00000,IO APIC默认映射到物理地址0xfec00000。windows HAL再进一步把本地APIC映射到虚拟地址0xfffe0000,把IO APIC映射到虚拟地址0xffd06000,也就是说对该地址的读写实际就是对寄存器的读写,本地APIC里几个重要的寄存有EOI寄存器,任务优先级寄存器(TPR),处理器优先级寄存器(PPR),中断命令寄存器(ICR,64位),中断请求寄存器(IRR,256位,对应每个向量一位),中断在服务寄存器(ISR,256位)等。IO APIC里几个重要的寄存器有版本寄存器,I/O寄存器选择寄存器、I/O窗口寄存器(用要访问的I/O APIC寄存器的索引设置地址I/O寄存器选择寄存器,此时访问I/O窗口寄存器就是访问被选定的寄存器)还有很重要的是一个IO重定向表,每一个表项是一个64位寄存器,包括向量和目标模式、传输模式等相关位,每一个表项连接一条IRQ线,表项的数目随处理器的版本而不一样,在Pentium 4上为24个表项。表项的数目保存在IO APIC版本寄存器的[16:23]位。APIC系统支持255个中断向量,但Intel保留了0-15向量,可用的向量是16-255。并引进一个概念叫做任务优先级=中断向量/16,因为保留了16个向量,所以可用的优先级是2-15。当用一个指定的优先级设置本地APIC中的任务优先级寄存器TPR后,所有优先级低于TPR中优先级的中断都被屏蔽,是不是很象IRQL的机制?事实上,APIC HAL里的IRQL机制也就是靠着这个任务优先级寄存器得以实现。同一个任务优先级包括了16个中断向量,可以进一步细粒度地区分中断的优先级。
( G$ Z; [7 E/ S& e; d. Z# d0 J. T/ a& D- I+ G) ~" J, F! w
在HAL里虽然HalBeginSystemInterrupt仍然是IRQL机制的发动引擎,但是因为有APIC的支持,它和其它共同实现IRQL的函数要比PIC HAL里对应的函数功能简单得多。HalBeginSystemInterrupt通过用IRQL做索引在HalpIRQLtoTPR数组中获取该IRQL对应的任务优先级,用该优先级设置任务优先级寄存器TPR,并把TPR中原先的任务优先级/16做为索引在HalpVectorToIRQL数组中获取对应的原先的IRQL然后返回。若IRQL是从低于DISPATCH_LEVEL提升到高于DISPATCH_LEVEL,还需要设置KPCR+0x95(0xffdff095)为DISPATCH_LEVEL(0x2),表示是从DISPATCH_LEVEL以下的级别提升IRQL。HalEndSystemInterrupt向本地APIC的EOI寄存发送0,表示中断结束,可以接收新中断。并还要判断要降到的IRQL是否小于DISPATCH_LEVEL,若小于则进一步判断KPCR+0x96(0xffdff096)是否置位,若置位则表示有DPC中断在等待(在IRQL高于DISPATCH_LEVEL被引发,然后等待直到IRQL降到低于DISPATCH_LEVEL),则将KPCR+0x95和KPCR+0x96清0后调用KiDispatchInterrupt响应DPC软中断。否则做的工作就是和HalBeginSystemInterrupt一样的过程:把要降到的IRQL转换成任务优先级设置TRP,并把久的任务优先级转成IRQL返回。KfRaiseIrql、KfLowerIrql之类的函数也是这么一回事,把当前IRQL转成任务优先级修改TPR,并把原先TPR的值转成原先的IRQL并返回。而现在软中断的产生也有了APIC支持,APIC通过产生一个发向自己的处理器间中断,就可以产生一个软中断,因为可以指定该中断的向量,所以软中断就可以区分优先级别,如APC_LEVEL、DISPATCH_LEVEL。产生软中断的函数一样还是HalRequestSoftwareInterrupt,该函数会先判断KPCR+0x95是否和要产生的软中断IRQL一样,若是的话则置位KPCR+0x96并返回,表示现在IRQL大于DISPATCH_LEVEL所以不处理DPC中断。否则以要产生的软中断的IRQL为索引从HalpIRQLtoTPRHAL取出对应任务优先级,并或上0x4000,表示是发向自身的固定处理间中断,并用该值设置中断命令寄存器ICW的低32位,然后读取中断命令寄存器ICW的低32位是否为0x1000,确定中断消息已经发送后就返回,这时候软中断已经产生。值得注意的是APIC HAL里没有HalEndSoftwareInterrupt这个函数。HAL为软中断的IRQL提供了一个固定的中断向量:2 Z: i9 X- t' S" i% C' u! m
+ a9 c+ t8 W' G! J! F" d, M5 T$ I+ {# `2 A#define ZERO_VECTOR 0x00 // IRQL 00 F7 W& g* R7 M% m$ K* u* l
#define APC_VECTOR 0x3D // IRQL 01% U0 g1 r6 O) m, f' @9 S+ U
#define DPC_VECTOR 0x41 // IRQL 02
4 p" h+ q r% k0 G#define APIC_GENERIC_VECTOR 0xC1 // IRQL 274 e' i: C; g: P( F! l! z
#define APIC_CLOCK_VECTOR 0xD1 // IRQL 28( {: t% v& F+ Z/ ~$ m$ w: G$ D0 d
#define APIC_SYNCH_VECTOR 0xD1 // IRQL 28
. a3 ?) e% L9 G3 C#define APIC_IPI_VECTOR 0xE1 // IRQL 29
, r# @( J, I& A) m& K9 q#define POWERFAIL_VECTOR 0xEF // IRQL 30, r" a; X% V h' v4 }' Z$ A
#define APIC_PROFILE_VECTOR 0xFD // IRQL 31
" q# D1 s0 `$ f+ J
0 _) ^+ O( ]# U/ h4 Q4 L. q: [0 {1 \3 @
现在看一下一些重要的数据: \' r& r$ p: [7 y' S* D$ x
5 e, ]0 w4 h, c. A4 `% l+ T这是我写的代码输出的IO APIC重定向表内容:
0 g' Q. L @& l) Q! M2 N/ A& C6 H4 ~$ ?0 ?* e
Redirect Table Index: 0x172 H0 q! b0 |+ _
Redirect Table[ 0]: ff
! f( @6 w4 O0 a6 ]" B* ?4 u! @8 B2 {Redirect Table[ 1]: b3
+ f/ E! w5 B% DRedirect Table[ 2]: ff5 m: d) s, h% n# J3 p% Q0 q; m9 W
Redirect Table[ 3]: 519 C, h( }* _$ h9 W) L9 L) J) ?
Redirect Table[ 4]: ff
x3 u q% R! WRedirect Table[ 5]: ff
! h9 }8 g8 l/ gRedirect Table[ 6]: 62; r6 n3 Z. L% @& C# _, d9 W
Redirect Table[ 7]: ff
0 l# E+ E* K" R! L3 a3 FRedirect Table[ 8]: d1* K: c1 z8 ^- o% i4 P
Redirect Table[ 9]: b1! ?8 w4 v* k2 C# n) n8 e& _
Redirect Table[ a]: ff
5 l9 i5 c; w- z1 B: p7 l. {Redirect Table[ b]: ff: {( M5 G0 D9 @6 v
Redirect Table[ c]: 52
# Z) k0 |7 h- ]4 yRedirect Table[ d]: ff/ o0 I# z2 n, Z0 f+ \- P" L1 D
Redirect Table[ e]: ff
/ ~; b3 q1 ]: K' s5 lRedirect Table[ f]: 92
6 `& o+ e Q6 Z2 u% F9 yRedirect Table[10]: ff
6 B& ]* Y6 y; |/ R n+ DRedirect Table[11]: a34 P/ [7 p* k' H8 a: _
Redirect Table[12]: 83
; Q4 e5 w }' t6 g% |Redirect Table[13]: 93
! {7 h- K" Z/ n" x& K. E/ fRedirect Table[14]: ff7 ~# }6 x; l0 v$ [
Redirect Table[15]: ff- @$ p D+ e1 G1 `4 c
Redirect Table[16]: ff
" n4 A4 K/ ^8 F& S# c% }3 CRedirect Table[17]: ff
# m4 D) e$ x. f7 P0 J6 W6 t; {( G% H/ k
这是IDT表中被注册的向量:
8 @/ D) W# y8 V7 e* m/ _! R) G& ]0 {$ \8 ~5 o9 I
1f: 80064908 (hal!HalpApicSpuriousService)
, u/ C* }$ E* \5 S37: 800640b8 (hal!PicSpuriousService37)" E5 c+ n/ P) o2 F9 @
3d: 80065254 (hal!HalpApcInterrupt)
# L1 p7 x9 w7 r# S5 h1 D41: 800650c8 (hal!HalpDispatchInterrupt)) }$ T" P9 g x2 n4 d
50: 80064190 (hal!HalpApicRebootService)( \3 y5 @% x5 w
51: 817f59e47 k7 E# i+ N0 Q+ c8 D! j
(Vector:51,Irql:4,SyncIrql:4,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:serial!SerialCIsrSw(f3c607c7))9 N* d# O. {1 k, B& b
52: 817f5044 - ]$ y5 O6 q& E# S
(Vector:52,Irql:4,SyncIrql:a,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:i8042prt!I8042MouseInterruptService(f3c57a2c))' f$ d6 ^ X& q1 m: A5 X
83: 817d2d44
: {1 L n* c. m2 O" J+ J(Vector:83,Irql:7,SyncIrql:7,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:NDIS!ndisMIsr(bff1b794))' Y' o7 j- J% n3 }. n1 p( _
92: 81821384 5 ?. q$ V) C- U" z& \8 D, p
(Vector:92,Irql:8,SyncIrql:8,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:atapi!ScsiPortInterrupt(bff892be))
) f g4 P6 ^, N/ K2 t93: 8185ed64
$ j D# I: Y/ H# h: ? O* U(Vector:93,Irql:8,SyncIrql:8,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:uhcd!UHCD_InterruptService(f3f0253e)) s4 F T3 {2 D# A/ Z
a3: 8186cdc4
0 s+ z$ e5 e8 F$ n; b9 f(Vector:a3,Irql:9,SyncIrql:9,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:SCSIPORT!ScsiPortInterrupt(bff719f0))
4 a" p2 S. ]4 Q& K% Q8 Yb1: 818902e4
5 ~/ x9 z) `: p) B* N, P(Vector:b1,Irql:a,SyncIrql:a,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:ACPI!ACPIInterruptServiceRoutine(bffe14b4))
, T( i ^( w6 g7 L4 `3 Vb3: 81881664
: W0 p' ^2 t% f% a4 I(Vector:b3,Irql:a,SyncIrql:a,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:i8042prt!I8042KeyboardInterruptService(f3c51918))* k# z9 k1 c' S& q% e
c1: 800642fc (hal!HalpBroadcastCallService)% h4 L( E. i' Z# X- y, F, R4 {; o
d1: 80063964 (hal!HalpClockInterrupt)
" k# L1 g$ n: a0 T, oe1: 80064858 (hal!HalpIpiHandler)
+ Z# |. w* Z w, @- R; |/ |e3: 800645d4 (hal!HalpLocalApicErrorService)+ e% D% ~' o9 [0 i: k# R
fd: 80064d64 (hal!HalpProfileInterrupt)
" l' ^* ^& E( }8 H/ }fe: 80064eec (hal!HalpPerfInterrupt)
7 {; M6 x- N$ ^% \
) \4 Z2 M7 A) ]' G象a3、b1这类输出内容很多的是被硬件注册的中断向量,而象d1、e3这种输出内容少的是注册为了的HAL内部使用的中断向量和本地APIC中断向量
7 u1 E7 b) E5 M) `' t) T! W) t: t- K X
这是几个重要的数组:
2 |4 c1 Z6 s3 `6 P* j3 {: u& ^2 V3 Y1 Y9 Q
HalVectorToIrql(这个数组是以向量除于16做索引):
8 t7 X7 C [/ B) `) w8006a304 00 ff ff 01 02 04 05 06-07 08 09 0a 1b 1c 1d 1e
! w/ E0 \5 E4 `. w0 ]" J+ }. ?
- I; o/ v8 U# E! l. rHalpIRQLtoTPR:
+ s/ A9 M4 S* i8006a1e4 00 3d 41 41 51 61 71 81-91 a1 b1 b1 b1 b1 b1 b1) \, A8 n) J+ y7 L$ s4 M. x% z
8006a1f4 b1 b1 b1 b1 b1 b1 b1 b1-b1 b1 b1 c1 d1 e1 ef ff* }0 c( h6 a% _7 i
+ h1 ^( E+ D2 }
HalpINTItoVector:
+ `- A, M m( T u& J8006ada0 00 b3 61 51 a2 b2 62 91-a1 b1 71 81 52 82 72 92* ^# c( y' f. Q; ?% z* J- P
8006adb0 00 a3 83 93 00 00 00 00-00 00 00 00 00 00 00 00 r4 X, X2 {* G8 m8 ]
3 k$ s8 A5 t+ O, q VHalVectorToINTI:9 ~8 H3 t- Z# H. g5 y2 q0 V+ i
8006a204 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff0 D1 K' j5 _& x# T% A) |5 O
8006a214 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff2 L0 i& u' I! E2 H0 s
8006a224 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff. m" v9 ~- m/ Q( N. f. z7 t/ Q
8006a234 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff- Q: Q0 `# j4 |6 l0 q
8006a244 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
9 m0 l1 |9 _( s7 {( s* I8006a254 ff 03 0c ff ff ff ff ff-ff ff ff ff ff ff ff ff
3 M8 _; O) z; v' ~- i8006a264 ff 02 06 ff ff ff ff ff-ff ff ff ff ff ff ff ff
& J3 x7 @, V _" U2 i5 g: m8006a274 ff 0a 0e ff ff ff ff ff-ff ff ff ff ff ff ff ff
' x; V' t; P }$ v2 w& R) a2 d8006a284 ff 0b 0d 12 ff ff ff ff-ff ff ff ff ff ff ff ff
: R- b+ k/ T& X. o' g1 m! _0 G8006a294 ff 07 0f 13 ff ff ff ff-ff ff ff ff ff ff ff ff
! m5 a/ a! Z$ u8006a2a4 ff 08 04 11 ff ff ff ff-ff ff ff ff ff ff ff ff
2 R6 ~7 B2 c3 I1 g- a8006a2b4 ff 09 05 01 ff ff ff ff-ff ff ff ff ff ff ff ff; z" U* m" \3 b U
8006a2c4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff B8 N( |* b7 ~4 x
8006a2d4 ff 08 ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
`4 O8 F* R$ k' a c$ l8006a2e4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
% |2 }2 _$ `, U8006a2f4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff
( A. G9 S0 ^: U# d6 T' F8 i# w% b2 d. N
# i( W9 t* |* x( \ j, ivBucket:
! ~' z8 Y4 B" H8006ae30 02 02 02 03 03 03 03
7 d1 L. X4 C" Q p+ }" _
V2 ^& w: w: z! L0 d. o0 e 举个例子来说明一下,在我虚拟机里SCSI Controller的IRQ是17(注意,已经大于16了),到重定向表中查找第17项,得到中断向量为0xa3,再看IDT,0xa3对应处理例程是SCSIPORT!ScsiPortInterrupt。0 R/ w3 }3 z p* K: O" k, |9 |
# r$ n9 |. B1 x! d vBucket数组干啥用的?它就是用来分配新的向量。分配算法很简单,当要分配一个新的向量时,就在vBucket数组从右到左搜索最小的一个数i,该数对应在vBucket中索引为Index,新向量为(0x50+Index*16+i+1),新向量对应的IRQL为(4+i+1),同时会把vBucket中这个i加1,i不等大于16。象给出的这个vBucket,下一次计算时i=2, index=2。不过这些用于硬件的向量在IO系统初始化时调用HalpGetSystemInterruptVector分配好了,然后通过IoConnectInterrupt把IDT中注册的向量位置的例程注册为中断处理程序。这里并不是每个注册的向量都会对应中断处理程序,象上面给出的例子中,0xa1、0xa2、0xb1等向量就没有对应。3 Z& i& q- S+ B8 ^1 n
6 M! e' b9 K# x" z3 `( @) A: z IRQL机制为内核同步提供了很大的便利,既对驱动开发者隐藏了底层中断机制,也方便了驱动开发者的内核同步。LINUX从2.5内核开始引进的软中断和任务队列等机制,很大程度上也来自windows这套机制的借鉴。
" }% I7 c! g+ G
: f# F3 |/ j% H" H, h- ^4 O& _ 终于考完试,解放了,呵呵。这个东西其实还有很多可写的,只是没空再深入去分析了。在未来的64位系统里,APIC这种基于中断引脚的机制很快也要被SAPIC这种基于消息的更强大的机制所取代 |
|