|
|
楼主 |
发表于 2008-2-27 14:35:05
|
显示全部楼层
从IRQ到IRQL(APIC版)
来自:http://www.nsfocus.net/index.php ... o=view&mid=2534
: L) E' o8 E$ A E- M3 Y& g8 p8 I9 @$ i
从IRQ到IRQL(APIC版)
# s0 G1 i! J7 B+ r
4 s7 F8 ?6 C% C" f1 \作者:SoBeIt& u H9 F) Y5 s, c z9 t! |9 z
出处:https://www.xfocus.net/bbs/index.php?act=ST&f=2&t=45502, y* ^+ a( \' O! q8 z) [( D
日期:2005-02-04
0 A7 t+ U* Z* r% s7 ^ e: m% U
* d' Y9 O# |8 Z! ^事实上,老久的PIC在很早以前就被淘汰了,取而代之的是APIC。由于APIC可以兼容PIC,所以在很多单处理器系统上我们看到的PIC实际是APIC的兼容PIC模式。APIC主要应用于多处理器操作系统,是为了解决IRQ太少和处理器间中断而产生的,当然,单处理器操作系统也可以使用APIC(不是模拟PIC)。APIC的HAL和PIC的HAL有很大的不同,很突出的一个特点就是APIC的HAL不用再象PIC的HAL那样虚拟一个中断控制器,IRQL的概念已经可以通过中断向量的形式被APIC支持。事实上,因为被APIC所支持,所以在APIC HAL里IRQL的实现比PIC HAL那样虚拟一个中断控制器要简单得多了。: d0 J, ^6 l- P
. u- d. c; Y$ r6 G1 D
现在来简单介绍一下APIC的结构(关于APIC详细的描述请参考《IA-32 Inel Architecture Software Developer's Manual Volume 3 Chapter 8》)。整个APIC系统由本地APIC、IO APIC和APIC串行总线组成(在Pentium 4和Xeon以后,APIC总线放到了系统总线中)组成。每个处理器中集成了一个本地APIC,而IO APIC是系统芯片组中一部分,APIC总线负责连接IO APIC和各个本地APIC。本地APIC接收该处理器产生的本地中断比如时钟中断,以及由该处理器产生的处理器间中断,并从APIC串行总线接收来自IO APIC的消息;IO APIC负责接收所有外部的硬件中断,并翻译成消息选择发给接收中断的处理器,以及从本地APIC接收处理器间中断消息。" a: {/ @. N5 u) {# b$ q8 c$ ^7 y
, F" K2 M L% X4 \
和PIC一样,控制本地APIC和IO APIC的方法是通过读写该单元中的相关寄存器。不过和PIC不一样的是,Intel把本地APIC和IO APIC的寄存器都映射到了物理地址空间,本地APIC默认映射到物理地址0xffe00000,IO APIC默认映射到物理地址0xfec00000。windows HAL再进一步把本地APIC映射到虚拟地址0xfffe0000,把IO APIC映射到虚拟地址0xffd06000,也就是说对该地址的读写实际就是对寄存器的读写,本地APIC里几个重要的寄存有EOI寄存器,任务优先级寄存器(TPR),处理器优先级寄存器(PPR),中断命令寄存器(ICR,64位),中断请求寄存器(IRR,256位,对应每个向量一位),中断在服务寄存器(ISR,256位)等。IO APIC里几个重要的寄存器有版本寄存器,I/O寄存器选择寄存器、I/O窗口寄存器(用要访问的I/O APIC寄存器的索引设置地址I/O寄存器选择寄存器,此时访问I/O窗口寄存器就是访问被选定的寄存器)还有很重要的是一个IO重定向表,每一个表项是一个64位寄存器,包括向量和目标模式、传输模式等相关位,每一个表项连接一条IRQ线,表项的数目随处理器的版本而不一样,在Pentium 4上为24个表项。表项的数目保存在IO APIC版本寄存器的[16:23]位。APIC系统支持255个中断向量,但Intel保留了0-15向量,可用的向量是16-255。并引进一个概念叫做任务优先级=中断向量/16,因为保留了16个向量,所以可用的优先级是2-15。当用一个指定的优先级设置本地APIC中的任务优先级寄存器TPR后,所有优先级低于TPR中优先级的中断都被屏蔽,是不是很象IRQL的机制?事实上,APIC HAL里的IRQL机制也就是靠着这个任务优先级寄存器得以实现。同一个任务优先级包括了16个中断向量,可以进一步细粒度地区分中断的优先级。) c' ]/ d+ Q2 o( g: v3 |
6 V9 l' A5 q4 W. u# _8 M1 L4 ] 在HAL里虽然HalBeginSystemInterrupt仍然是IRQL机制的发动引擎,但是因为有APIC的支持,它和其它共同实现IRQL的函数要比PIC HAL里对应的函数功能简单得多。HalBeginSystemInterrupt通过用IRQL做索引在HalpIRQLtoTPR数组中获取该IRQL对应的任务优先级,用该优先级设置任务优先级寄存器TPR,并把TPR中原先的任务优先级/16做为索引在HalpVectorToIRQL数组中获取对应的原先的IRQL然后返回。若IRQL是从低于DISPATCH_LEVEL提升到高于DISPATCH_LEVEL,还需要设置KPCR+0x95(0xffdff095)为DISPATCH_LEVEL(0x2),表示是从DISPATCH_LEVEL以下的级别提升IRQL。HalEndSystemInterrupt向本地APIC的EOI寄存发送0,表示中断结束,可以接收新中断。并还要判断要降到的IRQL是否小于DISPATCH_LEVEL,若小于则进一步判断KPCR+0x96(0xffdff096)是否置位,若置位则表示有DPC中断在等待(在IRQL高于DISPATCH_LEVEL被引发,然后等待直到IRQL降到低于DISPATCH_LEVEL),则将KPCR+0x95和KPCR+0x96清0后调用KiDispatchInterrupt响应DPC软中断。否则做的工作就是和HalBeginSystemInterrupt一样的过程:把要降到的IRQL转换成任务优先级设置TRP,并把久的任务优先级转成IRQL返回。KfRaiseIrql、KfLowerIrql之类的函数也是这么一回事,把当前IRQL转成任务优先级修改TPR,并把原先TPR的值转成原先的IRQL并返回。而现在软中断的产生也有了APIC支持,APIC通过产生一个发向自己的处理器间中断,就可以产生一个软中断,因为可以指定该中断的向量,所以软中断就可以区分优先级别,如APC_LEVEL、DISPATCH_LEVEL。产生软中断的函数一样还是HalRequestSoftwareInterrupt,该函数会先判断KPCR+0x95是否和要产生的软中断IRQL一样,若是的话则置位KPCR+0x96并返回,表示现在IRQL大于DISPATCH_LEVEL所以不处理DPC中断。否则以要产生的软中断的IRQL为索引从HalpIRQLtoTPRHAL取出对应任务优先级,并或上0x4000,表示是发向自身的固定处理间中断,并用该值设置中断命令寄存器ICW的低32位,然后读取中断命令寄存器ICW的低32位是否为0x1000,确定中断消息已经发送后就返回,这时候软中断已经产生。值得注意的是APIC HAL里没有HalEndSoftwareInterrupt这个函数。HAL为软中断的IRQL提供了一个固定的中断向量:
- I4 @/ b& d+ m* z7 @2 { O
" H0 B5 `# H( a0 w& J#define ZERO_VECTOR 0x00 // IRQL 00 6 H$ E5 b9 p7 o% E+ ~
#define APC_VECTOR 0x3D // IRQL 01) A3 o) s8 L+ h% a9 {
#define DPC_VECTOR 0x41 // IRQL 023 L( d2 u7 b! I$ z( M* Z* l! Z+ I
#define APIC_GENERIC_VECTOR 0xC1 // IRQL 27+ W) {4 |# Z( T* ]% i- M) z8 Q
#define APIC_CLOCK_VECTOR 0xD1 // IRQL 28' z* F9 E) T8 Q R
#define APIC_SYNCH_VECTOR 0xD1 // IRQL 282 f) A, ^* |# A: k
#define APIC_IPI_VECTOR 0xE1 // IRQL 291 u5 [! b7 E4 s( g; a
#define POWERFAIL_VECTOR 0xEF // IRQL 30% A- L1 t- H% f$ \0 ]" y4 [
#define APIC_PROFILE_VECTOR 0xFD // IRQL 31
0 R9 }- b% ?/ S, |% L$ ?; @7 _9 y J2 T! P" y. f8 ]
9 \- P+ t8 r- V8 D' H9 M1 U7 c u现在看一下一些重要的数据:
" h1 S/ x8 W5 d3 T' m3 ~( G& j) A) v* o
这是我写的代码输出的IO APIC重定向表内容:
/ P1 i$ X# j/ s
1 F# Q2 m* ~! K5 ?Redirect Table Index: 0x17
: b7 P( r# p. W( kRedirect Table[ 0]: ff
) e4 H) _- r- v/ aRedirect Table[ 1]: b3
- d4 L& L" p! g4 ~& wRedirect Table[ 2]: ff" E2 Z% a! @% @. \8 W) Z: A1 O
Redirect Table[ 3]: 51
5 U) z% i& ~* @0 E0 }, E4 ARedirect Table[ 4]: ff( f8 M& k, w! f* C" v
Redirect Table[ 5]: ff, E/ h% d' R% y4 i! d t
Redirect Table[ 6]: 62
n! d- o2 o0 kRedirect Table[ 7]: ff( C. G6 _* X3 C( M
Redirect Table[ 8]: d1" f9 W, H3 E2 t0 r% Q
Redirect Table[ 9]: b1
6 x" `6 L. j8 c0 D, GRedirect Table[ a]: ff7 Q" l$ D- X j7 j0 {
Redirect Table[ b]: ff4 F5 ^6 K) }1 r. T9 a6 z; w6 M) {
Redirect Table[ c]: 52
+ u4 P' J3 q' I6 x8 E" y5 yRedirect Table[ d]: ff# v8 m5 ?4 x$ Z% U+ @1 k/ A6 g
Redirect Table[ e]: ff- ^5 t: Q8 N M e8 }
Redirect Table[ f]: 92
8 R8 F, q4 T6 W* ?Redirect Table[10]: ff3 v! P! R- a* U" D$ y
Redirect Table[11]: a3
$ R* k0 t y% m4 H. kRedirect Table[12]: 83* A9 {% f2 t- B
Redirect Table[13]: 93
* p- i3 I; U0 d5 {5 l/ J2 MRedirect Table[14]: ff
6 L: R+ b1 h1 |/ e- e* wRedirect Table[15]: ff
( B- V9 F; H* L1 W- BRedirect Table[16]: ff" a2 b$ K, m' ^5 A4 B7 Y6 Q5 e
Redirect Table[17]: ff
, \ B: U1 j5 v, E0 f/ t
& w- I/ B2 \! `% l7 y+ V+ e& P这是IDT表中被注册的向量:
) ? M' i$ q( p# l: q! w9 a8 ~- T. j% H4 T/ x$ p. x1 X: Y3 B' F
1f: 80064908 (hal!HalpApicSpuriousService); u2 J. P$ x7 c
37: 800640b8 (hal!PicSpuriousService37)1 J. z# w0 j+ M) l$ w3 _( A
3d: 80065254 (hal!HalpApcInterrupt)
, B" S. m2 ^# o1 w# E41: 800650c8 (hal!HalpDispatchInterrupt)# k0 F9 w& E& |% ^2 a6 r
50: 80064190 (hal!HalpApicRebootService)
3 |9 V5 J) }8 t0 J; [51: 817f59e4
7 H- V. i- d. d6 A9 {! s# \1 f(Vector:51,Irql:4,SyncIrql:4,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:serial!SerialCIsrSw(f3c607c7))+ W! P. |9 L* ?, L8 K
52: 817f5044
' }- b1 ?2 }" j! d+ i" b) D(Vector:52,Irql:4,SyncIrql:a,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:i8042prt!I8042MouseInterruptService(f3c57a2c))
4 p" G- g9 N6 l. l83: 817d2d44 " U+ n0 K& u1 K6 \( \
(Vector:83,Irql:7,SyncIrql:7,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:NDIS!ndisMIsr(bff1b794))
" U5 u' n1 M/ s/ f! y4 a! n92: 81821384
# P+ @& F! P* o7 u(Vector:92,Irql:8,SyncIrql:8,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:atapi!ScsiPortInterrupt(bff892be))4 h' G# v+ H: J( ]9 y
93: 8185ed64
5 x+ b' h j- y- i [4 W(Vector:93,Irql:8,SyncIrql:8,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:uhcd!UHCD_InterruptService(f3f0253e))
, J( F3 P) V8 xa3: 8186cdc4 ; A5 C5 F. G$ i) w8 R' y; q
(Vector:a3,Irql:9,SyncIrql:9,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:SCSIPORT!ScsiPortInterrupt(bff719f0))
5 ?+ M: E: m' G0 n& x( |& l& wb1: 818902e4 - @6 P3 Z" I& T
(Vector:b1,Irql:a,SyncIrql:a,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:ACPI!ACPIInterruptServiceRoutine(bffe14b4))/ i; g! W: c- }/ v( l/ L/ Z
b3: 81881664
0 P* W$ }3 Q% B- U5 Y: Z(Vector:b3,Irql:a,SyncIrql:a,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:i8042prt!I8042KeyboardInterruptService(f3c51918))5 C/ J% e. R$ q7 y5 Z* J
c1: 800642fc (hal!HalpBroadcastCallService)
* {0 M9 v; D( e; Ld1: 80063964 (hal!HalpClockInterrupt)
0 E7 l+ R8 G8 v" S: ee1: 80064858 (hal!HalpIpiHandler)
. a4 z$ x5 ?( ]0 c2 Z8 A. ~6 q( Qe3: 800645d4 (hal!HalpLocalApicErrorService)
1 \. ]5 q" Y! Cfd: 80064d64 (hal!HalpProfileInterrupt)$ x x0 h7 S4 C. E- l7 V, f
fe: 80064eec (hal!HalpPerfInterrupt)+ Q Q4 a+ e4 W* t% c+ W" j
) p+ z/ I/ _1 z& X9 }$ K7 {( A+ c象a3、b1这类输出内容很多的是被硬件注册的中断向量,而象d1、e3这种输出内容少的是注册为了的HAL内部使用的中断向量和本地APIC中断向量
7 B5 d3 Y t& |; G- L
. A1 M. M6 F2 _. g0 C$ |" n这是几个重要的数组: s/ _) i( `2 v& F" m4 u1 n1 [+ @
5 j* r5 S: }8 aHalVectorToIrql(这个数组是以向量除于16做索引):
2 v6 T1 p8 l M, z9 D% G9 J8006a304 00 ff ff 01 02 04 05 06-07 08 09 0a 1b 1c 1d 1e: Z7 U* ]: a- K/ ?$ k1 t
9 F, C) W- D6 `" t5 {/ CHalpIRQLtoTPR:9 O1 k0 P7 F' X7 g& m; g, g7 b% B9 I
8006a1e4 00 3d 41 41 51 61 71 81-91 a1 b1 b1 b1 b1 b1 b1
/ T; c9 N# {/ h8006a1f4 b1 b1 b1 b1 b1 b1 b1 b1-b1 b1 b1 c1 d1 e1 ef ff# V( r, a8 T* T9 q
+ F5 x+ [# T* W5 T! B
HalpINTItoVector:+ n8 |% V R& a9 j+ P( u
8006ada0 00 b3 61 51 a2 b2 62 91-a1 b1 71 81 52 82 72 922 c2 n+ Y7 O% K4 k
8006adb0 00 a3 83 93 00 00 00 00-00 00 00 00 00 00 00 00, q3 C# ?6 i2 J5 e R5 _
. n2 t+ ^" x0 \, q9 \2 @; r0 EHalVectorToINTI:
: _/ S. U! k, q4 {, ~) \( X I7 _8 [8006a204 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff$ x. B0 J2 p) A/ }6 O
8006a214 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
5 `8 Z0 l. W% {* }5 M8006a224 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
, G6 p% ~2 l2 i2 R8006a234 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
( p0 z6 F) P9 _4 L+ n! \& r8006a244 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff% p5 w: Q7 f$ [) D& W" ?
8006a254 ff 03 0c ff ff ff ff ff-ff ff ff ff ff ff ff ff z) V" A! F# Q# ~
8006a264 ff 02 06 ff ff ff ff ff-ff ff ff ff ff ff ff ff
# j: ~. w7 J- Q; I8006a274 ff 0a 0e ff ff ff ff ff-ff ff ff ff ff ff ff ff
- M$ H j- b0 Z* a8 |( a8006a284 ff 0b 0d 12 ff ff ff ff-ff ff ff ff ff ff ff ff
- m" F6 p; F7 Y- [* h8006a294 ff 07 0f 13 ff ff ff ff-ff ff ff ff ff ff ff ff& p; P8 H E% {+ m
8006a2a4 ff 08 04 11 ff ff ff ff-ff ff ff ff ff ff ff ff
7 G2 q, k1 J) z4 x% J- i8006a2b4 ff 09 05 01 ff ff ff ff-ff ff ff ff ff ff ff ff) Z f8 v: }% e$ b
8006a2c4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff- U. k- y4 d% l
8006a2d4 ff 08 ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
& H' ^, `% F7 t6 [. g8006a2e4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
( Z' J, X7 b; L& _8006a2f4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ! J, N/ M I( h) \/ {2 s
/ k& {) f! O/ J. a0 s1 S
( u$ E9 @ A c. BvBucket:& [/ a" J+ K' W" z0 X% @
8006ae30 02 02 02 03 03 03 03
2 |; y# t$ H, E8 s0 }. i
/ z/ Z: o8 S& y- P4 g S 举个例子来说明一下,在我虚拟机里SCSI Controller的IRQ是17(注意,已经大于16了),到重定向表中查找第17项,得到中断向量为0xa3,再看IDT,0xa3对应处理例程是SCSIPORT!ScsiPortInterrupt。
5 N5 b5 s# g7 z2 t: W, Z* p
2 ?3 A# M+ r9 u/ [6 G0 x vBucket数组干啥用的?它就是用来分配新的向量。分配算法很简单,当要分配一个新的向量时,就在vBucket数组从右到左搜索最小的一个数i,该数对应在vBucket中索引为Index,新向量为(0x50+Index*16+i+1),新向量对应的IRQL为(4+i+1),同时会把vBucket中这个i加1,i不等大于16。象给出的这个vBucket,下一次计算时i=2, index=2。不过这些用于硬件的向量在IO系统初始化时调用HalpGetSystemInterruptVector分配好了,然后通过IoConnectInterrupt把IDT中注册的向量位置的例程注册为中断处理程序。这里并不是每个注册的向量都会对应中断处理程序,象上面给出的例子中,0xa1、0xa2、0xb1等向量就没有对应。
$ i6 H4 ~/ ^9 X! ^3 {. b7 ^' @1 ^& \; ]. `0 a6 d
IRQL机制为内核同步提供了很大的便利,既对驱动开发者隐藏了底层中断机制,也方便了驱动开发者的内核同步。LINUX从2.5内核开始引进的软中断和任务队列等机制,很大程度上也来自windows这套机制的借鉴。7 p/ v) ]) Z4 [5 i0 W. C
6 i1 _5 p7 c+ B, E- P) M" a 终于考完试,解放了,呵呵。这个东西其实还有很多可写的,只是没空再深入去分析了。在未来的64位系统里,APIC这种基于中断引脚的机制很快也要被SAPIC这种基于消息的更强大的机制所取代 |
|