|
|
楼主 |
发表于 2008-2-27 14:35:05
|
显示全部楼层
从IRQ到IRQL(APIC版)
来自:http://www.nsfocus.net/index.php ... o=view&mid=2534
( [% F5 U U% t% D2 B @0 d3 S, L" _# o( A7 M) ?" P
从IRQ到IRQL(APIC版)
( Y0 \6 c; C1 J" F8 w; h: m {% k5 v$ v
作者:SoBeIt1 u6 { c: A) e+ X9 W! ?! R6 M( V; y
出处:https://www.xfocus.net/bbs/index.php?act=ST&f=2&t=45502! n" P7 _) U L
日期:2005-02-04
: @( Y# F+ ?# B7 K/ c! T$ O" Y6 `& l9 s; M
事实上,老久的PIC在很早以前就被淘汰了,取而代之的是APIC。由于APIC可以兼容PIC,所以在很多单处理器系统上我们看到的PIC实际是APIC的兼容PIC模式。APIC主要应用于多处理器操作系统,是为了解决IRQ太少和处理器间中断而产生的,当然,单处理器操作系统也可以使用APIC(不是模拟PIC)。APIC的HAL和PIC的HAL有很大的不同,很突出的一个特点就是APIC的HAL不用再象PIC的HAL那样虚拟一个中断控制器,IRQL的概念已经可以通过中断向量的形式被APIC支持。事实上,因为被APIC所支持,所以在APIC HAL里IRQL的实现比PIC HAL那样虚拟一个中断控制器要简单得多了。
4 s& e! C! T% n0 L& W% I9 ^
" x; H5 n& [7 j- b3 x 现在来简单介绍一下APIC的结构(关于APIC详细的描述请参考《IA-32 Inel Architecture Software Developer's Manual Volume 3 Chapter 8》)。整个APIC系统由本地APIC、IO APIC和APIC串行总线组成(在Pentium 4和Xeon以后,APIC总线放到了系统总线中)组成。每个处理器中集成了一个本地APIC,而IO APIC是系统芯片组中一部分,APIC总线负责连接IO APIC和各个本地APIC。本地APIC接收该处理器产生的本地中断比如时钟中断,以及由该处理器产生的处理器间中断,并从APIC串行总线接收来自IO APIC的消息;IO APIC负责接收所有外部的硬件中断,并翻译成消息选择发给接收中断的处理器,以及从本地APIC接收处理器间中断消息。: o7 s0 x n/ T
' F- Q$ R1 Z: A
和PIC一样,控制本地APIC和IO APIC的方法是通过读写该单元中的相关寄存器。不过和PIC不一样的是,Intel把本地APIC和IO APIC的寄存器都映射到了物理地址空间,本地APIC默认映射到物理地址0xffe00000,IO APIC默认映射到物理地址0xfec00000。windows HAL再进一步把本地APIC映射到虚拟地址0xfffe0000,把IO APIC映射到虚拟地址0xffd06000,也就是说对该地址的读写实际就是对寄存器的读写,本地APIC里几个重要的寄存有EOI寄存器,任务优先级寄存器(TPR),处理器优先级寄存器(PPR),中断命令寄存器(ICR,64位),中断请求寄存器(IRR,256位,对应每个向量一位),中断在服务寄存器(ISR,256位)等。IO APIC里几个重要的寄存器有版本寄存器,I/O寄存器选择寄存器、I/O窗口寄存器(用要访问的I/O APIC寄存器的索引设置地址I/O寄存器选择寄存器,此时访问I/O窗口寄存器就是访问被选定的寄存器)还有很重要的是一个IO重定向表,每一个表项是一个64位寄存器,包括向量和目标模式、传输模式等相关位,每一个表项连接一条IRQ线,表项的数目随处理器的版本而不一样,在Pentium 4上为24个表项。表项的数目保存在IO APIC版本寄存器的[16:23]位。APIC系统支持255个中断向量,但Intel保留了0-15向量,可用的向量是16-255。并引进一个概念叫做任务优先级=中断向量/16,因为保留了16个向量,所以可用的优先级是2-15。当用一个指定的优先级设置本地APIC中的任务优先级寄存器TPR后,所有优先级低于TPR中优先级的中断都被屏蔽,是不是很象IRQL的机制?事实上,APIC HAL里的IRQL机制也就是靠着这个任务优先级寄存器得以实现。同一个任务优先级包括了16个中断向量,可以进一步细粒度地区分中断的优先级。
3 J: q0 B1 d; W1 `
; E1 R D" S6 M1 K 在HAL里虽然HalBeginSystemInterrupt仍然是IRQL机制的发动引擎,但是因为有APIC的支持,它和其它共同实现IRQL的函数要比PIC HAL里对应的函数功能简单得多。HalBeginSystemInterrupt通过用IRQL做索引在HalpIRQLtoTPR数组中获取该IRQL对应的任务优先级,用该优先级设置任务优先级寄存器TPR,并把TPR中原先的任务优先级/16做为索引在HalpVectorToIRQL数组中获取对应的原先的IRQL然后返回。若IRQL是从低于DISPATCH_LEVEL提升到高于DISPATCH_LEVEL,还需要设置KPCR+0x95(0xffdff095)为DISPATCH_LEVEL(0x2),表示是从DISPATCH_LEVEL以下的级别提升IRQL。HalEndSystemInterrupt向本地APIC的EOI寄存发送0,表示中断结束,可以接收新中断。并还要判断要降到的IRQL是否小于DISPATCH_LEVEL,若小于则进一步判断KPCR+0x96(0xffdff096)是否置位,若置位则表示有DPC中断在等待(在IRQL高于DISPATCH_LEVEL被引发,然后等待直到IRQL降到低于DISPATCH_LEVEL),则将KPCR+0x95和KPCR+0x96清0后调用KiDispatchInterrupt响应DPC软中断。否则做的工作就是和HalBeginSystemInterrupt一样的过程:把要降到的IRQL转换成任务优先级设置TRP,并把久的任务优先级转成IRQL返回。KfRaiseIrql、KfLowerIrql之类的函数也是这么一回事,把当前IRQL转成任务优先级修改TPR,并把原先TPR的值转成原先的IRQL并返回。而现在软中断的产生也有了APIC支持,APIC通过产生一个发向自己的处理器间中断,就可以产生一个软中断,因为可以指定该中断的向量,所以软中断就可以区分优先级别,如APC_LEVEL、DISPATCH_LEVEL。产生软中断的函数一样还是HalRequestSoftwareInterrupt,该函数会先判断KPCR+0x95是否和要产生的软中断IRQL一样,若是的话则置位KPCR+0x96并返回,表示现在IRQL大于DISPATCH_LEVEL所以不处理DPC中断。否则以要产生的软中断的IRQL为索引从HalpIRQLtoTPRHAL取出对应任务优先级,并或上0x4000,表示是发向自身的固定处理间中断,并用该值设置中断命令寄存器ICW的低32位,然后读取中断命令寄存器ICW的低32位是否为0x1000,确定中断消息已经发送后就返回,这时候软中断已经产生。值得注意的是APIC HAL里没有HalEndSoftwareInterrupt这个函数。HAL为软中断的IRQL提供了一个固定的中断向量:7 Q$ r$ f; s: G8 k" \- d( b
; |8 `4 Y0 [/ M; W# X#define ZERO_VECTOR 0x00 // IRQL 00 * S+ u2 q" y4 U8 w, k- f
#define APC_VECTOR 0x3D // IRQL 01+ D# F- `% ?" e z
#define DPC_VECTOR 0x41 // IRQL 02
5 i6 z( N. N# w# q#define APIC_GENERIC_VECTOR 0xC1 // IRQL 27
- O' j9 r6 ]) g$ j7 V e9 C0 r. q) l#define APIC_CLOCK_VECTOR 0xD1 // IRQL 28
( G! X( H- c8 ~# g4 e+ _2 f- D#define APIC_SYNCH_VECTOR 0xD1 // IRQL 28
! c& V* m2 Y4 R+ s. `0 B4 p#define APIC_IPI_VECTOR 0xE1 // IRQL 29, j" V$ g! w2 P8 Q' [
#define POWERFAIL_VECTOR 0xEF // IRQL 304 Q) f1 q' v9 X3 k
#define APIC_PROFILE_VECTOR 0xFD // IRQL 31# z; b( [+ ]; M
' k4 x+ g8 T" f8 G h! B! X8 o; S
$ B+ w+ T) p, `+ o
现在看一下一些重要的数据:
# p: v @0 U+ D' n- S0 V
; u: H1 p, v0 K6 X7 x这是我写的代码输出的IO APIC重定向表内容:
1 x/ t- |8 u- R- K, T& O5 l; f+ j' x3 }) b n* N" L. d* F
Redirect Table Index: 0x17) g( _5 w% @! u1 C8 `8 p5 B
Redirect Table[ 0]: ff
7 s% r7 x; U% [3 WRedirect Table[ 1]: b3
; H4 s# r( G# _2 I% W+ `8 SRedirect Table[ 2]: ff
# x" m! v( L6 {, q! _% F$ Z; W" ARedirect Table[ 3]: 51
/ b+ C# [/ P# O/ DRedirect Table[ 4]: ff
6 `, ?7 M) `# V0 |9 s. `Redirect Table[ 5]: ff& O9 ` i6 X7 Y* X' y' I
Redirect Table[ 6]: 62
/ X6 t: U/ O$ Z4 |/ b7 }6 B1 RRedirect Table[ 7]: ff4 g( Z# _( f+ V& X
Redirect Table[ 8]: d1, k4 a$ ]6 T: a( s
Redirect Table[ 9]: b12 U% u7 @' J- f3 J0 Z
Redirect Table[ a]: ff2 O3 b; P) `5 D. ^4 F
Redirect Table[ b]: ff8 C% p; x! _0 L. G- ]$ N
Redirect Table[ c]: 52
+ L! Q" g" @, e! J# A! n5 a+ \9 `Redirect Table[ d]: ff" Q! @, [1 T0 I/ J! E5 Z# x; f, e
Redirect Table[ e]: ff" L+ [) ~1 L9 D) q5 Y9 x
Redirect Table[ f]: 92, f9 o) k$ o n s- Q8 b( F
Redirect Table[10]: ff- ?# \: ~! _6 L! {/ H( A
Redirect Table[11]: a3" U ^- N; Z7 m, K1 B! p! V3 m
Redirect Table[12]: 83
. X V0 p/ x) P" Y% T \Redirect Table[13]: 935 `6 s+ a6 \* U; ?1 p% S6 [* V, L
Redirect Table[14]: ff
" J( Y- M' z. mRedirect Table[15]: ff
1 o( p. g. R; r4 t1 U3 e: mRedirect Table[16]: ff
- i9 D1 {6 m& z$ E* gRedirect Table[17]: ff
4 W" l, O0 f' l$ v. c! b
4 Z j' L; M# ~8 K8 _$ y* n3 Y这是IDT表中被注册的向量:
0 q- ]2 k2 o/ a- p
7 `# t- Y) X+ S% ]8 F8 C2 z R4 n3 s1f: 80064908 (hal!HalpApicSpuriousService)* K* P: W; l# F% E- z
37: 800640b8 (hal!PicSpuriousService37); ]) J$ G8 ^ v h8 X
3d: 80065254 (hal!HalpApcInterrupt)" a& h' a5 Z" ?
41: 800650c8 (hal!HalpDispatchInterrupt)
6 K, B8 k0 p% K% N9 L: |5 U50: 80064190 (hal!HalpApicRebootService)3 a: s' k6 B6 Q) Q. M1 u; _
51: 817f59e46 x! i/ A' x5 I5 C
(Vector:51,Irql:4,SyncIrql:4,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:serial!SerialCIsrSw(f3c607c7))$ p( \- J4 d! P4 p
52: 817f5044
9 c& c: `1 ^$ @! `' P* C1 b* w(Vector:52,Irql:4,SyncIrql:a,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:i8042prt!I8042MouseInterruptService(f3c57a2c))8 L; q, J7 Z: C9 o
83: 817d2d44 7 m8 i! f7 S. d
(Vector:83,Irql:7,SyncIrql:7,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:NDIS!ndisMIsr(bff1b794))6 E/ e4 |- a& O3 t# r" Z( P
92: 81821384
, s7 Y$ N, ?- ]5 {(Vector:92,Irql:8,SyncIrql:8,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:atapi!ScsiPortInterrupt(bff892be))1 y* S# X& D8 r+ B; r M9 r- `
93: 8185ed64 , l( D1 H- z* X, t- O% w! l
(Vector:93,Irql:8,SyncIrql:8,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:uhcd!UHCD_InterruptService(f3f0253e))
0 |/ k' g" f @7 za3: 8186cdc4 x, G% W1 p/ E; i2 S
(Vector:a3,Irql:9,SyncIrql:9,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:SCSIPORT!ScsiPortInterrupt(bff719f0))
/ g. |( E6 Q; o bb1: 818902e4 4 C! D( q7 ^) [
(Vector:b1,Irql:a,SyncIrql:a,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:ACPI!ACPIInterruptServiceRoutine(bffe14b4))
( P0 K d* W. _. z; Qb3: 81881664
- C* k7 u6 `9 m- B; j(Vector:b3,Irql:a,SyncIrql:a,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:i8042prt!I8042KeyboardInterruptService(f3c51918))
6 x. z' T; M" R4 h& D; h7 _$ C$ Cc1: 800642fc (hal!HalpBroadcastCallService)( t; L* P5 y% G# c# r" w/ X/ V
d1: 80063964 (hal!HalpClockInterrupt)
5 _! _: j. J& h* }e1: 80064858 (hal!HalpIpiHandler)
8 n+ e7 ]( n te3: 800645d4 (hal!HalpLocalApicErrorService)' n! [! r4 t6 ?3 e; P5 L3 ^
fd: 80064d64 (hal!HalpProfileInterrupt)
: P, x( [: P- _2 N" }7 H7 _9 ?fe: 80064eec (hal!HalpPerfInterrupt)" e; t. k s2 ]. j8 i$ V& G; N
; Q5 ]+ Q8 J0 A U% Y1 f$ b9 e
象a3、b1这类输出内容很多的是被硬件注册的中断向量,而象d1、e3这种输出内容少的是注册为了的HAL内部使用的中断向量和本地APIC中断向量# i( g+ D* h8 A3 O
: N. T7 ~( K/ `9 o4 z这是几个重要的数组:
) T# y" P7 a& [* W; ?8 E. O6 F- e* p) }
HalVectorToIrql(这个数组是以向量除于16做索引):
0 ]! Q* `- \/ C) H' D' J8006a304 00 ff ff 01 02 04 05 06-07 08 09 0a 1b 1c 1d 1e
! }* y3 }) o4 L2 Y! E0 n3 C' {! U, a0 E8 ^
HalpIRQLtoTPR:
7 B6 h% L4 A, m. j, f% J* K8006a1e4 00 3d 41 41 51 61 71 81-91 a1 b1 b1 b1 b1 b1 b1" S# L, I( v2 A* V& t( k
8006a1f4 b1 b1 b1 b1 b1 b1 b1 b1-b1 b1 b1 c1 d1 e1 ef ff
( i$ F, Y3 U) j. Y- r9 X' g- F% o% u3 ^% r5 ~" `+ b+ m: G0 b- b' ]4 A
HalpINTItoVector:) y& `9 G: T/ L- P) F- h! d
8006ada0 00 b3 61 51 a2 b2 62 91-a1 b1 71 81 52 82 72 92* T' |3 V' } m7 l3 n4 g" ^5 o
8006adb0 00 a3 83 93 00 00 00 00-00 00 00 00 00 00 00 00
* p1 t7 J, M, X# X/ ]; z
7 Y; E0 f+ ~& F! ]$ oHalVectorToINTI:
. v5 E& u1 ]* ~. I6 ~. M8006a204 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff) |( p4 m! `! s, e3 f( I# S
8006a214 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff% u: G: W2 g) j+ b; H8 _
8006a224 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
" B7 L: K- [7 ?8 W8 Q; n/ H8006a234 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
V: _2 H+ f7 B8006a244 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff [7 n" @7 s2 q" R& c6 v6 e0 @
8006a254 ff 03 0c ff ff ff ff ff-ff ff ff ff ff ff ff ff
- f2 g u& w4 ^. ]5 a4 n4 k8006a264 ff 02 06 ff ff ff ff ff-ff ff ff ff ff ff ff ff
% P$ K. v, N( ?2 @# E8 A8006a274 ff 0a 0e ff ff ff ff ff-ff ff ff ff ff ff ff ff7 h- G+ a5 x0 W3 a, a
8006a284 ff 0b 0d 12 ff ff ff ff-ff ff ff ff ff ff ff ff
U' h/ o8 l+ S. u1 `& g4 A8006a294 ff 07 0f 13 ff ff ff ff-ff ff ff ff ff ff ff ff, c8 ~. u+ N. V4 q
8006a2a4 ff 08 04 11 ff ff ff ff-ff ff ff ff ff ff ff ff9 d: w0 m( w9 Z6 `& g5 }% m
8006a2b4 ff 09 05 01 ff ff ff ff-ff ff ff ff ff ff ff ff3 `' u0 Z- C5 T# t5 ]
8006a2c4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
0 b8 d. w! w w2 I5 R; G% `# t8006a2d4 ff 08 ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
) c( a+ |' p7 o& _0 f; ^& A8006a2e4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff1 `2 _$ e, L7 g- D3 G; l, `5 q) V
8006a2f4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff + b1 L$ h6 o6 e1 h# M
' M% a- T% c0 f! O1 D7 ~6 r+ C
) E, i( _+ n2 BvBucket:
, R$ s1 x# V0 F8006ae30 02 02 02 03 03 03 03, o. m( W. m0 i7 _
0 ?( n' z, P) \# X4 ]
举个例子来说明一下,在我虚拟机里SCSI Controller的IRQ是17(注意,已经大于16了),到重定向表中查找第17项,得到中断向量为0xa3,再看IDT,0xa3对应处理例程是SCSIPORT!ScsiPortInterrupt。" B- v2 m9 F( N6 d) D% i }) `
+ F9 t. P! R9 K* P5 a- R- c- P vBucket数组干啥用的?它就是用来分配新的向量。分配算法很简单,当要分配一个新的向量时,就在vBucket数组从右到左搜索最小的一个数i,该数对应在vBucket中索引为Index,新向量为(0x50+Index*16+i+1),新向量对应的IRQL为(4+i+1),同时会把vBucket中这个i加1,i不等大于16。象给出的这个vBucket,下一次计算时i=2, index=2。不过这些用于硬件的向量在IO系统初始化时调用HalpGetSystemInterruptVector分配好了,然后通过IoConnectInterrupt把IDT中注册的向量位置的例程注册为中断处理程序。这里并不是每个注册的向量都会对应中断处理程序,象上面给出的例子中,0xa1、0xa2、0xb1等向量就没有对应。
8 h% X1 R, y1 ?* Y2 C$ h
" s6 O6 `% q. Y$ ~! t: F* | IRQL机制为内核同步提供了很大的便利,既对驱动开发者隐藏了底层中断机制,也方便了驱动开发者的内核同步。LINUX从2.5内核开始引进的软中断和任务队列等机制,很大程度上也来自windows这套机制的借鉴。9 Y5 u" l9 I+ z3 E% r
- I3 x/ _6 S- H+ j! r6 l7 r
终于考完试,解放了,呵呵。这个东西其实还有很多可写的,只是没空再深入去分析了。在未来的64位系统里,APIC这种基于中断引脚的机制很快也要被SAPIC这种基于消息的更强大的机制所取代 |
|