|
楼主 |
发表于 2008-2-27 14:35:05
|
显示全部楼层
从IRQ到IRQL(APIC版)
来自:http://www.nsfocus.net/index.php ... o=view&mid=2534 L8 X% E$ A9 O6 ?
& B& w L% V n5 b! f从IRQ到IRQL(APIC版)
+ t4 \+ C# M$ k5 D: @1 O; U# E$ k3 C4 h! Z: @* A
作者:SoBeIt) m; I" o" `+ u/ j$ A8 O
出处:https://www.xfocus.net/bbs/index.php?act=ST&f=2&t=45502
9 v, s$ {+ n+ L7 v+ q \3 n日期:2005-02-04' N( ` w4 p& D8 t) Z) b! V
# `$ {9 M D2 r- a/ J
事实上,老久的PIC在很早以前就被淘汰了,取而代之的是APIC。由于APIC可以兼容PIC,所以在很多单处理器系统上我们看到的PIC实际是APIC的兼容PIC模式。APIC主要应用于多处理器操作系统,是为了解决IRQ太少和处理器间中断而产生的,当然,单处理器操作系统也可以使用APIC(不是模拟PIC)。APIC的HAL和PIC的HAL有很大的不同,很突出的一个特点就是APIC的HAL不用再象PIC的HAL那样虚拟一个中断控制器,IRQL的概念已经可以通过中断向量的形式被APIC支持。事实上,因为被APIC所支持,所以在APIC HAL里IRQL的实现比PIC HAL那样虚拟一个中断控制器要简单得多了。0 \) k; X5 `3 z
% D" |/ R* A0 i# i$ F1 f+ ` 现在来简单介绍一下APIC的结构(关于APIC详细的描述请参考《IA-32 Inel Architecture Software Developer's Manual Volume 3 Chapter 8》)。整个APIC系统由本地APIC、IO APIC和APIC串行总线组成(在Pentium 4和Xeon以后,APIC总线放到了系统总线中)组成。每个处理器中集成了一个本地APIC,而IO APIC是系统芯片组中一部分,APIC总线负责连接IO APIC和各个本地APIC。本地APIC接收该处理器产生的本地中断比如时钟中断,以及由该处理器产生的处理器间中断,并从APIC串行总线接收来自IO APIC的消息;IO APIC负责接收所有外部的硬件中断,并翻译成消息选择发给接收中断的处理器,以及从本地APIC接收处理器间中断消息。2 Y+ J, `, [3 O8 s2 V4 U
" D. A! r- z& t7 F9 C! D# U8 F2 S# r 和PIC一样,控制本地APIC和IO APIC的方法是通过读写该单元中的相关寄存器。不过和PIC不一样的是,Intel把本地APIC和IO APIC的寄存器都映射到了物理地址空间,本地APIC默认映射到物理地址0xffe00000,IO APIC默认映射到物理地址0xfec00000。windows HAL再进一步把本地APIC映射到虚拟地址0xfffe0000,把IO APIC映射到虚拟地址0xffd06000,也就是说对该地址的读写实际就是对寄存器的读写,本地APIC里几个重要的寄存有EOI寄存器,任务优先级寄存器(TPR),处理器优先级寄存器(PPR),中断命令寄存器(ICR,64位),中断请求寄存器(IRR,256位,对应每个向量一位),中断在服务寄存器(ISR,256位)等。IO APIC里几个重要的寄存器有版本寄存器,I/O寄存器选择寄存器、I/O窗口寄存器(用要访问的I/O APIC寄存器的索引设置地址I/O寄存器选择寄存器,此时访问I/O窗口寄存器就是访问被选定的寄存器)还有很重要的是一个IO重定向表,每一个表项是一个64位寄存器,包括向量和目标模式、传输模式等相关位,每一个表项连接一条IRQ线,表项的数目随处理器的版本而不一样,在Pentium 4上为24个表项。表项的数目保存在IO APIC版本寄存器的[16:23]位。APIC系统支持255个中断向量,但Intel保留了0-15向量,可用的向量是16-255。并引进一个概念叫做任务优先级=中断向量/16,因为保留了16个向量,所以可用的优先级是2-15。当用一个指定的优先级设置本地APIC中的任务优先级寄存器TPR后,所有优先级低于TPR中优先级的中断都被屏蔽,是不是很象IRQL的机制?事实上,APIC HAL里的IRQL机制也就是靠着这个任务优先级寄存器得以实现。同一个任务优先级包括了16个中断向量,可以进一步细粒度地区分中断的优先级。3 E/ W- W7 t# Y: _, z# W
# L6 ^, _2 k: S6 T) r 在HAL里虽然HalBeginSystemInterrupt仍然是IRQL机制的发动引擎,但是因为有APIC的支持,它和其它共同实现IRQL的函数要比PIC HAL里对应的函数功能简单得多。HalBeginSystemInterrupt通过用IRQL做索引在HalpIRQLtoTPR数组中获取该IRQL对应的任务优先级,用该优先级设置任务优先级寄存器TPR,并把TPR中原先的任务优先级/16做为索引在HalpVectorToIRQL数组中获取对应的原先的IRQL然后返回。若IRQL是从低于DISPATCH_LEVEL提升到高于DISPATCH_LEVEL,还需要设置KPCR+0x95(0xffdff095)为DISPATCH_LEVEL(0x2),表示是从DISPATCH_LEVEL以下的级别提升IRQL。HalEndSystemInterrupt向本地APIC的EOI寄存发送0,表示中断结束,可以接收新中断。并还要判断要降到的IRQL是否小于DISPATCH_LEVEL,若小于则进一步判断KPCR+0x96(0xffdff096)是否置位,若置位则表示有DPC中断在等待(在IRQL高于DISPATCH_LEVEL被引发,然后等待直到IRQL降到低于DISPATCH_LEVEL),则将KPCR+0x95和KPCR+0x96清0后调用KiDispatchInterrupt响应DPC软中断。否则做的工作就是和HalBeginSystemInterrupt一样的过程:把要降到的IRQL转换成任务优先级设置TRP,并把久的任务优先级转成IRQL返回。KfRaiseIrql、KfLowerIrql之类的函数也是这么一回事,把当前IRQL转成任务优先级修改TPR,并把原先TPR的值转成原先的IRQL并返回。而现在软中断的产生也有了APIC支持,APIC通过产生一个发向自己的处理器间中断,就可以产生一个软中断,因为可以指定该中断的向量,所以软中断就可以区分优先级别,如APC_LEVEL、DISPATCH_LEVEL。产生软中断的函数一样还是HalRequestSoftwareInterrupt,该函数会先判断KPCR+0x95是否和要产生的软中断IRQL一样,若是的话则置位KPCR+0x96并返回,表示现在IRQL大于DISPATCH_LEVEL所以不处理DPC中断。否则以要产生的软中断的IRQL为索引从HalpIRQLtoTPRHAL取出对应任务优先级,并或上0x4000,表示是发向自身的固定处理间中断,并用该值设置中断命令寄存器ICW的低32位,然后读取中断命令寄存器ICW的低32位是否为0x1000,确定中断消息已经发送后就返回,这时候软中断已经产生。值得注意的是APIC HAL里没有HalEndSoftwareInterrupt这个函数。HAL为软中断的IRQL提供了一个固定的中断向量:
" b. b9 y$ l1 a# y8 G
& k% F( W4 ~# W" Z#define ZERO_VECTOR 0x00 // IRQL 00
2 Q. p! T3 g! H2 p3 k#define APC_VECTOR 0x3D // IRQL 018 A$ a0 ^7 A/ M4 n0 y
#define DPC_VECTOR 0x41 // IRQL 02
8 b8 f2 N" h( v% G' d! C7 u#define APIC_GENERIC_VECTOR 0xC1 // IRQL 27+ I+ ?: f3 y, W& L( _) E" E
#define APIC_CLOCK_VECTOR 0xD1 // IRQL 28
3 _# g6 i5 T; _$ j: N A#define APIC_SYNCH_VECTOR 0xD1 // IRQL 28! Z. B( J6 V$ v
#define APIC_IPI_VECTOR 0xE1 // IRQL 29: Z& W7 o# B8 [3 f
#define POWERFAIL_VECTOR 0xEF // IRQL 30# \7 U* K1 G7 y
#define APIC_PROFILE_VECTOR 0xFD // IRQL 31
8 b# F- A' T6 M$ e* t+ f; H9 W. D, F. V1 @8 Z- I1 a5 u$ W7 @
+ n0 a, n# R6 x# ^现在看一下一些重要的数据:. |9 j( p# V& ?' _* w4 T
# V$ ?+ I3 H: R0 M- }
这是我写的代码输出的IO APIC重定向表内容:
% x7 s4 J' d p6 d1 n+ h4 n! i% W$ u$ M& y+ ^/ G" Y& C+ ?' g
Redirect Table Index: 0x174 o/ N( F. k6 s( g. ~% q
Redirect Table[ 0]: ff
) ?( R6 x0 K+ B# eRedirect Table[ 1]: b34 R& K/ o$ U, M& u9 x: `
Redirect Table[ 2]: ff7 y5 `1 Z- f7 E$ G
Redirect Table[ 3]: 510 g0 L6 h2 s1 m" m4 D
Redirect Table[ 4]: ff
. F. k1 F* S `) I& O( T; k* [% hRedirect Table[ 5]: ff1 ` \5 i% l' E7 Z5 z+ q
Redirect Table[ 6]: 62
% B. y0 d) A" V3 w: H, G# LRedirect Table[ 7]: ff6 k: B' r7 @/ U9 y
Redirect Table[ 8]: d1
# Q) s! p1 E* e8 m( f( kRedirect Table[ 9]: b1( C7 b6 N9 j, v" `8 T& p1 @
Redirect Table[ a]: ff- V& G j7 K1 Q/ z# W# p" @
Redirect Table[ b]: ff; g5 Q! b: S$ M3 a* B+ p
Redirect Table[ c]: 527 P# C. ?8 H( @/ R; Z7 I
Redirect Table[ d]: ff, k: o* s1 F- w
Redirect Table[ e]: ff
+ x N: O! \9 ^4 I, m& j1 K/ Q9 xRedirect Table[ f]: 929 j( w9 g7 H) e) }9 u
Redirect Table[10]: ff- v( X! N$ j9 x9 N2 ^( j; D
Redirect Table[11]: a3
( a4 d, x. C. P4 v# Q, MRedirect Table[12]: 83$ y4 r$ s6 e; X4 i* R; [% k& T ~- e
Redirect Table[13]: 931 d" I; f5 V: X+ m" o
Redirect Table[14]: ff: p- |- T7 N0 f
Redirect Table[15]: ff3 S- z- f! S2 l% }: n; P4 u
Redirect Table[16]: ff
& i2 O9 r" R9 H, iRedirect Table[17]: ff' y( l5 `5 D* W- { L3 p: y
0 [* U F# [* H0 {8 a这是IDT表中被注册的向量:
5 y- K$ ~5 T0 {; {
( A' }8 |1 c* ] s4 p1 o1f: 80064908 (hal!HalpApicSpuriousService). J/ F- T2 Y" ~/ s0 k9 U* ?9 L
37: 800640b8 (hal!PicSpuriousService37)0 U" P9 V: d1 n! w( P) L" k
3d: 80065254 (hal!HalpApcInterrupt)
3 U' g% M4 m1 U; U/ i+ `, s41: 800650c8 (hal!HalpDispatchInterrupt)& B$ m' r! o% _& q1 N4 s
50: 80064190 (hal!HalpApicRebootService)
@2 D; @: x+ c5 w6 o51: 817f59e4' b f5 Z/ }" }2 [0 q: q& z' L
(Vector:51,Irql:4,SyncIrql:4,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:serial!SerialCIsrSw(f3c607c7))
/ h8 ?3 i/ O+ e1 _52: 817f5044 8 t% ]- N) I0 g* E5 o, @: x- i
(Vector:52,Irql:4,SyncIrql:a,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:i8042prt!I8042MouseInterruptService(f3c57a2c))7 i2 C3 {9 \5 p
83: 817d2d44
2 h5 q4 \, y. g" n2 a6 V) @(Vector:83,Irql:7,SyncIrql:7,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:NDIS!ndisMIsr(bff1b794))/ M# m3 O) R3 [8 @1 \% h
92: 81821384
$ m" C/ J+ N1 [/ x6 A/ Z+ {8 m(Vector:92,Irql:8,SyncIrql:8,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:atapi!ScsiPortInterrupt(bff892be))3 h1 S# ?) s1 r( }
93: 8185ed64
1 L! A9 W& N) s+ ^* L) I! l(Vector:93,Irql:8,SyncIrql:8,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:uhcd!UHCD_InterruptService(f3f0253e))9 j9 r2 c5 p2 D2 P" M6 _( I7 R
a3: 8186cdc4 0 f. r! E8 q) @
(Vector:a3,Irql:9,SyncIrql:9,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:SCSIPORT!ScsiPortInterrupt(bff719f0))
# X0 G' }9 D5 W: L: ob1: 818902e4
1 U0 G9 Y) f- t T8 W9 `+ |" G(Vector:b1,Irql:a,SyncIrql:a,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:ACPI!ACPIInterruptServiceRoutine(bffe14b4))
$ `( e0 q& l- `2 X# @b3: 81881664
; e% n; E+ E8 ~- o6 y2 ?% b(Vector:b3,Irql:a,SyncIrql:a,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:i8042prt!I8042KeyboardInterruptService(f3c51918))
" Q7 M4 l1 l8 d" S2 M* P8 rc1: 800642fc (hal!HalpBroadcastCallService)
2 m; w% V% ~( ^ m/ |4 F5 n3 Kd1: 80063964 (hal!HalpClockInterrupt)
; j) C/ v3 u% D: z3 t9 C+ Y% R- W$ Ce1: 80064858 (hal!HalpIpiHandler)( Y" V. x8 `6 j J' t: H
e3: 800645d4 (hal!HalpLocalApicErrorService)" E( p, e. |! l3 D- J' r4 Q# n: H
fd: 80064d64 (hal!HalpProfileInterrupt)5 c5 V z1 X! |6 H
fe: 80064eec (hal!HalpPerfInterrupt)9 k; \) i N" y: A; @
- Y+ g' o& B) o象a3、b1这类输出内容很多的是被硬件注册的中断向量,而象d1、e3这种输出内容少的是注册为了的HAL内部使用的中断向量和本地APIC中断向量 |# e) b3 U0 j. y
. ~1 v$ e+ c" m+ T6 J7 G3 W% Y1 \
这是几个重要的数组:
# M. E: j6 r) B8 O! s9 A
% k' M, A- ]- v) KHalVectorToIrql(这个数组是以向量除于16做索引):% \7 Q4 A7 {/ S% D# o
8006a304 00 ff ff 01 02 04 05 06-07 08 09 0a 1b 1c 1d 1e7 g' b7 }8 T8 [6 n
$ R8 |! h3 X0 g' hHalpIRQLtoTPR:
$ L' N) r9 x; r' g+ I4 c8006a1e4 00 3d 41 41 51 61 71 81-91 a1 b1 b1 b1 b1 b1 b1
9 d U+ |7 u. ]0 @* b$ I8006a1f4 b1 b1 b1 b1 b1 b1 b1 b1-b1 b1 b1 c1 d1 e1 ef ff( n2 k8 }* h" X* i) r+ K2 ` }& [/ G
2 G) S. y) w: [/ e( O
HalpINTItoVector:* i( `! {8 u- w) {6 o
8006ada0 00 b3 61 51 a2 b2 62 91-a1 b1 71 81 52 82 72 92
8 v( l$ V; U: x, L$ ?8006adb0 00 a3 83 93 00 00 00 00-00 00 00 00 00 00 00 00) p& F( | k N. {: L/ d
3 `/ y7 i6 Y6 Y2 m( O8 J
HalVectorToINTI:
3 Q% `5 F3 ]% b: z8006a204 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff8 Q* Y+ f; r) a1 K4 W8 L
8006a214 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
' P1 f) G" b; O' w- L$ m8006a224 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
/ a4 m; O6 _# O& O1 U" Y8006a234 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff/ Y* v; i& v+ y; x- Q+ z3 G
8006a244 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff5 m7 f: o' u) x
8006a254 ff 03 0c ff ff ff ff ff-ff ff ff ff ff ff ff ff
* z3 S$ y/ P t: e" b8006a264 ff 02 06 ff ff ff ff ff-ff ff ff ff ff ff ff ff6 x( p4 W8 o" i8 a) N" }8 V7 \1 q1 b! q, j
8006a274 ff 0a 0e ff ff ff ff ff-ff ff ff ff ff ff ff ff3 l& C0 ~6 t& x3 l' [6 ?
8006a284 ff 0b 0d 12 ff ff ff ff-ff ff ff ff ff ff ff ff
5 o# Y0 H& S, n2 Z8006a294 ff 07 0f 13 ff ff ff ff-ff ff ff ff ff ff ff ff8 A( k) \ y4 f( j9 D
8006a2a4 ff 08 04 11 ff ff ff ff-ff ff ff ff ff ff ff ff) ^1 A+ W7 @: F5 K" e0 g
8006a2b4 ff 09 05 01 ff ff ff ff-ff ff ff ff ff ff ff ff' l# h; |( b) l3 l) I& |
8006a2c4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff9 l5 y: ~1 F3 v2 t! e- `7 ]
8006a2d4 ff 08 ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
' S# |0 D5 G; @$ f. x( Z# U* F8006a2e4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff# H: `$ M7 d+ U0 E) ^
8006a2f4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff % Z) t9 M3 R3 D+ F
* G2 A0 N5 @9 H
+ u q5 }" F# B; ]; EvBucket:* B* b! c/ d" l/ T% P8 \
8006ae30 02 02 02 03 03 03 03
* _! y# G# q' R/ C
- v* a5 T: x! p6 J: D! Q! g 举个例子来说明一下,在我虚拟机里SCSI Controller的IRQ是17(注意,已经大于16了),到重定向表中查找第17项,得到中断向量为0xa3,再看IDT,0xa3对应处理例程是SCSIPORT!ScsiPortInterrupt。' S! y/ V) f9 {
/ c0 k4 D8 U2 O8 T% h/ @' `9 x
vBucket数组干啥用的?它就是用来分配新的向量。分配算法很简单,当要分配一个新的向量时,就在vBucket数组从右到左搜索最小的一个数i,该数对应在vBucket中索引为Index,新向量为(0x50+Index*16+i+1),新向量对应的IRQL为(4+i+1),同时会把vBucket中这个i加1,i不等大于16。象给出的这个vBucket,下一次计算时i=2, index=2。不过这些用于硬件的向量在IO系统初始化时调用HalpGetSystemInterruptVector分配好了,然后通过IoConnectInterrupt把IDT中注册的向量位置的例程注册为中断处理程序。这里并不是每个注册的向量都会对应中断处理程序,象上面给出的例子中,0xa1、0xa2、0xb1等向量就没有对应。
! C+ Y! C0 p: U/ o/ u8 m7 l! [- E7 q3 g. f: Z
IRQL机制为内核同步提供了很大的便利,既对驱动开发者隐藏了底层中断机制,也方便了驱动开发者的内核同步。LINUX从2.5内核开始引进的软中断和任务队列等机制,很大程度上也来自windows这套机制的借鉴。4 J3 p( b3 Z: t: z
* N$ l- X# _6 |( Y4 ]
终于考完试,解放了,呵呵。这个东西其实还有很多可写的,只是没空再深入去分析了。在未来的64位系统里,APIC这种基于中断引脚的机制很快也要被SAPIC这种基于消息的更强大的机制所取代 |
|