|
|
楼主 |
发表于 2008-2-27 14:35:05
|
显示全部楼层
从IRQ到IRQL(APIC版)
来自:http://www.nsfocus.net/index.php ... o=view&mid=2534
0 Q0 S6 x8 _1 h6 ]! p
3 v9 C" L$ p9 V B3 L2 I) v* t从IRQ到IRQL(APIC版), f# ~; |- P9 u; {! A" M6 g8 m& u
# R6 L# n3 E0 u" |
作者:SoBeIt& I4 R% L$ f; {) M# j
出处:https://www.xfocus.net/bbs/index.php?act=ST&f=2&t=455025 f: F. j9 }8 k( |: |. K( q+ N
日期:2005-02-04 v. C1 S2 v) `' s0 t
+ F& l* p1 u+ o
事实上,老久的PIC在很早以前就被淘汰了,取而代之的是APIC。由于APIC可以兼容PIC,所以在很多单处理器系统上我们看到的PIC实际是APIC的兼容PIC模式。APIC主要应用于多处理器操作系统,是为了解决IRQ太少和处理器间中断而产生的,当然,单处理器操作系统也可以使用APIC(不是模拟PIC)。APIC的HAL和PIC的HAL有很大的不同,很突出的一个特点就是APIC的HAL不用再象PIC的HAL那样虚拟一个中断控制器,IRQL的概念已经可以通过中断向量的形式被APIC支持。事实上,因为被APIC所支持,所以在APIC HAL里IRQL的实现比PIC HAL那样虚拟一个中断控制器要简单得多了。5 A9 s- ^ Q5 A+ k1 ^- [1 a
6 ?, @- d! K' Y/ x1 \0 ^& C6 } 现在来简单介绍一下APIC的结构(关于APIC详细的描述请参考《IA-32 Inel Architecture Software Developer's Manual Volume 3 Chapter 8》)。整个APIC系统由本地APIC、IO APIC和APIC串行总线组成(在Pentium 4和Xeon以后,APIC总线放到了系统总线中)组成。每个处理器中集成了一个本地APIC,而IO APIC是系统芯片组中一部分,APIC总线负责连接IO APIC和各个本地APIC。本地APIC接收该处理器产生的本地中断比如时钟中断,以及由该处理器产生的处理器间中断,并从APIC串行总线接收来自IO APIC的消息;IO APIC负责接收所有外部的硬件中断,并翻译成消息选择发给接收中断的处理器,以及从本地APIC接收处理器间中断消息。
: [7 O2 R O+ U: [6 c& |5 s/ f( n8 f, @4 c- s8 i2 Q3 G6 @
和PIC一样,控制本地APIC和IO APIC的方法是通过读写该单元中的相关寄存器。不过和PIC不一样的是,Intel把本地APIC和IO APIC的寄存器都映射到了物理地址空间,本地APIC默认映射到物理地址0xffe00000,IO APIC默认映射到物理地址0xfec00000。windows HAL再进一步把本地APIC映射到虚拟地址0xfffe0000,把IO APIC映射到虚拟地址0xffd06000,也就是说对该地址的读写实际就是对寄存器的读写,本地APIC里几个重要的寄存有EOI寄存器,任务优先级寄存器(TPR),处理器优先级寄存器(PPR),中断命令寄存器(ICR,64位),中断请求寄存器(IRR,256位,对应每个向量一位),中断在服务寄存器(ISR,256位)等。IO APIC里几个重要的寄存器有版本寄存器,I/O寄存器选择寄存器、I/O窗口寄存器(用要访问的I/O APIC寄存器的索引设置地址I/O寄存器选择寄存器,此时访问I/O窗口寄存器就是访问被选定的寄存器)还有很重要的是一个IO重定向表,每一个表项是一个64位寄存器,包括向量和目标模式、传输模式等相关位,每一个表项连接一条IRQ线,表项的数目随处理器的版本而不一样,在Pentium 4上为24个表项。表项的数目保存在IO APIC版本寄存器的[16:23]位。APIC系统支持255个中断向量,但Intel保留了0-15向量,可用的向量是16-255。并引进一个概念叫做任务优先级=中断向量/16,因为保留了16个向量,所以可用的优先级是2-15。当用一个指定的优先级设置本地APIC中的任务优先级寄存器TPR后,所有优先级低于TPR中优先级的中断都被屏蔽,是不是很象IRQL的机制?事实上,APIC HAL里的IRQL机制也就是靠着这个任务优先级寄存器得以实现。同一个任务优先级包括了16个中断向量,可以进一步细粒度地区分中断的优先级。
1 h- ~1 c# h5 b6 z9 I2 }+ [' |4 T+ [' a; S% q( S$ E
在HAL里虽然HalBeginSystemInterrupt仍然是IRQL机制的发动引擎,但是因为有APIC的支持,它和其它共同实现IRQL的函数要比PIC HAL里对应的函数功能简单得多。HalBeginSystemInterrupt通过用IRQL做索引在HalpIRQLtoTPR数组中获取该IRQL对应的任务优先级,用该优先级设置任务优先级寄存器TPR,并把TPR中原先的任务优先级/16做为索引在HalpVectorToIRQL数组中获取对应的原先的IRQL然后返回。若IRQL是从低于DISPATCH_LEVEL提升到高于DISPATCH_LEVEL,还需要设置KPCR+0x95(0xffdff095)为DISPATCH_LEVEL(0x2),表示是从DISPATCH_LEVEL以下的级别提升IRQL。HalEndSystemInterrupt向本地APIC的EOI寄存发送0,表示中断结束,可以接收新中断。并还要判断要降到的IRQL是否小于DISPATCH_LEVEL,若小于则进一步判断KPCR+0x96(0xffdff096)是否置位,若置位则表示有DPC中断在等待(在IRQL高于DISPATCH_LEVEL被引发,然后等待直到IRQL降到低于DISPATCH_LEVEL),则将KPCR+0x95和KPCR+0x96清0后调用KiDispatchInterrupt响应DPC软中断。否则做的工作就是和HalBeginSystemInterrupt一样的过程:把要降到的IRQL转换成任务优先级设置TRP,并把久的任务优先级转成IRQL返回。KfRaiseIrql、KfLowerIrql之类的函数也是这么一回事,把当前IRQL转成任务优先级修改TPR,并把原先TPR的值转成原先的IRQL并返回。而现在软中断的产生也有了APIC支持,APIC通过产生一个发向自己的处理器间中断,就可以产生一个软中断,因为可以指定该中断的向量,所以软中断就可以区分优先级别,如APC_LEVEL、DISPATCH_LEVEL。产生软中断的函数一样还是HalRequestSoftwareInterrupt,该函数会先判断KPCR+0x95是否和要产生的软中断IRQL一样,若是的话则置位KPCR+0x96并返回,表示现在IRQL大于DISPATCH_LEVEL所以不处理DPC中断。否则以要产生的软中断的IRQL为索引从HalpIRQLtoTPRHAL取出对应任务优先级,并或上0x4000,表示是发向自身的固定处理间中断,并用该值设置中断命令寄存器ICW的低32位,然后读取中断命令寄存器ICW的低32位是否为0x1000,确定中断消息已经发送后就返回,这时候软中断已经产生。值得注意的是APIC HAL里没有HalEndSoftwareInterrupt这个函数。HAL为软中断的IRQL提供了一个固定的中断向量:9 G$ q6 X& w6 [, l( r
) [3 x2 j! y; h0 x2 T; N#define ZERO_VECTOR 0x00 // IRQL 00
% A u4 I; O' H1 e* z0 ^* R1 T. W#define APC_VECTOR 0x3D // IRQL 01
7 W" A, a$ w: e$ b! O#define DPC_VECTOR 0x41 // IRQL 02
; S! I) J+ K9 q7 T( F& G$ O: B#define APIC_GENERIC_VECTOR 0xC1 // IRQL 277 b1 z* m9 h0 b0 t) W
#define APIC_CLOCK_VECTOR 0xD1 // IRQL 281 ^9 u2 t* s1 e* A# g" R" }
#define APIC_SYNCH_VECTOR 0xD1 // IRQL 28
1 Z8 r5 b5 J( U$ r" a; V) S# U2 i, P#define APIC_IPI_VECTOR 0xE1 // IRQL 29( D+ `2 a4 _8 l( H6 e" C
#define POWERFAIL_VECTOR 0xEF // IRQL 30
) N8 @' m' F# I! t! U9 m#define APIC_PROFILE_VECTOR 0xFD // IRQL 31
7 J5 ~. A! E" f6 n8 v5 A. E" i( X9 ]
8 h7 K0 J7 i" T2 _
现在看一下一些重要的数据:
' a! `& W6 c5 @
$ C# R3 U' h ]& J这是我写的代码输出的IO APIC重定向表内容:- }- {4 h7 y& B+ B& B
5 ]3 i! b/ U) W) c) B! U5 J# D0 k
Redirect Table Index: 0x17
8 [$ ~* o1 M9 _% U0 VRedirect Table[ 0]: ff! [1 ~( v4 E( R. a! R
Redirect Table[ 1]: b3! ]7 z) k0 {& z* R3 L F4 N6 V
Redirect Table[ 2]: ff
' {! }4 m. b% p; uRedirect Table[ 3]: 51, b* N7 e) v+ L6 `; l& u/ F
Redirect Table[ 4]: ff0 K% W, L9 P) N3 Y
Redirect Table[ 5]: ff
7 B4 O. H# v$ NRedirect Table[ 6]: 62
8 t, l; P9 z1 v+ l/ E& ORedirect Table[ 7]: ff
- @: Z# q% S4 j* u2 D# wRedirect Table[ 8]: d1
& x5 o1 [1 M: J# `( a/ v0 `5 K5 nRedirect Table[ 9]: b1
0 W/ K2 V! D. \9 M! FRedirect Table[ a]: ff
- q. J/ `8 j7 [, F" \; Z. kRedirect Table[ b]: ff3 Y! t H# V; b) d8 [# e
Redirect Table[ c]: 52 D% E/ u: d0 g `$ k
Redirect Table[ d]: ff! O# j2 P& T, S
Redirect Table[ e]: ff* u( k5 Y* }9 [2 q
Redirect Table[ f]: 921 v: g! j% q" M
Redirect Table[10]: ff
q+ A. K' d3 d# s, x/ \& yRedirect Table[11]: a3
1 q2 \. o! s& O8 o7 S% v1 M8 Z$ dRedirect Table[12]: 83
: _- F6 f# q, B3 X' GRedirect Table[13]: 93
/ R2 v& n$ ~! k. v$ v$ T* M- KRedirect Table[14]: ff7 ^8 v7 r! o9 z I" S
Redirect Table[15]: ff
3 f2 l. g0 ?7 S9 xRedirect Table[16]: ff ]7 p" `+ b; d& N$ j8 d( R
Redirect Table[17]: ff) Y* l' n6 l; T
- l2 a2 Q$ C% _0 I这是IDT表中被注册的向量:" Q9 [( {2 I! x
; t5 V, t& d% Y/ E7 O
1f: 80064908 (hal!HalpApicSpuriousService)
8 j' h' q; ^: j37: 800640b8 (hal!PicSpuriousService37)4 p0 v) o" b8 O [
3d: 80065254 (hal!HalpApcInterrupt)
0 j) s, f! h' E1 c1 k41: 800650c8 (hal!HalpDispatchInterrupt)
, N; R$ C3 i9 ^4 V3 G$ B50: 80064190 (hal!HalpApicRebootService)& {( W1 x) w8 g2 a1 k# e
51: 817f59e4
7 S$ U H- F5 c% P+ h. ~(Vector:51,Irql:4,SyncIrql:4,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:serial!SerialCIsrSw(f3c607c7))' [* |3 ^& {2 O) Q% E! D& J
52: 817f5044
6 t( R3 p/ G! f H: q(Vector:52,Irql:4,SyncIrql:a,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:i8042prt!I8042MouseInterruptService(f3c57a2c))6 g% @" `, u+ [2 V
83: 817d2d44 * y) z2 }6 [) c" Z* Z" c
(Vector:83,Irql:7,SyncIrql:7,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:NDIS!ndisMIsr(bff1b794))
! L3 q/ m: ^) {" e92: 81821384
2 B* v( R0 t$ V" `$ c6 a/ d(Vector:92,Irql:8,SyncIrql:8,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:atapi!ScsiPortInterrupt(bff892be))
' L- y$ r4 j9 b5 i+ A; y93: 8185ed64 ' m/ X, }! g8 h, W( H' }" L6 f
(Vector:93,Irql:8,SyncIrql:8,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:uhcd!UHCD_InterruptService(f3f0253e))
' v: Y" T; q4 xa3: 8186cdc4
( Y b0 U4 ]1 j& a; e% F0 H- b" E(Vector:a3,Irql:9,SyncIrql:9,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:SCSIPORT!ScsiPortInterrupt(bff719f0))
7 G: k: k9 E+ ab1: 818902e4
/ }' v% f1 j6 s$ p; j(Vector:b1,Irql:a,SyncIrql:a,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:ACPI!ACPIInterruptServiceRoutine(bffe14b4))
/ F. S5 G# |7 Z# p4 d1 H+ vb3: 81881664 7 A: d, b' i2 \5 ^" l
(Vector:b3,Irql:a,SyncIrql:a,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:i8042prt!I8042KeyboardInterruptService(f3c51918))3 c) Z5 E% J3 n6 T% M5 \
c1: 800642fc (hal!HalpBroadcastCallService)2 f9 t9 q+ q: X. x* E" F
d1: 80063964 (hal!HalpClockInterrupt)
! h1 S. I4 A2 Z# w' }e1: 80064858 (hal!HalpIpiHandler)# J: W& d" h6 L1 m7 Z
e3: 800645d4 (hal!HalpLocalApicErrorService)& R0 N, Y0 V# G2 |1 J
fd: 80064d64 (hal!HalpProfileInterrupt)
2 _% y5 Z$ L& m a- [7 ]- gfe: 80064eec (hal!HalpPerfInterrupt)
8 e% y% Y7 y: C' N* h9 P9 W* n- h
, R& @ _0 h" h0 ^. @8 x: t象a3、b1这类输出内容很多的是被硬件注册的中断向量,而象d1、e3这种输出内容少的是注册为了的HAL内部使用的中断向量和本地APIC中断向量
2 _$ @. {5 L: @9 i* c# ]" N8 M) L6 \ D, Y2 f' i
这是几个重要的数组:, I3 [6 ~' A; \; K0 ~
]* j, E7 n0 d' o9 |1 m) i
HalVectorToIrql(这个数组是以向量除于16做索引):
5 m/ {$ \" a) y: J% `5 Y8006a304 00 ff ff 01 02 04 05 06-07 08 09 0a 1b 1c 1d 1e$ g, J! E5 x/ t1 Z
4 Y! H( q6 t* h7 }8 ]- q
HalpIRQLtoTPR:
( |: u4 g2 g9 V5 m6 r+ q) ]1 q8006a1e4 00 3d 41 41 51 61 71 81-91 a1 b1 b1 b1 b1 b1 b1, \ a7 x- d( `! g, _) |+ N
8006a1f4 b1 b1 b1 b1 b1 b1 b1 b1-b1 b1 b1 c1 d1 e1 ef ff9 I) U: X4 F$ D/ p, Y& ~. c) B0 A1 R
" v' R, s: Z/ p/ Q8 _1 q
HalpINTItoVector:
Z8 N! ~8 z* p8006ada0 00 b3 61 51 a2 b2 62 91-a1 b1 71 81 52 82 72 92
0 f x$ l. H1 y* X8006adb0 00 a3 83 93 00 00 00 00-00 00 00 00 00 00 00 002 y1 K9 e& }1 e
& C D+ G" P8 U& i) S+ k. E
HalVectorToINTI:2 J) A3 `1 y4 w# u7 k
8006a204 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff" E$ u, J k* q, l. q- f8 S+ W I2 l
8006a214 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
5 V9 h6 Y8 W1 u+ e: |8006a224 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff! c9 |' M, W8 Z
8006a234 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff3 T" d+ _9 h! c; k% {0 V7 \
8006a244 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
c( d5 W& c" W/ x: B0 T) z8006a254 ff 03 0c ff ff ff ff ff-ff ff ff ff ff ff ff ff0 Z1 g* c: V2 F( E- g1 U" I4 h
8006a264 ff 02 06 ff ff ff ff ff-ff ff ff ff ff ff ff ff
$ K2 A" `. s. G( E' V8006a274 ff 0a 0e ff ff ff ff ff-ff ff ff ff ff ff ff ff
& B/ e( z1 D. T# C) f5 M8006a284 ff 0b 0d 12 ff ff ff ff-ff ff ff ff ff ff ff ff: F, C+ p8 A- d1 [
8006a294 ff 07 0f 13 ff ff ff ff-ff ff ff ff ff ff ff ff( `0 j: V5 g) _3 D; N! F
8006a2a4 ff 08 04 11 ff ff ff ff-ff ff ff ff ff ff ff ff
; _- v8 M/ f6 C L4 b5 D& b8006a2b4 ff 09 05 01 ff ff ff ff-ff ff ff ff ff ff ff ff X& }1 ]% n' h2 W! o& ^* N4 U
8006a2c4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
( F" Z- f* O0 Q8 f( ?0 t8006a2d4 ff 08 ff ff ff ff ff ff-ff ff ff ff ff ff ff ff" U W+ V& h- I0 L, n. Y, o7 G* F
8006a2e4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
4 v, g) V' j5 J2 C: ~# O& j/ D- u8006a2f4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff 3 L; k" o( Q0 k) l. a1 m) p
' ~3 p* t" q& d P/ u) f% p$ M
( S6 F. B9 m9 Q P4 EvBucket:+ T7 U* ~1 [' x1 P( K
8006ae30 02 02 02 03 03 03 031 z' U7 s0 G5 t% C+ C( ~
. f- `& T( {2 m# g 举个例子来说明一下,在我虚拟机里SCSI Controller的IRQ是17(注意,已经大于16了),到重定向表中查找第17项,得到中断向量为0xa3,再看IDT,0xa3对应处理例程是SCSIPORT!ScsiPortInterrupt。1 Q4 j7 D O' B0 j* `! M
4 B. d5 c: g5 E" U7 N
vBucket数组干啥用的?它就是用来分配新的向量。分配算法很简单,当要分配一个新的向量时,就在vBucket数组从右到左搜索最小的一个数i,该数对应在vBucket中索引为Index,新向量为(0x50+Index*16+i+1),新向量对应的IRQL为(4+i+1),同时会把vBucket中这个i加1,i不等大于16。象给出的这个vBucket,下一次计算时i=2, index=2。不过这些用于硬件的向量在IO系统初始化时调用HalpGetSystemInterruptVector分配好了,然后通过IoConnectInterrupt把IDT中注册的向量位置的例程注册为中断处理程序。这里并不是每个注册的向量都会对应中断处理程序,象上面给出的例子中,0xa1、0xa2、0xb1等向量就没有对应。4 M% ~: {1 J9 Y2 v$ ^/ l( J
3 p7 r9 M1 v5 ]4 w% H( R. { r
IRQL机制为内核同步提供了很大的便利,既对驱动开发者隐藏了底层中断机制,也方便了驱动开发者的内核同步。LINUX从2.5内核开始引进的软中断和任务队列等机制,很大程度上也来自windows这套机制的借鉴。- l2 p' x U& b' o5 H. r. J
: g; e: P! W# u7 e/ G
终于考完试,解放了,呵呵。这个东西其实还有很多可写的,只是没空再深入去分析了。在未来的64位系统里,APIC这种基于中断引脚的机制很快也要被SAPIC这种基于消息的更强大的机制所取代 |
|