|
|
楼主 |
发表于 2008-2-27 14:35:05
|
显示全部楼层
从IRQ到IRQL(APIC版)
来自:http://www.nsfocus.net/index.php ... o=view&mid=2534& E8 Z9 @. q0 G, M
2 w2 e" Q+ `# r9 e: m& T从IRQ到IRQL(APIC版)
: D( j6 j! h8 f9 C5 { H* p d5 ?# ]2 |) u
作者:SoBeIt" ~& Z# k; [, w! \. f% C0 R( y- e
出处:https://www.xfocus.net/bbs/index.php?act=ST&f=2&t=45502
& a8 _% U8 H3 E8 C; ]日期:2005-02-04; f' o+ g0 C: e) F! ]' U( |( F: ^7 G
$ V7 S/ h7 d {' M, t& P
事实上,老久的PIC在很早以前就被淘汰了,取而代之的是APIC。由于APIC可以兼容PIC,所以在很多单处理器系统上我们看到的PIC实际是APIC的兼容PIC模式。APIC主要应用于多处理器操作系统,是为了解决IRQ太少和处理器间中断而产生的,当然,单处理器操作系统也可以使用APIC(不是模拟PIC)。APIC的HAL和PIC的HAL有很大的不同,很突出的一个特点就是APIC的HAL不用再象PIC的HAL那样虚拟一个中断控制器,IRQL的概念已经可以通过中断向量的形式被APIC支持。事实上,因为被APIC所支持,所以在APIC HAL里IRQL的实现比PIC HAL那样虚拟一个中断控制器要简单得多了。0 k7 Y( x5 t" h' c
. J) e/ a- s+ C6 P; o1 F 现在来简单介绍一下APIC的结构(关于APIC详细的描述请参考《IA-32 Inel Architecture Software Developer's Manual Volume 3 Chapter 8》)。整个APIC系统由本地APIC、IO APIC和APIC串行总线组成(在Pentium 4和Xeon以后,APIC总线放到了系统总线中)组成。每个处理器中集成了一个本地APIC,而IO APIC是系统芯片组中一部分,APIC总线负责连接IO APIC和各个本地APIC。本地APIC接收该处理器产生的本地中断比如时钟中断,以及由该处理器产生的处理器间中断,并从APIC串行总线接收来自IO APIC的消息;IO APIC负责接收所有外部的硬件中断,并翻译成消息选择发给接收中断的处理器,以及从本地APIC接收处理器间中断消息。" Z8 M9 o5 ~% b
; Z* t2 S8 @% k$ M. y( @
和PIC一样,控制本地APIC和IO APIC的方法是通过读写该单元中的相关寄存器。不过和PIC不一样的是,Intel把本地APIC和IO APIC的寄存器都映射到了物理地址空间,本地APIC默认映射到物理地址0xffe00000,IO APIC默认映射到物理地址0xfec00000。windows HAL再进一步把本地APIC映射到虚拟地址0xfffe0000,把IO APIC映射到虚拟地址0xffd06000,也就是说对该地址的读写实际就是对寄存器的读写,本地APIC里几个重要的寄存有EOI寄存器,任务优先级寄存器(TPR),处理器优先级寄存器(PPR),中断命令寄存器(ICR,64位),中断请求寄存器(IRR,256位,对应每个向量一位),中断在服务寄存器(ISR,256位)等。IO APIC里几个重要的寄存器有版本寄存器,I/O寄存器选择寄存器、I/O窗口寄存器(用要访问的I/O APIC寄存器的索引设置地址I/O寄存器选择寄存器,此时访问I/O窗口寄存器就是访问被选定的寄存器)还有很重要的是一个IO重定向表,每一个表项是一个64位寄存器,包括向量和目标模式、传输模式等相关位,每一个表项连接一条IRQ线,表项的数目随处理器的版本而不一样,在Pentium 4上为24个表项。表项的数目保存在IO APIC版本寄存器的[16:23]位。APIC系统支持255个中断向量,但Intel保留了0-15向量,可用的向量是16-255。并引进一个概念叫做任务优先级=中断向量/16,因为保留了16个向量,所以可用的优先级是2-15。当用一个指定的优先级设置本地APIC中的任务优先级寄存器TPR后,所有优先级低于TPR中优先级的中断都被屏蔽,是不是很象IRQL的机制?事实上,APIC HAL里的IRQL机制也就是靠着这个任务优先级寄存器得以实现。同一个任务优先级包括了16个中断向量,可以进一步细粒度地区分中断的优先级。* ?* H0 k+ U2 u3 ~% d3 H( [
2 B: K. V) @0 i 在HAL里虽然HalBeginSystemInterrupt仍然是IRQL机制的发动引擎,但是因为有APIC的支持,它和其它共同实现IRQL的函数要比PIC HAL里对应的函数功能简单得多。HalBeginSystemInterrupt通过用IRQL做索引在HalpIRQLtoTPR数组中获取该IRQL对应的任务优先级,用该优先级设置任务优先级寄存器TPR,并把TPR中原先的任务优先级/16做为索引在HalpVectorToIRQL数组中获取对应的原先的IRQL然后返回。若IRQL是从低于DISPATCH_LEVEL提升到高于DISPATCH_LEVEL,还需要设置KPCR+0x95(0xffdff095)为DISPATCH_LEVEL(0x2),表示是从DISPATCH_LEVEL以下的级别提升IRQL。HalEndSystemInterrupt向本地APIC的EOI寄存发送0,表示中断结束,可以接收新中断。并还要判断要降到的IRQL是否小于DISPATCH_LEVEL,若小于则进一步判断KPCR+0x96(0xffdff096)是否置位,若置位则表示有DPC中断在等待(在IRQL高于DISPATCH_LEVEL被引发,然后等待直到IRQL降到低于DISPATCH_LEVEL),则将KPCR+0x95和KPCR+0x96清0后调用KiDispatchInterrupt响应DPC软中断。否则做的工作就是和HalBeginSystemInterrupt一样的过程:把要降到的IRQL转换成任务优先级设置TRP,并把久的任务优先级转成IRQL返回。KfRaiseIrql、KfLowerIrql之类的函数也是这么一回事,把当前IRQL转成任务优先级修改TPR,并把原先TPR的值转成原先的IRQL并返回。而现在软中断的产生也有了APIC支持,APIC通过产生一个发向自己的处理器间中断,就可以产生一个软中断,因为可以指定该中断的向量,所以软中断就可以区分优先级别,如APC_LEVEL、DISPATCH_LEVEL。产生软中断的函数一样还是HalRequestSoftwareInterrupt,该函数会先判断KPCR+0x95是否和要产生的软中断IRQL一样,若是的话则置位KPCR+0x96并返回,表示现在IRQL大于DISPATCH_LEVEL所以不处理DPC中断。否则以要产生的软中断的IRQL为索引从HalpIRQLtoTPRHAL取出对应任务优先级,并或上0x4000,表示是发向自身的固定处理间中断,并用该值设置中断命令寄存器ICW的低32位,然后读取中断命令寄存器ICW的低32位是否为0x1000,确定中断消息已经发送后就返回,这时候软中断已经产生。值得注意的是APIC HAL里没有HalEndSoftwareInterrupt这个函数。HAL为软中断的IRQL提供了一个固定的中断向量:9 k+ \2 }/ \4 A
# S+ G3 j8 R' d* D; o2 a; k
#define ZERO_VECTOR 0x00 // IRQL 00 " W( l; Q. Q* D3 E0 C
#define APC_VECTOR 0x3D // IRQL 014 `& l1 M6 V: D% [5 j
#define DPC_VECTOR 0x41 // IRQL 021 c( n3 k5 I2 ~9 Y7 K$ [; Z
#define APIC_GENERIC_VECTOR 0xC1 // IRQL 27' ]: ]! ^3 [% A+ s( _( l
#define APIC_CLOCK_VECTOR 0xD1 // IRQL 28. D( ]6 Q: g% w+ y0 Z
#define APIC_SYNCH_VECTOR 0xD1 // IRQL 28
0 c$ m3 X: p- k+ j9 h5 ?5 K#define APIC_IPI_VECTOR 0xE1 // IRQL 29
3 @" I9 j/ s- C#define POWERFAIL_VECTOR 0xEF // IRQL 302 r, M: p# a) c- ~
#define APIC_PROFILE_VECTOR 0xFD // IRQL 31
5 G' b: l5 W! k& p+ W& J6 ?
; R% R8 \$ {8 V( i4 ?2 p# Q
+ s8 T! e- a2 Q$ \7 h, M$ c现在看一下一些重要的数据:& y/ c8 P- _4 j; a1 S- x
6 F; y9 `9 Y' l; {' e2 J+ r6 @这是我写的代码输出的IO APIC重定向表内容:
# x) D1 \/ T t8 x; i7 k9 D" l$ Z
0 [9 T, q5 N+ k ]) ~9 dRedirect Table Index: 0x17
P( Z& e$ z5 J* e1 E, `Redirect Table[ 0]: ff
% x$ R: t0 x rRedirect Table[ 1]: b3& w6 W$ `; P+ V9 }
Redirect Table[ 2]: ff
6 D5 }* i7 K7 V2 s9 @Redirect Table[ 3]: 51) Y& Z" h+ m4 i5 Q, M4 i- |" G8 B
Redirect Table[ 4]: ff* ?. r, B; S6 c8 X5 A; {
Redirect Table[ 5]: ff
7 i6 E; e! t3 _ q3 ]7 V1 W6 uRedirect Table[ 6]: 62
8 x3 v" q4 \6 Q0 N9 K% cRedirect Table[ 7]: ff
. ?. T; {5 }% V: z% N) @/ URedirect Table[ 8]: d1
$ C0 g- f$ O5 ?Redirect Table[ 9]: b18 y8 d. j/ v: I d3 V& v( [
Redirect Table[ a]: ff
7 z) ^" h* V% xRedirect Table[ b]: ff( d4 p7 o9 D/ i( Y7 U% U
Redirect Table[ c]: 52
0 o- J7 l( V$ N6 ]# d- SRedirect Table[ d]: ff
1 W) v, I5 o4 @& X1 z* @5 I2 |0 uRedirect Table[ e]: ff
4 @9 S* E2 I2 d8 H! ^: }; B* y% ORedirect Table[ f]: 92
: T4 E2 G; E. U& q! |& k- oRedirect Table[10]: ff
9 Y3 e, _6 `* G! \Redirect Table[11]: a3
! X: |9 V0 ^1 BRedirect Table[12]: 83
; l5 X2 H, Y; o" A2 m8 d+ ^Redirect Table[13]: 93% Q6 o$ i- o$ a6 Z7 s/ `
Redirect Table[14]: ff
/ j1 E) E. D* A5 x5 ]5 aRedirect Table[15]: ff
- ]" ]3 c7 m4 r1 E( e0 y XRedirect Table[16]: ff
+ h8 a2 C G: T; iRedirect Table[17]: ff
7 g+ M8 h* i! }0 p+ j+ \4 i- I u a0 ~5 D6 |
这是IDT表中被注册的向量:
8 Y" ^4 L' h6 U5 z- }: Z8 l ]; C3 @# ~- v. m ?3 H
1f: 80064908 (hal!HalpApicSpuriousService)
. Y) w$ ~0 X# g37: 800640b8 (hal!PicSpuriousService37)- `0 T" ^6 ~! l' V6 s% U- [
3d: 80065254 (hal!HalpApcInterrupt)
2 A+ B- j( p5 L) _% ~! I; I41: 800650c8 (hal!HalpDispatchInterrupt)4 F: i% p% B" i D! Q0 b+ n
50: 80064190 (hal!HalpApicRebootService)
- `0 ~; J( B/ g3 t; Z51: 817f59e4
S7 U+ _& }# B/ J/ Z5 w5 T6 l(Vector:51,Irql:4,SyncIrql:4,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:serial!SerialCIsrSw(f3c607c7))
& B! d, V$ P. p7 R$ u5 H/ t52: 817f5044
# B* Y0 o0 `2 ]. V6 U V: u: I* \(Vector:52,Irql:4,SyncIrql:a,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:i8042prt!I8042MouseInterruptService(f3c57a2c))
. y& c' d7 v5 `# j; J83: 817d2d44
( D. K6 L* C3 L, T(Vector:83,Irql:7,SyncIrql:7,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:NDIS!ndisMIsr(bff1b794))# P" `, g2 }' B4 t+ M4 h! H
92: 81821384
$ I* Q3 v3 `( c' |; p E8 t(Vector:92,Irql:8,SyncIrql:8,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:atapi!ScsiPortInterrupt(bff892be))' A \7 n( u% G; I2 t
93: 8185ed64
2 J8 Y) Y, S" w" @' j3 N1 |. L(Vector:93,Irql:8,SyncIrql:8,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:uhcd!UHCD_InterruptService(f3f0253e))
" B* k D. o! Q! R1 _( b; v' |a3: 8186cdc4 # |$ {6 v) B( [) b# D! L& j; Y
(Vector:a3,Irql:9,SyncIrql:9,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:SCSIPORT!ScsiPortInterrupt(bff719f0))
& H9 J; [+ H" D" J5 F$ k8 _b1: 818902e4 6 W+ m- r2 |6 `' j1 U- l" N7 O
(Vector:b1,Irql:a,SyncIrql:a,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:ACPI!ACPIInterruptServiceRoutine(bffe14b4))1 ]9 I/ b G! ^) N
b3: 81881664
. ~1 ^- D& R3 B) i! l d# _( }6 A(Vector:b3,Irql:a,SyncIrql:a,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:i8042prt!I8042KeyboardInterruptService(f3c51918))8 W. c) W1 y5 o# v
c1: 800642fc (hal!HalpBroadcastCallService)
" ?7 P% k$ i0 c# r. x9 Gd1: 80063964 (hal!HalpClockInterrupt)$ [: n& P; }3 g$ n/ t
e1: 80064858 (hal!HalpIpiHandler)& \0 V% b1 @% z* w% S
e3: 800645d4 (hal!HalpLocalApicErrorService)
- h( r" [$ K) ^: z5 m# R4 ^" `9 bfd: 80064d64 (hal!HalpProfileInterrupt)3 K8 @/ Q: ~. ~$ |4 l
fe: 80064eec (hal!HalpPerfInterrupt)
$ Z. b0 V/ S$ Q) |/ B" N9 t9 t( S$ b v; I8 P4 N5 x
象a3、b1这类输出内容很多的是被硬件注册的中断向量,而象d1、e3这种输出内容少的是注册为了的HAL内部使用的中断向量和本地APIC中断向量& |5 v/ S3 A, v: p% v Q
( [& W1 r4 y* Z) i) H/ h K这是几个重要的数组:
S+ j& A+ a, p& @4 f
5 v, u1 k" a, R) VHalVectorToIrql(这个数组是以向量除于16做索引):
5 b' F) O. F l% c8006a304 00 ff ff 01 02 04 05 06-07 08 09 0a 1b 1c 1d 1e' n& t; Q+ e% X; j' n
0 ^/ `9 K$ X# s
HalpIRQLtoTPR:, e9 Z g0 B* ~9 g9 A2 ]! V: M
8006a1e4 00 3d 41 41 51 61 71 81-91 a1 b1 b1 b1 b1 b1 b1
$ t: S: n1 F4 q. O' Y, Y8006a1f4 b1 b1 b1 b1 b1 b1 b1 b1-b1 b1 b1 c1 d1 e1 ef ff$ T4 U& ]2 s% {
" i* {0 E8 K) K. \7 x# B0 UHalpINTItoVector:
3 }* Q! \+ U" F+ C, Z8 I! d" y! J8006ada0 00 b3 61 51 a2 b2 62 91-a1 b1 71 81 52 82 72 92
4 V& C- y$ ?8 {( w x1 d8006adb0 00 a3 83 93 00 00 00 00-00 00 00 00 00 00 00 00
^$ F% S0 j' H9 e1 W3 Z6 E% P" n
1 h J; j, J/ ]: E0 LHalVectorToINTI:
* L) x4 `8 n! w* d4 {8006a204 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff8 ^& |% f9 D4 U" s/ E
8006a214 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff- E6 Q9 X" b6 _% G
8006a224 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff! v6 f% s, p1 k
8006a234 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
* d# p. H! O! W& l' `& v8006a244 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
1 t4 a: W/ M$ O. E* l2 y9 J$ v- V8006a254 ff 03 0c ff ff ff ff ff-ff ff ff ff ff ff ff ff
: L1 ]( R, B: t8006a264 ff 02 06 ff ff ff ff ff-ff ff ff ff ff ff ff ff/ r0 Z8 P% [) }* S) ]0 z
8006a274 ff 0a 0e ff ff ff ff ff-ff ff ff ff ff ff ff ff
: ~$ q" j' G$ p8006a284 ff 0b 0d 12 ff ff ff ff-ff ff ff ff ff ff ff ff
4 b# u7 b( ^7 w0 ]' w/ N8006a294 ff 07 0f 13 ff ff ff ff-ff ff ff ff ff ff ff ff( i n0 T# @! n# V# ^
8006a2a4 ff 08 04 11 ff ff ff ff-ff ff ff ff ff ff ff ff
' V2 G. b7 ?9 U- M! J6 d9 j6 R, |5 X8006a2b4 ff 09 05 01 ff ff ff ff-ff ff ff ff ff ff ff ff
8 |9 J! O+ y H7 O _8 J8006a2c4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
4 `2 s2 D" U% ~, f3 x. {8006a2d4 ff 08 ff ff ff ff ff ff-ff ff ff ff ff ff ff ff, z4 G; P2 N7 t& Q q# o. r
8006a2e4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
; Q" W- _1 r! R) I8006a2f4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff
" U$ L" v2 ]5 n: k+ Y; G1 R/ s* M3 R; b; K& w# s! t5 @
1 _2 J3 }# ~; A s/ I" S
vBucket:0 o1 Y. c) {4 @) \8 a
8006ae30 02 02 02 03 03 03 038 |9 y( M% V+ F
9 F& X- i! V$ Z, o 举个例子来说明一下,在我虚拟机里SCSI Controller的IRQ是17(注意,已经大于16了),到重定向表中查找第17项,得到中断向量为0xa3,再看IDT,0xa3对应处理例程是SCSIPORT!ScsiPortInterrupt。6 ]5 }0 m$ |" P
C4 t. |0 O s& D) Y2 ^* H vBucket数组干啥用的?它就是用来分配新的向量。分配算法很简单,当要分配一个新的向量时,就在vBucket数组从右到左搜索最小的一个数i,该数对应在vBucket中索引为Index,新向量为(0x50+Index*16+i+1),新向量对应的IRQL为(4+i+1),同时会把vBucket中这个i加1,i不等大于16。象给出的这个vBucket,下一次计算时i=2, index=2。不过这些用于硬件的向量在IO系统初始化时调用HalpGetSystemInterruptVector分配好了,然后通过IoConnectInterrupt把IDT中注册的向量位置的例程注册为中断处理程序。这里并不是每个注册的向量都会对应中断处理程序,象上面给出的例子中,0xa1、0xa2、0xb1等向量就没有对应。
7 }4 B1 g9 q5 h8 A; m) e. `, L! N. O! L5 y+ K
IRQL机制为内核同步提供了很大的便利,既对驱动开发者隐藏了底层中断机制,也方便了驱动开发者的内核同步。LINUX从2.5内核开始引进的软中断和任务队列等机制,很大程度上也来自windows这套机制的借鉴。
2 l* y0 I0 d, [: k: O/ {& _5 M E4 p, G9 b8 I( @
终于考完试,解放了,呵呵。这个东西其实还有很多可写的,只是没空再深入去分析了。在未来的64位系统里,APIC这种基于中断引脚的机制很快也要被SAPIC这种基于消息的更强大的机制所取代 |
|