|
楼主 |
发表于 2008-2-27 14:35:05
|
显示全部楼层
从IRQ到IRQL(APIC版)
来自:http://www.nsfocus.net/index.php ... o=view&mid=2534
# p. S' {& S+ }. B! K( d
$ D7 b+ P; w: F& s- d从IRQ到IRQL(APIC版)
- k$ P/ a9 o% j+ y* Q
0 ~7 }- w0 y- W作者:SoBeIt, h4 F7 l" T# M1 W& i6 O5 w
出处:https://www.xfocus.net/bbs/index.php?act=ST&f=2&t=45502
1 S, ^" f6 T9 G( }0 |2 A. k7 G/ t日期:2005-02-04
2 W) E% b9 J7 i( h, E2 E6 e
5 F: i+ s- o! y& M+ @2 Y事实上,老久的PIC在很早以前就被淘汰了,取而代之的是APIC。由于APIC可以兼容PIC,所以在很多单处理器系统上我们看到的PIC实际是APIC的兼容PIC模式。APIC主要应用于多处理器操作系统,是为了解决IRQ太少和处理器间中断而产生的,当然,单处理器操作系统也可以使用APIC(不是模拟PIC)。APIC的HAL和PIC的HAL有很大的不同,很突出的一个特点就是APIC的HAL不用再象PIC的HAL那样虚拟一个中断控制器,IRQL的概念已经可以通过中断向量的形式被APIC支持。事实上,因为被APIC所支持,所以在APIC HAL里IRQL的实现比PIC HAL那样虚拟一个中断控制器要简单得多了。
! \9 F& b8 I" H$ C1 G/ F1 P$ o9 L2 p
现在来简单介绍一下APIC的结构(关于APIC详细的描述请参考《IA-32 Inel Architecture Software Developer's Manual Volume 3 Chapter 8》)。整个APIC系统由本地APIC、IO APIC和APIC串行总线组成(在Pentium 4和Xeon以后,APIC总线放到了系统总线中)组成。每个处理器中集成了一个本地APIC,而IO APIC是系统芯片组中一部分,APIC总线负责连接IO APIC和各个本地APIC。本地APIC接收该处理器产生的本地中断比如时钟中断,以及由该处理器产生的处理器间中断,并从APIC串行总线接收来自IO APIC的消息;IO APIC负责接收所有外部的硬件中断,并翻译成消息选择发给接收中断的处理器,以及从本地APIC接收处理器间中断消息。, J, y w* z( P! B- I1 K( `( q" N4 s
) h t% d; ~" M& g8 _9 e 和PIC一样,控制本地APIC和IO APIC的方法是通过读写该单元中的相关寄存器。不过和PIC不一样的是,Intel把本地APIC和IO APIC的寄存器都映射到了物理地址空间,本地APIC默认映射到物理地址0xffe00000,IO APIC默认映射到物理地址0xfec00000。windows HAL再进一步把本地APIC映射到虚拟地址0xfffe0000,把IO APIC映射到虚拟地址0xffd06000,也就是说对该地址的读写实际就是对寄存器的读写,本地APIC里几个重要的寄存有EOI寄存器,任务优先级寄存器(TPR),处理器优先级寄存器(PPR),中断命令寄存器(ICR,64位),中断请求寄存器(IRR,256位,对应每个向量一位),中断在服务寄存器(ISR,256位)等。IO APIC里几个重要的寄存器有版本寄存器,I/O寄存器选择寄存器、I/O窗口寄存器(用要访问的I/O APIC寄存器的索引设置地址I/O寄存器选择寄存器,此时访问I/O窗口寄存器就是访问被选定的寄存器)还有很重要的是一个IO重定向表,每一个表项是一个64位寄存器,包括向量和目标模式、传输模式等相关位,每一个表项连接一条IRQ线,表项的数目随处理器的版本而不一样,在Pentium 4上为24个表项。表项的数目保存在IO APIC版本寄存器的[16:23]位。APIC系统支持255个中断向量,但Intel保留了0-15向量,可用的向量是16-255。并引进一个概念叫做任务优先级=中断向量/16,因为保留了16个向量,所以可用的优先级是2-15。当用一个指定的优先级设置本地APIC中的任务优先级寄存器TPR后,所有优先级低于TPR中优先级的中断都被屏蔽,是不是很象IRQL的机制?事实上,APIC HAL里的IRQL机制也就是靠着这个任务优先级寄存器得以实现。同一个任务优先级包括了16个中断向量,可以进一步细粒度地区分中断的优先级。
& B- L }1 q" V5 w8 Q7 m9 I( V+ m- K/ j: q0 h- _# h3 m* k" v
在HAL里虽然HalBeginSystemInterrupt仍然是IRQL机制的发动引擎,但是因为有APIC的支持,它和其它共同实现IRQL的函数要比PIC HAL里对应的函数功能简单得多。HalBeginSystemInterrupt通过用IRQL做索引在HalpIRQLtoTPR数组中获取该IRQL对应的任务优先级,用该优先级设置任务优先级寄存器TPR,并把TPR中原先的任务优先级/16做为索引在HalpVectorToIRQL数组中获取对应的原先的IRQL然后返回。若IRQL是从低于DISPATCH_LEVEL提升到高于DISPATCH_LEVEL,还需要设置KPCR+0x95(0xffdff095)为DISPATCH_LEVEL(0x2),表示是从DISPATCH_LEVEL以下的级别提升IRQL。HalEndSystemInterrupt向本地APIC的EOI寄存发送0,表示中断结束,可以接收新中断。并还要判断要降到的IRQL是否小于DISPATCH_LEVEL,若小于则进一步判断KPCR+0x96(0xffdff096)是否置位,若置位则表示有DPC中断在等待(在IRQL高于DISPATCH_LEVEL被引发,然后等待直到IRQL降到低于DISPATCH_LEVEL),则将KPCR+0x95和KPCR+0x96清0后调用KiDispatchInterrupt响应DPC软中断。否则做的工作就是和HalBeginSystemInterrupt一样的过程:把要降到的IRQL转换成任务优先级设置TRP,并把久的任务优先级转成IRQL返回。KfRaiseIrql、KfLowerIrql之类的函数也是这么一回事,把当前IRQL转成任务优先级修改TPR,并把原先TPR的值转成原先的IRQL并返回。而现在软中断的产生也有了APIC支持,APIC通过产生一个发向自己的处理器间中断,就可以产生一个软中断,因为可以指定该中断的向量,所以软中断就可以区分优先级别,如APC_LEVEL、DISPATCH_LEVEL。产生软中断的函数一样还是HalRequestSoftwareInterrupt,该函数会先判断KPCR+0x95是否和要产生的软中断IRQL一样,若是的话则置位KPCR+0x96并返回,表示现在IRQL大于DISPATCH_LEVEL所以不处理DPC中断。否则以要产生的软中断的IRQL为索引从HalpIRQLtoTPRHAL取出对应任务优先级,并或上0x4000,表示是发向自身的固定处理间中断,并用该值设置中断命令寄存器ICW的低32位,然后读取中断命令寄存器ICW的低32位是否为0x1000,确定中断消息已经发送后就返回,这时候软中断已经产生。值得注意的是APIC HAL里没有HalEndSoftwareInterrupt这个函数。HAL为软中断的IRQL提供了一个固定的中断向量:! j' A; P) p7 J# S( W |
+ |2 }- }6 x% I#define ZERO_VECTOR 0x00 // IRQL 00
& h* n3 m, Z/ p6 }6 f#define APC_VECTOR 0x3D // IRQL 01/ o+ N3 s; E5 x6 {' x' |
#define DPC_VECTOR 0x41 // IRQL 02
, ]8 L3 ~8 h4 y* w0 W#define APIC_GENERIC_VECTOR 0xC1 // IRQL 27
2 c5 K! c# V) b% ]( d9 I( H#define APIC_CLOCK_VECTOR 0xD1 // IRQL 286 A/ Y5 K; J- w8 [2 j& Q+ E& c
#define APIC_SYNCH_VECTOR 0xD1 // IRQL 28; v) O2 ?# e# y1 H8 L j
#define APIC_IPI_VECTOR 0xE1 // IRQL 298 e. D* T4 L& B8 D
#define POWERFAIL_VECTOR 0xEF // IRQL 30! O5 P) V3 ]3 x3 W# E! |1 ^
#define APIC_PROFILE_VECTOR 0xFD // IRQL 312 s' u0 T ^3 R% v5 T4 N
5 i5 t" k9 ~' e! \
0 G& A4 W( v( |; H/ |现在看一下一些重要的数据:
6 @* s0 C4 `" M6 A; M
" X+ y; I+ L% q7 V9 q( v, f这是我写的代码输出的IO APIC重定向表内容:
4 }; e3 t/ G" _! |( g9 f- ^2 A" q5 j; c5 C0 f0 q9 N6 d; C
Redirect Table Index: 0x170 k& e4 M X6 q# z3 F
Redirect Table[ 0]: ff+ d: e4 D. Z- c ` e7 ]
Redirect Table[ 1]: b3
* A0 }# C8 q6 L8 uRedirect Table[ 2]: ff
) o; r# |4 d; w; z- E3 h: {8 K0 ]Redirect Table[ 3]: 51* U6 y D! \7 x( I- ~" T
Redirect Table[ 4]: ff+ D! L8 p5 v1 K2 D' q, t
Redirect Table[ 5]: ff
8 A9 M# V9 ^ [Redirect Table[ 6]: 62
" C# @9 k2 M# N0 ?- c5 H% ~+ Q* kRedirect Table[ 7]: ff& i& j' S" r3 y2 J- ?
Redirect Table[ 8]: d1, p1 W C" S j) B: O) |
Redirect Table[ 9]: b1; T1 A2 m0 B6 X9 ?
Redirect Table[ a]: ff
5 G( }- s- Y: }0 [4 |Redirect Table[ b]: ff! k2 s C. B5 v4 A8 D" Y
Redirect Table[ c]: 528 }% d: e( _6 |; y
Redirect Table[ d]: ff
5 x8 \& w8 H2 t3 F- G; f7 ERedirect Table[ e]: ff1 v0 J6 r( a+ s; p: p* \
Redirect Table[ f]: 92
+ @% C& }. A8 xRedirect Table[10]: ff+ l1 V% t- Z& b; Y
Redirect Table[11]: a3
2 e0 u, d- E: H/ T( t5 wRedirect Table[12]: 83
; U: W7 m* f( w& }Redirect Table[13]: 93, H! D3 p+ W( e- [$ k3 ^' X
Redirect Table[14]: ff
" q3 S0 @2 g# [! A5 c# yRedirect Table[15]: ff% W# B& s. _) v2 L4 v7 t
Redirect Table[16]: ff5 r! ~# C8 Q6 N' j
Redirect Table[17]: ff
! ?* z/ v2 k+ K" s/ d3 k5 N% W* c- F4 ]
这是IDT表中被注册的向量:* Z8 m& I3 R; m
) T! a! |( P! P
1f: 80064908 (hal!HalpApicSpuriousService)
$ W: y0 i" U7 ^, u37: 800640b8 (hal!PicSpuriousService37)
; N% A3 \4 r6 s5 g8 s5 [8 W( a3 x) U3d: 80065254 (hal!HalpApcInterrupt)
/ K0 C9 o9 q# D. q41: 800650c8 (hal!HalpDispatchInterrupt)( y Z# B1 C% P
50: 80064190 (hal!HalpApicRebootService)
3 Y5 _ Y( @* m51: 817f59e4
: ?. \0 U# u3 e(Vector:51,Irql:4,SyncIrql:4,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:serial!SerialCIsrSw(f3c607c7))- ]- j0 K/ D# Y# Z! L5 Z
52: 817f5044 9 o* L! k% i4 S
(Vector:52,Irql:4,SyncIrql:a,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:i8042prt!I8042MouseInterruptService(f3c57a2c)): S h: F" l$ W1 c
83: 817d2d44 % p$ R/ _8 z' j
(Vector:83,Irql:7,SyncIrql:7,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:NDIS!ndisMIsr(bff1b794)): Z$ U. o8 e; b i( I2 K9 x
92: 81821384
* a3 U8 `+ ?% u: |(Vector:92,Irql:8,SyncIrql:8,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:atapi!ScsiPortInterrupt(bff892be))7 O8 ]4 _" l6 L
93: 8185ed64 , c# j% y) w. v! n, ~4 u
(Vector:93,Irql:8,SyncIrql:8,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:uhcd!UHCD_InterruptService(f3f0253e))- j7 ]/ B9 ^! L$ D. o7 U9 a* O% v
a3: 8186cdc4
0 N+ o8 L% M: a/ r(Vector:a3,Irql:9,SyncIrql:9,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:SCSIPORT!ScsiPortInterrupt(bff719f0))7 {8 z5 g6 e- ]: k7 o& v
b1: 818902e4 : h8 n1 L$ E% q+ R( R! A
(Vector:b1,Irql:a,SyncIrql:a,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:ACPI!ACPIInterruptServiceRoutine(bffe14b4)); \1 F* U$ _# U0 z) I) }' m
b3: 81881664
N* Q7 j8 e/ C7 t! @(Vector:b3,Irql:a,SyncIrql:a,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:i8042prt!I8042KeyboardInterruptService(f3c51918))% x T# \5 ^( _: ?
c1: 800642fc (hal!HalpBroadcastCallService)
# \( [* b8 q2 B$ m) x: r5 V6 ~d1: 80063964 (hal!HalpClockInterrupt)
$ m4 v# V6 Q7 F; J3 v: i& Pe1: 80064858 (hal!HalpIpiHandler)$ O1 `4 P) O2 x: Q4 [
e3: 800645d4 (hal!HalpLocalApicErrorService)
3 g6 b x! b" j* P* I0 cfd: 80064d64 (hal!HalpProfileInterrupt)0 l) m) T+ T' `* p6 s" A* Y
fe: 80064eec (hal!HalpPerfInterrupt); N7 M$ D% l) z& m7 ]
1 Y: X- K0 ~% {$ L& l+ o5 J+ v6 Z k
象a3、b1这类输出内容很多的是被硬件注册的中断向量,而象d1、e3这种输出内容少的是注册为了的HAL内部使用的中断向量和本地APIC中断向量( @2 @8 T: Z! G
: n2 r5 l! g% C3 e/ @7 C/ c
这是几个重要的数组:# ^' O/ ^/ M2 M- M) l L6 H
; w) a5 W+ c/ p5 p3 J( h
HalVectorToIrql(这个数组是以向量除于16做索引):' G3 ~) S/ A6 s5 i" a1 b
8006a304 00 ff ff 01 02 04 05 06-07 08 09 0a 1b 1c 1d 1e$ n# Q" k6 b: u" f
1 H X( v( n$ X" e$ n+ M7 F9 dHalpIRQLtoTPR:
( J$ a4 }7 o2 I% ]8006a1e4 00 3d 41 41 51 61 71 81-91 a1 b1 b1 b1 b1 b1 b1
: u7 O1 d, Y+ L$ W4 A; J6 E8006a1f4 b1 b1 b1 b1 b1 b1 b1 b1-b1 b1 b1 c1 d1 e1 ef ff
" g! L3 s- D9 J7 H9 j7 A2 a; k
# T$ x3 j% \6 GHalpINTItoVector:
% {8 a, j6 E5 h7 v3 v8006ada0 00 b3 61 51 a2 b2 62 91-a1 b1 71 81 52 82 72 92
* k1 D2 s5 b1 C- B) P) F6 r; k& n) V8006adb0 00 a3 83 93 00 00 00 00-00 00 00 00 00 00 00 001 H: W) \ y2 j9 a
( o$ P. m! w, U
HalVectorToINTI:
# @1 P6 k9 ?1 D3 Y8006a204 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
4 [2 r5 T \3 R# ]& N' p h8006a214 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
* d2 N$ O1 a1 q+ N, a' v' R8006a224 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff W2 I, E9 ^) O% Z. d* D, D
8006a234 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff& [* i; @6 j; k' G
8006a244 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
; }. ?- I8 t1 `# V, ~8006a254 ff 03 0c ff ff ff ff ff-ff ff ff ff ff ff ff ff
R( V1 x* [9 g* L% G8006a264 ff 02 06 ff ff ff ff ff-ff ff ff ff ff ff ff ff" t0 F$ S5 n0 L+ K8 g* |
8006a274 ff 0a 0e ff ff ff ff ff-ff ff ff ff ff ff ff ff/ A/ z% o7 _( q d# p
8006a284 ff 0b 0d 12 ff ff ff ff-ff ff ff ff ff ff ff ff
* k. ?" @+ o3 z! o! ?8006a294 ff 07 0f 13 ff ff ff ff-ff ff ff ff ff ff ff ff# s: s% p1 ?" D' O7 `
8006a2a4 ff 08 04 11 ff ff ff ff-ff ff ff ff ff ff ff ff z, F& F& m d) r* s" Q' ]7 |' r
8006a2b4 ff 09 05 01 ff ff ff ff-ff ff ff ff ff ff ff ff
1 v {( x- c- w0 J: z* @8006a2c4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
, O3 a+ `" G- v7 d, u, I: D8 S8006a2d4 ff 08 ff ff ff ff ff ff-ff ff ff ff ff ff ff ff! Z. v: Y0 Q V9 H# R
8006a2e4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
0 Z H: o5 i. @( J" s5 {8006a2f4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ! P) n& a0 f" D |
3 h+ `1 E1 o8 ?* x
7 F, X* W7 t2 _vBucket: I# |! m9 r; P8 b0 D% C
8006ae30 02 02 02 03 03 03 03% \4 X: R& e* D% D, S5 a
y, i5 H: R8 Q5 x# p 举个例子来说明一下,在我虚拟机里SCSI Controller的IRQ是17(注意,已经大于16了),到重定向表中查找第17项,得到中断向量为0xa3,再看IDT,0xa3对应处理例程是SCSIPORT!ScsiPortInterrupt。! E7 c3 S2 e+ j1 t3 I
! G. X6 Z, j5 y; c vBucket数组干啥用的?它就是用来分配新的向量。分配算法很简单,当要分配一个新的向量时,就在vBucket数组从右到左搜索最小的一个数i,该数对应在vBucket中索引为Index,新向量为(0x50+Index*16+i+1),新向量对应的IRQL为(4+i+1),同时会把vBucket中这个i加1,i不等大于16。象给出的这个vBucket,下一次计算时i=2, index=2。不过这些用于硬件的向量在IO系统初始化时调用HalpGetSystemInterruptVector分配好了,然后通过IoConnectInterrupt把IDT中注册的向量位置的例程注册为中断处理程序。这里并不是每个注册的向量都会对应中断处理程序,象上面给出的例子中,0xa1、0xa2、0xb1等向量就没有对应。
- q c- } c: b. m
; Y3 o; A3 t3 {% F$ Q9 K IRQL机制为内核同步提供了很大的便利,既对驱动开发者隐藏了底层中断机制,也方便了驱动开发者的内核同步。LINUX从2.5内核开始引进的软中断和任务队列等机制,很大程度上也来自windows这套机制的借鉴。; P& A2 Q8 n* }! ^0 e) I
( ^7 z* Y" i7 ^; ?2 X0 V" ^( }" d 终于考完试,解放了,呵呵。这个东西其实还有很多可写的,只是没空再深入去分析了。在未来的64位系统里,APIC这种基于中断引脚的机制很快也要被SAPIC这种基于消息的更强大的机制所取代 |
|