|
|
楼主 |
发表于 2008-2-27 14:35:05
|
显示全部楼层
从IRQ到IRQL(APIC版)
来自:http://www.nsfocus.net/index.php ... o=view&mid=2534
1 v( x) d: t) Z* |8 G$ ` G ?( o8 B
从IRQ到IRQL(APIC版)
0 X1 S9 g, g' Q0 |. x% z4 ?/ \6 l7 P: }$ [3 j$ I1 f2 L
作者:SoBeIt0 i! G- t3 V: G0 {" I H
出处:https://www.xfocus.net/bbs/index.php?act=ST&f=2&t=45502
; d/ u0 C9 m x日期:2005-02-04) s; Q( p2 k X! |& m
) F5 K9 _ l, H9 u4 C E& E% f; G
事实上,老久的PIC在很早以前就被淘汰了,取而代之的是APIC。由于APIC可以兼容PIC,所以在很多单处理器系统上我们看到的PIC实际是APIC的兼容PIC模式。APIC主要应用于多处理器操作系统,是为了解决IRQ太少和处理器间中断而产生的,当然,单处理器操作系统也可以使用APIC(不是模拟PIC)。APIC的HAL和PIC的HAL有很大的不同,很突出的一个特点就是APIC的HAL不用再象PIC的HAL那样虚拟一个中断控制器,IRQL的概念已经可以通过中断向量的形式被APIC支持。事实上,因为被APIC所支持,所以在APIC HAL里IRQL的实现比PIC HAL那样虚拟一个中断控制器要简单得多了。3 Y- E y# x5 }' q: e/ \
5 Q! o$ W' D0 d3 z1 g8 c 现在来简单介绍一下APIC的结构(关于APIC详细的描述请参考《IA-32 Inel Architecture Software Developer's Manual Volume 3 Chapter 8》)。整个APIC系统由本地APIC、IO APIC和APIC串行总线组成(在Pentium 4和Xeon以后,APIC总线放到了系统总线中)组成。每个处理器中集成了一个本地APIC,而IO APIC是系统芯片组中一部分,APIC总线负责连接IO APIC和各个本地APIC。本地APIC接收该处理器产生的本地中断比如时钟中断,以及由该处理器产生的处理器间中断,并从APIC串行总线接收来自IO APIC的消息;IO APIC负责接收所有外部的硬件中断,并翻译成消息选择发给接收中断的处理器,以及从本地APIC接收处理器间中断消息。& p! K8 Y+ |( e% L* a& }9 G) g
/ o" }1 f+ N! [, {' r% x( X# s) ? 和PIC一样,控制本地APIC和IO APIC的方法是通过读写该单元中的相关寄存器。不过和PIC不一样的是,Intel把本地APIC和IO APIC的寄存器都映射到了物理地址空间,本地APIC默认映射到物理地址0xffe00000,IO APIC默认映射到物理地址0xfec00000。windows HAL再进一步把本地APIC映射到虚拟地址0xfffe0000,把IO APIC映射到虚拟地址0xffd06000,也就是说对该地址的读写实际就是对寄存器的读写,本地APIC里几个重要的寄存有EOI寄存器,任务优先级寄存器(TPR),处理器优先级寄存器(PPR),中断命令寄存器(ICR,64位),中断请求寄存器(IRR,256位,对应每个向量一位),中断在服务寄存器(ISR,256位)等。IO APIC里几个重要的寄存器有版本寄存器,I/O寄存器选择寄存器、I/O窗口寄存器(用要访问的I/O APIC寄存器的索引设置地址I/O寄存器选择寄存器,此时访问I/O窗口寄存器就是访问被选定的寄存器)还有很重要的是一个IO重定向表,每一个表项是一个64位寄存器,包括向量和目标模式、传输模式等相关位,每一个表项连接一条IRQ线,表项的数目随处理器的版本而不一样,在Pentium 4上为24个表项。表项的数目保存在IO APIC版本寄存器的[16:23]位。APIC系统支持255个中断向量,但Intel保留了0-15向量,可用的向量是16-255。并引进一个概念叫做任务优先级=中断向量/16,因为保留了16个向量,所以可用的优先级是2-15。当用一个指定的优先级设置本地APIC中的任务优先级寄存器TPR后,所有优先级低于TPR中优先级的中断都被屏蔽,是不是很象IRQL的机制?事实上,APIC HAL里的IRQL机制也就是靠着这个任务优先级寄存器得以实现。同一个任务优先级包括了16个中断向量,可以进一步细粒度地区分中断的优先级。( b; k& E" l6 E/ u& f5 `, u
# a! {" A: t, n" }
在HAL里虽然HalBeginSystemInterrupt仍然是IRQL机制的发动引擎,但是因为有APIC的支持,它和其它共同实现IRQL的函数要比PIC HAL里对应的函数功能简单得多。HalBeginSystemInterrupt通过用IRQL做索引在HalpIRQLtoTPR数组中获取该IRQL对应的任务优先级,用该优先级设置任务优先级寄存器TPR,并把TPR中原先的任务优先级/16做为索引在HalpVectorToIRQL数组中获取对应的原先的IRQL然后返回。若IRQL是从低于DISPATCH_LEVEL提升到高于DISPATCH_LEVEL,还需要设置KPCR+0x95(0xffdff095)为DISPATCH_LEVEL(0x2),表示是从DISPATCH_LEVEL以下的级别提升IRQL。HalEndSystemInterrupt向本地APIC的EOI寄存发送0,表示中断结束,可以接收新中断。并还要判断要降到的IRQL是否小于DISPATCH_LEVEL,若小于则进一步判断KPCR+0x96(0xffdff096)是否置位,若置位则表示有DPC中断在等待(在IRQL高于DISPATCH_LEVEL被引发,然后等待直到IRQL降到低于DISPATCH_LEVEL),则将KPCR+0x95和KPCR+0x96清0后调用KiDispatchInterrupt响应DPC软中断。否则做的工作就是和HalBeginSystemInterrupt一样的过程:把要降到的IRQL转换成任务优先级设置TRP,并把久的任务优先级转成IRQL返回。KfRaiseIrql、KfLowerIrql之类的函数也是这么一回事,把当前IRQL转成任务优先级修改TPR,并把原先TPR的值转成原先的IRQL并返回。而现在软中断的产生也有了APIC支持,APIC通过产生一个发向自己的处理器间中断,就可以产生一个软中断,因为可以指定该中断的向量,所以软中断就可以区分优先级别,如APC_LEVEL、DISPATCH_LEVEL。产生软中断的函数一样还是HalRequestSoftwareInterrupt,该函数会先判断KPCR+0x95是否和要产生的软中断IRQL一样,若是的话则置位KPCR+0x96并返回,表示现在IRQL大于DISPATCH_LEVEL所以不处理DPC中断。否则以要产生的软中断的IRQL为索引从HalpIRQLtoTPRHAL取出对应任务优先级,并或上0x4000,表示是发向自身的固定处理间中断,并用该值设置中断命令寄存器ICW的低32位,然后读取中断命令寄存器ICW的低32位是否为0x1000,确定中断消息已经发送后就返回,这时候软中断已经产生。值得注意的是APIC HAL里没有HalEndSoftwareInterrupt这个函数。HAL为软中断的IRQL提供了一个固定的中断向量:( e9 w+ S: Z* G* s
& \9 C( F- G# j5 K; r! x/ f#define ZERO_VECTOR 0x00 // IRQL 00
; D+ x7 r7 M6 R#define APC_VECTOR 0x3D // IRQL 017 c/ I; { r9 K8 e ]: h# S
#define DPC_VECTOR 0x41 // IRQL 02
, a/ K* U* Q) P. n' Y1 Y5 k#define APIC_GENERIC_VECTOR 0xC1 // IRQL 272 d6 T/ ?3 J( Y1 B( s& ]; \
#define APIC_CLOCK_VECTOR 0xD1 // IRQL 28
/ q2 C5 R2 Y2 `! j, B+ }# h#define APIC_SYNCH_VECTOR 0xD1 // IRQL 28
$ w& M2 [- F! J0 U7 x#define APIC_IPI_VECTOR 0xE1 // IRQL 29+ w1 M' R& S; L' _) r% k. q( r5 M% m
#define POWERFAIL_VECTOR 0xEF // IRQL 30; k, K5 I6 b. \# m) m* d3 a0 z: L( e
#define APIC_PROFILE_VECTOR 0xFD // IRQL 31
3 {, F' |/ ^- L$ q+ t n: S+ F5 s+ k; X- N& p1 v+ q0 @
& f' }' b4 Z( p* a5 U0 D
现在看一下一些重要的数据:
: ]( w$ X/ C, Q) t9 {% F6 C: R% X' t" N- m1 [
这是我写的代码输出的IO APIC重定向表内容:& K0 I9 T, L4 X# ~3 ?
" B4 P1 Q2 l' @- o$ I' `9 \' XRedirect Table Index: 0x17; U" b \6 o1 B1 U4 R& ?- T
Redirect Table[ 0]: ff! \9 D' H; Q6 \) _' O- i
Redirect Table[ 1]: b3: W: A S' a5 J. V' o* b
Redirect Table[ 2]: ff
. ?) R" G6 U2 k' eRedirect Table[ 3]: 51
( ]0 [5 A/ ^" y0 f0 X% qRedirect Table[ 4]: ff
G8 O+ Z; H1 [1 {4 b9 aRedirect Table[ 5]: ff4 x) X7 i1 p5 H( ]
Redirect Table[ 6]: 62
9 j5 O! [5 d3 |9 l$ KRedirect Table[ 7]: ff
% H2 U0 C/ }% {: [! d, C1 ?Redirect Table[ 8]: d1
- X% N! u( N' b% L3 |8 ]Redirect Table[ 9]: b1
, S1 `; g) [2 _6 k" \3 F6 xRedirect Table[ a]: ff
0 g+ Q0 D8 i! N* N0 f: cRedirect Table[ b]: ff9 m R; J5 L4 t8 u
Redirect Table[ c]: 52' Y0 r7 x. _1 I% Z6 c3 z% Q$ d
Redirect Table[ d]: ff' y- c1 s# ]4 T9 K& y% B" T
Redirect Table[ e]: ff
0 I& w$ |5 y p1 vRedirect Table[ f]: 92) c2 F \. g4 c4 l
Redirect Table[10]: ff
" J- [' g8 j# k1 e; E4 X& oRedirect Table[11]: a31 M7 B3 H, V$ k3 y. w7 J/ F
Redirect Table[12]: 83
2 h. ^! h1 P0 j. I7 f1 {Redirect Table[13]: 93
* \( K+ g9 p& g! fRedirect Table[14]: ff5 \+ t$ s! A5 V) ]: R
Redirect Table[15]: ff
V$ c% B3 ]& o, |Redirect Table[16]: ff! T% C! d1 V6 r, F+ g) Z) n( L
Redirect Table[17]: ff5 P% \3 a4 E/ R6 ?- t# {
% p: ^) [! D3 p# b8 X0 p9 {2 |这是IDT表中被注册的向量:
* f' k1 P2 Q. W' U1 i- ], o$ G7 ?' T/ ~6 |% T& N. A6 p
1f: 80064908 (hal!HalpApicSpuriousService)7 m8 y5 U. U) I* J/ `8 A
37: 800640b8 (hal!PicSpuriousService37)
3 x! X& S- L: x+ ^; v3d: 80065254 (hal!HalpApcInterrupt)
4 }: F6 x3 T; E! s* P' G41: 800650c8 (hal!HalpDispatchInterrupt)
. `5 ?, o/ s+ s0 A50: 80064190 (hal!HalpApicRebootService)* N7 F! X) Q: R f: N4 T
51: 817f59e45 _) ], S; }/ x5 z! L8 `
(Vector:51,Irql:4,SyncIrql:4,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:serial!SerialCIsrSw(f3c607c7))
8 G f. c6 _4 |- p8 z" y52: 817f5044 " Z+ S" \: g, e0 a3 ^7 L& y; W
(Vector:52,Irql:4,SyncIrql:a,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:i8042prt!I8042MouseInterruptService(f3c57a2c))0 V- I7 M& \( H. g
83: 817d2d44
8 |7 a1 j8 e' ]1 F/ e(Vector:83,Irql:7,SyncIrql:7,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:NDIS!ndisMIsr(bff1b794))
" S6 U2 |7 T8 t9 u7 }7 Y92: 81821384 4 n2 B* h* w$ E+ r7 G) [4 h
(Vector:92,Irql:8,SyncIrql:8,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:atapi!ScsiPortInterrupt(bff892be))
9 A: \' ^! P9 g' A' h9 {7 Z. x* s; Y93: 8185ed64 , [ `. ?3 l6 f
(Vector:93,Irql:8,SyncIrql:8,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:uhcd!UHCD_InterruptService(f3f0253e))4 X* B- ^6 s5 s5 [8 L2 B; R; j
a3: 8186cdc4 " b) S9 G5 R1 {3 K7 u) d
(Vector:a3,Irql:9,SyncIrql:9,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:SCSIPORT!ScsiPortInterrupt(bff719f0))2 i# J) H8 {/ \
b1: 818902e4
, Q7 r( L9 s! C0 i* e(Vector:b1,Irql:a,SyncIrql:a,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:ACPI!ACPIInterruptServiceRoutine(bffe14b4))
& N# S y' F) \b3: 81881664
- J8 R* P7 C& {+ g; Q. v B, x(Vector:b3,Irql:a,SyncIrql:a,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:i8042prt!I8042KeyboardInterruptService(f3c51918))
' e8 y, q' \) H5 m/ y* Mc1: 800642fc (hal!HalpBroadcastCallService)9 y/ _" c/ g( f2 d0 J
d1: 80063964 (hal!HalpClockInterrupt)
' a. A4 S! }1 `1 ^4 f0 ue1: 80064858 (hal!HalpIpiHandler)2 D3 g+ i6 X7 c" r6 b: q0 u
e3: 800645d4 (hal!HalpLocalApicErrorService)
8 S1 g0 ]* Q% t$ W) V6 o( t2 o/ vfd: 80064d64 (hal!HalpProfileInterrupt)
6 R' Y+ E% k* R2 J4 u9 gfe: 80064eec (hal!HalpPerfInterrupt)
. g+ D& d. h6 I$ b+ |% w7 Z [) E C
象a3、b1这类输出内容很多的是被硬件注册的中断向量,而象d1、e3这种输出内容少的是注册为了的HAL内部使用的中断向量和本地APIC中断向量
3 O( b- B& B7 ^$ q; ~3 [4 `. E7 J' y" G& K' Y4 K/ \9 J5 M
这是几个重要的数组:
+ d$ G. c! l( c7 O+ h1 }
( p8 m: }/ m* T' f3 @3 }HalVectorToIrql(这个数组是以向量除于16做索引):5 B1 e+ y& R8 V$ }1 n
8006a304 00 ff ff 01 02 04 05 06-07 08 09 0a 1b 1c 1d 1e& o$ c4 C" x+ W; x$ G
& g* O5 @5 X6 O
HalpIRQLtoTPR:
8 y5 f& ]% B( \4 }8006a1e4 00 3d 41 41 51 61 71 81-91 a1 b1 b1 b1 b1 b1 b1, I |9 _9 I( \& n8 ~
8006a1f4 b1 b1 b1 b1 b1 b1 b1 b1-b1 b1 b1 c1 d1 e1 ef ff
7 v) l# s1 a3 W/ f' q9 M- J1 j. {& e) P
HalpINTItoVector:
# u: {$ y- c0 T {8006ada0 00 b3 61 51 a2 b2 62 91-a1 b1 71 81 52 82 72 92
# ]. b" m9 N+ M$ s' M8006adb0 00 a3 83 93 00 00 00 00-00 00 00 00 00 00 00 00( O- a1 G& Y, {. u
: |/ a9 p, S/ x
HalVectorToINTI:" p0 D! }1 T3 R; y" q/ I
8006a204 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
( t4 j) _$ r0 g- J2 V. w8006a214 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff1 S6 T; f; g. X% R/ ], p: r
8006a224 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff% M* a) W* e. n9 ^ m) h
8006a234 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff* k9 V, u* E( o( Z
8006a244 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff; o5 w) L5 {+ K a
8006a254 ff 03 0c ff ff ff ff ff-ff ff ff ff ff ff ff ff) a" ^; J( A0 C) p% G% f( j4 b
8006a264 ff 02 06 ff ff ff ff ff-ff ff ff ff ff ff ff ff
9 G7 g7 @* e6 Q: g0 T9 d+ \8006a274 ff 0a 0e ff ff ff ff ff-ff ff ff ff ff ff ff ff- U3 t0 z+ ^ W/ R& H/ B" [
8006a284 ff 0b 0d 12 ff ff ff ff-ff ff ff ff ff ff ff ff1 [2 M o r" l4 `
8006a294 ff 07 0f 13 ff ff ff ff-ff ff ff ff ff ff ff ff
8 w! z& L! k( _$ l2 L8006a2a4 ff 08 04 11 ff ff ff ff-ff ff ff ff ff ff ff ff g5 W/ }6 _& ?$ Y; v' ?
8006a2b4 ff 09 05 01 ff ff ff ff-ff ff ff ff ff ff ff ff! c" o* Y9 P5 [, p4 m
8006a2c4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
& K. c& Z; E9 x: Y; j# o7 Z8006a2d4 ff 08 ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
: D' l( l- b; h' V& y9 e8006a2e4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
! B$ P* W6 J" s0 _" F* o8006a2f4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ) P, J) ^ a$ s3 X- n9 |
1 @& g0 r1 {. d7 v4 A. L
/ T& A; M+ V" r7 I' E! x
vBucket:% ~ O$ ]1 V& t+ u, E H
8006ae30 02 02 02 03 03 03 03
0 e) H0 \6 k9 f5 M
) Y% @+ t, s, E8 t% B% k 举个例子来说明一下,在我虚拟机里SCSI Controller的IRQ是17(注意,已经大于16了),到重定向表中查找第17项,得到中断向量为0xa3,再看IDT,0xa3对应处理例程是SCSIPORT!ScsiPortInterrupt。
7 n% Z9 t e4 ?3 r: ~) \$ n3 G: I! }, b& F
vBucket数组干啥用的?它就是用来分配新的向量。分配算法很简单,当要分配一个新的向量时,就在vBucket数组从右到左搜索最小的一个数i,该数对应在vBucket中索引为Index,新向量为(0x50+Index*16+i+1),新向量对应的IRQL为(4+i+1),同时会把vBucket中这个i加1,i不等大于16。象给出的这个vBucket,下一次计算时i=2, index=2。不过这些用于硬件的向量在IO系统初始化时调用HalpGetSystemInterruptVector分配好了,然后通过IoConnectInterrupt把IDT中注册的向量位置的例程注册为中断处理程序。这里并不是每个注册的向量都会对应中断处理程序,象上面给出的例子中,0xa1、0xa2、0xb1等向量就没有对应。
6 m( E% D% N8 S2 i, p8 X( `% c/ M/ E' B' w$ x
IRQL机制为内核同步提供了很大的便利,既对驱动开发者隐藏了底层中断机制,也方便了驱动开发者的内核同步。LINUX从2.5内核开始引进的软中断和任务队列等机制,很大程度上也来自windows这套机制的借鉴。+ c1 p, r/ v" ?1 F3 d2 f
) p4 a% G5 w, j) U& f 终于考完试,解放了,呵呵。这个东西其实还有很多可写的,只是没空再深入去分析了。在未来的64位系统里,APIC这种基于中断引脚的机制很快也要被SAPIC这种基于消息的更强大的机制所取代 |
|