|
楼主 |
发表于 2008-2-27 14:35:05
|
显示全部楼层
从IRQ到IRQL(APIC版)
来自:http://www.nsfocus.net/index.php ... o=view&mid=25348 m9 C1 R4 E3 Z! F
& c. e; D! W+ ]0 B
从IRQ到IRQL(APIC版)& a/ z' E7 g {7 D
9 O" g5 _5 ?* p `* x! g. E) v
作者:SoBeIt
" O; V4 C0 E, M( R/ v出处:https://www.xfocus.net/bbs/index.php?act=ST&f=2&t=45502
- J; F9 ?" b$ ^3 Q7 A* [( i日期:2005-02-04
4 Z% v0 ?. n, A% @5 z
4 }% h$ ^. j7 x$ f x- f9 O5 [( ]事实上,老久的PIC在很早以前就被淘汰了,取而代之的是APIC。由于APIC可以兼容PIC,所以在很多单处理器系统上我们看到的PIC实际是APIC的兼容PIC模式。APIC主要应用于多处理器操作系统,是为了解决IRQ太少和处理器间中断而产生的,当然,单处理器操作系统也可以使用APIC(不是模拟PIC)。APIC的HAL和PIC的HAL有很大的不同,很突出的一个特点就是APIC的HAL不用再象PIC的HAL那样虚拟一个中断控制器,IRQL的概念已经可以通过中断向量的形式被APIC支持。事实上,因为被APIC所支持,所以在APIC HAL里IRQL的实现比PIC HAL那样虚拟一个中断控制器要简单得多了。, D, a& R3 |; c2 T6 |4 q+ R
! ?/ D3 F, L! t0 E2 E
现在来简单介绍一下APIC的结构(关于APIC详细的描述请参考《IA-32 Inel Architecture Software Developer's Manual Volume 3 Chapter 8》)。整个APIC系统由本地APIC、IO APIC和APIC串行总线组成(在Pentium 4和Xeon以后,APIC总线放到了系统总线中)组成。每个处理器中集成了一个本地APIC,而IO APIC是系统芯片组中一部分,APIC总线负责连接IO APIC和各个本地APIC。本地APIC接收该处理器产生的本地中断比如时钟中断,以及由该处理器产生的处理器间中断,并从APIC串行总线接收来自IO APIC的消息;IO APIC负责接收所有外部的硬件中断,并翻译成消息选择发给接收中断的处理器,以及从本地APIC接收处理器间中断消息。
$ V7 D' t2 O' Z D, K% R! s f+ Y0 k7 O$ p/ x1 z' C! w6 F% E
和PIC一样,控制本地APIC和IO APIC的方法是通过读写该单元中的相关寄存器。不过和PIC不一样的是,Intel把本地APIC和IO APIC的寄存器都映射到了物理地址空间,本地APIC默认映射到物理地址0xffe00000,IO APIC默认映射到物理地址0xfec00000。windows HAL再进一步把本地APIC映射到虚拟地址0xfffe0000,把IO APIC映射到虚拟地址0xffd06000,也就是说对该地址的读写实际就是对寄存器的读写,本地APIC里几个重要的寄存有EOI寄存器,任务优先级寄存器(TPR),处理器优先级寄存器(PPR),中断命令寄存器(ICR,64位),中断请求寄存器(IRR,256位,对应每个向量一位),中断在服务寄存器(ISR,256位)等。IO APIC里几个重要的寄存器有版本寄存器,I/O寄存器选择寄存器、I/O窗口寄存器(用要访问的I/O APIC寄存器的索引设置地址I/O寄存器选择寄存器,此时访问I/O窗口寄存器就是访问被选定的寄存器)还有很重要的是一个IO重定向表,每一个表项是一个64位寄存器,包括向量和目标模式、传输模式等相关位,每一个表项连接一条IRQ线,表项的数目随处理器的版本而不一样,在Pentium 4上为24个表项。表项的数目保存在IO APIC版本寄存器的[16:23]位。APIC系统支持255个中断向量,但Intel保留了0-15向量,可用的向量是16-255。并引进一个概念叫做任务优先级=中断向量/16,因为保留了16个向量,所以可用的优先级是2-15。当用一个指定的优先级设置本地APIC中的任务优先级寄存器TPR后,所有优先级低于TPR中优先级的中断都被屏蔽,是不是很象IRQL的机制?事实上,APIC HAL里的IRQL机制也就是靠着这个任务优先级寄存器得以实现。同一个任务优先级包括了16个中断向量,可以进一步细粒度地区分中断的优先级。1 ?1 @" m2 b% l9 z9 t5 L* N6 b
# l& R# d$ }0 z, t+ j. g, W) a0 c
在HAL里虽然HalBeginSystemInterrupt仍然是IRQL机制的发动引擎,但是因为有APIC的支持,它和其它共同实现IRQL的函数要比PIC HAL里对应的函数功能简单得多。HalBeginSystemInterrupt通过用IRQL做索引在HalpIRQLtoTPR数组中获取该IRQL对应的任务优先级,用该优先级设置任务优先级寄存器TPR,并把TPR中原先的任务优先级/16做为索引在HalpVectorToIRQL数组中获取对应的原先的IRQL然后返回。若IRQL是从低于DISPATCH_LEVEL提升到高于DISPATCH_LEVEL,还需要设置KPCR+0x95(0xffdff095)为DISPATCH_LEVEL(0x2),表示是从DISPATCH_LEVEL以下的级别提升IRQL。HalEndSystemInterrupt向本地APIC的EOI寄存发送0,表示中断结束,可以接收新中断。并还要判断要降到的IRQL是否小于DISPATCH_LEVEL,若小于则进一步判断KPCR+0x96(0xffdff096)是否置位,若置位则表示有DPC中断在等待(在IRQL高于DISPATCH_LEVEL被引发,然后等待直到IRQL降到低于DISPATCH_LEVEL),则将KPCR+0x95和KPCR+0x96清0后调用KiDispatchInterrupt响应DPC软中断。否则做的工作就是和HalBeginSystemInterrupt一样的过程:把要降到的IRQL转换成任务优先级设置TRP,并把久的任务优先级转成IRQL返回。KfRaiseIrql、KfLowerIrql之类的函数也是这么一回事,把当前IRQL转成任务优先级修改TPR,并把原先TPR的值转成原先的IRQL并返回。而现在软中断的产生也有了APIC支持,APIC通过产生一个发向自己的处理器间中断,就可以产生一个软中断,因为可以指定该中断的向量,所以软中断就可以区分优先级别,如APC_LEVEL、DISPATCH_LEVEL。产生软中断的函数一样还是HalRequestSoftwareInterrupt,该函数会先判断KPCR+0x95是否和要产生的软中断IRQL一样,若是的话则置位KPCR+0x96并返回,表示现在IRQL大于DISPATCH_LEVEL所以不处理DPC中断。否则以要产生的软中断的IRQL为索引从HalpIRQLtoTPRHAL取出对应任务优先级,并或上0x4000,表示是发向自身的固定处理间中断,并用该值设置中断命令寄存器ICW的低32位,然后读取中断命令寄存器ICW的低32位是否为0x1000,确定中断消息已经发送后就返回,这时候软中断已经产生。值得注意的是APIC HAL里没有HalEndSoftwareInterrupt这个函数。HAL为软中断的IRQL提供了一个固定的中断向量:
% |& S [: @1 v% w3 [9 q; k$ h0 O$ k6 [ L, z( ?
#define ZERO_VECTOR 0x00 // IRQL 00 - o# Y& y. d/ F8 h
#define APC_VECTOR 0x3D // IRQL 01
, |2 B- x$ i+ N#define DPC_VECTOR 0x41 // IRQL 02
' n3 [) B ~) z& t& s2 b#define APIC_GENERIC_VECTOR 0xC1 // IRQL 27" w' F) l3 b, M. ]3 C4 l) W
#define APIC_CLOCK_VECTOR 0xD1 // IRQL 28 m2 Y5 R) c, w& q
#define APIC_SYNCH_VECTOR 0xD1 // IRQL 28
6 O/ e% j3 h# w! C#define APIC_IPI_VECTOR 0xE1 // IRQL 292 C2 N3 a* k, A$ w. F5 m2 b, j
#define POWERFAIL_VECTOR 0xEF // IRQL 30$ v' e! o- f9 E& k* R! Y
#define APIC_PROFILE_VECTOR 0xFD // IRQL 31' W& F+ w/ V0 r. U4 f. z
5 Y. y/ J3 E3 E" h
1 H: e* v9 Z' }6 |5 L3 j现在看一下一些重要的数据:9 b# a8 x7 Z" }
; i0 F7 ?; H5 G3 i这是我写的代码输出的IO APIC重定向表内容:' b/ J7 r& F7 a% w
6 O _' l3 i$ V4 x5 b8 ~2 K# yRedirect Table Index: 0x17
" E3 {/ @# ^" {7 nRedirect Table[ 0]: ff" C1 F, m" X3 e! p
Redirect Table[ 1]: b37 K1 L4 m0 f1 W# U3 P
Redirect Table[ 2]: ff* N: J" P4 `9 x8 g5 o* r
Redirect Table[ 3]: 51
' _* b% |" e' ^5 n( o/ J0 N3 S% aRedirect Table[ 4]: ff
# i! o5 C+ V; e" O; tRedirect Table[ 5]: ff
. _' {! _' m( k' GRedirect Table[ 6]: 622 M7 I( A' i* z& a+ B, ~
Redirect Table[ 7]: ff( q' Q8 Y3 z. V0 h6 n
Redirect Table[ 8]: d1# [) R1 H# @3 N& _' |' [8 P+ u
Redirect Table[ 9]: b1) C; L, {/ [" ]9 g% }
Redirect Table[ a]: ff+ K" G2 f: u" s) M
Redirect Table[ b]: ff
, |* B$ l/ _& e; q$ h* v% K% [Redirect Table[ c]: 52
! c) y( g+ w9 A+ y1 K- ]5 j' oRedirect Table[ d]: ff7 [, `5 t9 A$ o. J( ?( k
Redirect Table[ e]: ff
5 D' P O0 T8 s% N; e a5 @5 uRedirect Table[ f]: 92
/ Z9 V* ?- p1 `- ~; k# BRedirect Table[10]: ff& Y9 U0 K! [8 }* o: B( k6 A
Redirect Table[11]: a3
# C4 _5 X' z; W' r& [$ O6 xRedirect Table[12]: 83- Y0 Y0 @# N3 U' ^2 v6 W
Redirect Table[13]: 93
9 Y- ?* t6 @ tRedirect Table[14]: ff
9 Y( M) V3 D6 e* V* M- d$ e" qRedirect Table[15]: ff
) ?' u3 |2 C/ I* Q( vRedirect Table[16]: ff
( ~( ]$ ]" H' a* n1 y4 pRedirect Table[17]: ff
5 u, B' A* U6 i; o. @9 v5 G |; m, |0 U0 [: g
这是IDT表中被注册的向量:
+ S* k% k% F, _1 ]+ ^6 ^
, ?# T8 Y1 v3 J0 H# [0 h6 h1f: 80064908 (hal!HalpApicSpuriousService)
2 g/ n% }# t" R6 l5 Q+ d% t37: 800640b8 (hal!PicSpuriousService37)
% i: d! q5 e& X3d: 80065254 (hal!HalpApcInterrupt)
5 m% x2 V) U6 p7 {" _41: 800650c8 (hal!HalpDispatchInterrupt)
) m, b; S, y2 L50: 80064190 (hal!HalpApicRebootService)& q ^: t D( p0 z5 x+ Q; `
51: 817f59e4
' ]! `+ f6 |, s; Z(Vector:51,Irql:4,SyncIrql:4,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:serial!SerialCIsrSw(f3c607c7)), H" X- I8 m4 J
52: 817f5044 ( y: O l; u( \ ]
(Vector:52,Irql:4,SyncIrql:a,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:i8042prt!I8042MouseInterruptService(f3c57a2c))( f$ }5 \$ }% ]$ x" a: h
83: 817d2d44
$ K3 N. y3 q* P(Vector:83,Irql:7,SyncIrql:7,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:NDIS!ndisMIsr(bff1b794))
, R; w" Y4 c' L92: 81821384
! q% s" G8 H4 K9 A1 ~& V3 q! ](Vector:92,Irql:8,SyncIrql:8,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:atapi!ScsiPortInterrupt(bff892be)). |* N% R W# m0 Z$ R" m
93: 8185ed64 ; S5 H" O. U4 i
(Vector:93,Irql:8,SyncIrql:8,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:uhcd!UHCD_InterruptService(f3f0253e))
# W! \5 Z5 Y3 h! _9 y) ma3: 8186cdc4 ' {0 S E* m% J, G
(Vector:a3,Irql:9,SyncIrql:9,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:SCSIPORT!ScsiPortInterrupt(bff719f0)), q* W% Z! }/ t
b1: 818902e4 0 @' D* H3 Y4 i; W! a; _
(Vector:b1,Irql:a,SyncIrql:a,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:ACPI!ACPIInterruptServiceRoutine(bffe14b4)). Y0 H: |+ T* `3 A. W1 I
b3: 81881664
' q$ P, m* K5 \2 y/ q8 d( Q" V(Vector:b3,Irql:a,SyncIrql:a,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:i8042prt!I8042KeyboardInterruptService(f3c51918))# H5 U# S) d3 ^! [, c! N- y$ H, X
c1: 800642fc (hal!HalpBroadcastCallService)
" e. }# ~6 _5 C6 z8 zd1: 80063964 (hal!HalpClockInterrupt)& O/ j4 ^* ^8 o0 x% l- A
e1: 80064858 (hal!HalpIpiHandler)
. I5 D' {7 Q( Ce3: 800645d4 (hal!HalpLocalApicErrorService)9 }/ D; U/ Z' S: Q5 T, y$ M Q
fd: 80064d64 (hal!HalpProfileInterrupt)
. a- a; O4 F( efe: 80064eec (hal!HalpPerfInterrupt)
2 V7 t& j# j5 c9 U& G; | \6 b0 P" N7 c' Z
象a3、b1这类输出内容很多的是被硬件注册的中断向量,而象d1、e3这种输出内容少的是注册为了的HAL内部使用的中断向量和本地APIC中断向量' n' J% K% s- _% k
1 D5 n% j0 `7 Z) X这是几个重要的数组:
; R, j: K; b- \. x' F# }) C0 Y: K9 j
HalVectorToIrql(这个数组是以向量除于16做索引):
3 k( }7 P4 Z* [$ Y L8006a304 00 ff ff 01 02 04 05 06-07 08 09 0a 1b 1c 1d 1e' I& G( v0 }, p
: v6 Y( ~1 V7 E6 u
HalpIRQLtoTPR:: w+ w2 \$ \, Y/ K3 g3 A9 ?
8006a1e4 00 3d 41 41 51 61 71 81-91 a1 b1 b1 b1 b1 b1 b1
" Z {9 n8 C2 A' n8 c8 H+ l1 J8006a1f4 b1 b1 b1 b1 b1 b1 b1 b1-b1 b1 b1 c1 d1 e1 ef ff
5 S: E! ]; V3 Z$ Z0 A) f5 |- _) I, r5 r5 B2 v4 c
HalpINTItoVector:
, m5 M& g' a; }9 u: j1 y8 a3 @% |8006ada0 00 b3 61 51 a2 b2 62 91-a1 b1 71 81 52 82 72 92
0 q* P4 E& l1 O) W" s1 y8006adb0 00 a3 83 93 00 00 00 00-00 00 00 00 00 00 00 00
) U+ V$ p- Q, U* |* p1 x
& `6 a% c* ^: h/ q( LHalVectorToINTI:" C% \% g ?) U6 \! S/ s3 T6 \
8006a204 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff+ V# q" S% p6 S8 G
8006a214 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff! f& H! x) L/ G+ w A9 R
8006a224 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
/ U/ ^- J; r% |( ^, s @. R4 A8006a234 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
9 O# X. U& d' @! l8 k" Z8006a244 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
& J* e4 [5 c- u6 x& y! C8006a254 ff 03 0c ff ff ff ff ff-ff ff ff ff ff ff ff ff
! \0 D6 k8 M% Z3 q' k7 w3 t8006a264 ff 02 06 ff ff ff ff ff-ff ff ff ff ff ff ff ff
* O$ A: O4 r1 A+ T3 w8006a274 ff 0a 0e ff ff ff ff ff-ff ff ff ff ff ff ff ff* C! |3 s! Z/ f$ ~1 Z8 l2 i
8006a284 ff 0b 0d 12 ff ff ff ff-ff ff ff ff ff ff ff ff: O* u7 N7 E& Z7 w! a2 C$ Y5 {$ v
8006a294 ff 07 0f 13 ff ff ff ff-ff ff ff ff ff ff ff ff
5 j" _7 H5 z6 t' ^) `8006a2a4 ff 08 04 11 ff ff ff ff-ff ff ff ff ff ff ff ff
4 \' @3 @3 U: v% m, s, q# c8006a2b4 ff 09 05 01 ff ff ff ff-ff ff ff ff ff ff ff ff* C. R2 J* w' H/ J: V! e
8006a2c4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
8 N4 t# }6 _3 I4 }" {8006a2d4 ff 08 ff ff ff ff ff ff-ff ff ff ff ff ff ff ff6 ]% A" x. O8 y4 K) {9 i `
8006a2e4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
0 s0 G% r& \8 e% v6 I+ k: n/ h8006a2f4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff
! s) l5 @+ ~, m$ [* @" \# _. k
# k. Q+ U1 ]2 g ^% M, H) g" B; m3 c5 p& R4 o8 R% Q
vBucket:8 c# `( x% S4 r, t( i0 g, p
8006ae30 02 02 02 03 03 03 03
D( u7 Q! u& P& b
! `# H" x6 w/ O3 l$ c5 i+ ]8 } 举个例子来说明一下,在我虚拟机里SCSI Controller的IRQ是17(注意,已经大于16了),到重定向表中查找第17项,得到中断向量为0xa3,再看IDT,0xa3对应处理例程是SCSIPORT!ScsiPortInterrupt。5 t8 G7 T! ~% Y; R. I! @8 a
$ N E9 G/ q5 H8 y; K. m
vBucket数组干啥用的?它就是用来分配新的向量。分配算法很简单,当要分配一个新的向量时,就在vBucket数组从右到左搜索最小的一个数i,该数对应在vBucket中索引为Index,新向量为(0x50+Index*16+i+1),新向量对应的IRQL为(4+i+1),同时会把vBucket中这个i加1,i不等大于16。象给出的这个vBucket,下一次计算时i=2, index=2。不过这些用于硬件的向量在IO系统初始化时调用HalpGetSystemInterruptVector分配好了,然后通过IoConnectInterrupt把IDT中注册的向量位置的例程注册为中断处理程序。这里并不是每个注册的向量都会对应中断处理程序,象上面给出的例子中,0xa1、0xa2、0xb1等向量就没有对应。. r6 L! i0 Z+ g* E8 e, m
3 j; x$ I8 ?5 L
IRQL机制为内核同步提供了很大的便利,既对驱动开发者隐藏了底层中断机制,也方便了驱动开发者的内核同步。LINUX从2.5内核开始引进的软中断和任务队列等机制,很大程度上也来自windows这套机制的借鉴。6 W9 p3 i( @7 b% v/ R. r; ]0 B# Z
2 h' Y+ e5 f& G, y0 v
终于考完试,解放了,呵呵。这个东西其实还有很多可写的,只是没空再深入去分析了。在未来的64位系统里,APIC这种基于中断引脚的机制很快也要被SAPIC这种基于消息的更强大的机制所取代 |
|