|
楼主 |
发表于 2008-2-27 14:35:05
|
显示全部楼层
从IRQ到IRQL(APIC版)
来自:http://www.nsfocus.net/index.php ... o=view&mid=2534( A4 Q+ ? [6 X1 L( z
. a/ J3 U5 h8 H& z, q- ^: N
从IRQ到IRQL(APIC版)& b( r5 ^9 `& f% g. x/ P
: R& i: J( K; O H. |作者:SoBeIt! d4 [( t0 ]& L3 A: k9 Y" L/ j5 Z5 S
出处:https://www.xfocus.net/bbs/index.php?act=ST&f=2&t=45502
- A2 [7 L V; m! n) X日期:2005-02-04# @! D: h$ d% w
! s7 @ f& F( x事实上,老久的PIC在很早以前就被淘汰了,取而代之的是APIC。由于APIC可以兼容PIC,所以在很多单处理器系统上我们看到的PIC实际是APIC的兼容PIC模式。APIC主要应用于多处理器操作系统,是为了解决IRQ太少和处理器间中断而产生的,当然,单处理器操作系统也可以使用APIC(不是模拟PIC)。APIC的HAL和PIC的HAL有很大的不同,很突出的一个特点就是APIC的HAL不用再象PIC的HAL那样虚拟一个中断控制器,IRQL的概念已经可以通过中断向量的形式被APIC支持。事实上,因为被APIC所支持,所以在APIC HAL里IRQL的实现比PIC HAL那样虚拟一个中断控制器要简单得多了。8 O) e% A* h( P( f, t5 c9 H
4 _) e8 {: C6 j# p6 S2 X 现在来简单介绍一下APIC的结构(关于APIC详细的描述请参考《IA-32 Inel Architecture Software Developer's Manual Volume 3 Chapter 8》)。整个APIC系统由本地APIC、IO APIC和APIC串行总线组成(在Pentium 4和Xeon以后,APIC总线放到了系统总线中)组成。每个处理器中集成了一个本地APIC,而IO APIC是系统芯片组中一部分,APIC总线负责连接IO APIC和各个本地APIC。本地APIC接收该处理器产生的本地中断比如时钟中断,以及由该处理器产生的处理器间中断,并从APIC串行总线接收来自IO APIC的消息;IO APIC负责接收所有外部的硬件中断,并翻译成消息选择发给接收中断的处理器,以及从本地APIC接收处理器间中断消息。% F, N+ P& n8 L' ?
8 c0 u+ u' f) A3 y 和PIC一样,控制本地APIC和IO APIC的方法是通过读写该单元中的相关寄存器。不过和PIC不一样的是,Intel把本地APIC和IO APIC的寄存器都映射到了物理地址空间,本地APIC默认映射到物理地址0xffe00000,IO APIC默认映射到物理地址0xfec00000。windows HAL再进一步把本地APIC映射到虚拟地址0xfffe0000,把IO APIC映射到虚拟地址0xffd06000,也就是说对该地址的读写实际就是对寄存器的读写,本地APIC里几个重要的寄存有EOI寄存器,任务优先级寄存器(TPR),处理器优先级寄存器(PPR),中断命令寄存器(ICR,64位),中断请求寄存器(IRR,256位,对应每个向量一位),中断在服务寄存器(ISR,256位)等。IO APIC里几个重要的寄存器有版本寄存器,I/O寄存器选择寄存器、I/O窗口寄存器(用要访问的I/O APIC寄存器的索引设置地址I/O寄存器选择寄存器,此时访问I/O窗口寄存器就是访问被选定的寄存器)还有很重要的是一个IO重定向表,每一个表项是一个64位寄存器,包括向量和目标模式、传输模式等相关位,每一个表项连接一条IRQ线,表项的数目随处理器的版本而不一样,在Pentium 4上为24个表项。表项的数目保存在IO APIC版本寄存器的[16:23]位。APIC系统支持255个中断向量,但Intel保留了0-15向量,可用的向量是16-255。并引进一个概念叫做任务优先级=中断向量/16,因为保留了16个向量,所以可用的优先级是2-15。当用一个指定的优先级设置本地APIC中的任务优先级寄存器TPR后,所有优先级低于TPR中优先级的中断都被屏蔽,是不是很象IRQL的机制?事实上,APIC HAL里的IRQL机制也就是靠着这个任务优先级寄存器得以实现。同一个任务优先级包括了16个中断向量,可以进一步细粒度地区分中断的优先级。2 n. N7 y! Y- r2 ^9 c% T. l( L
}6 E1 y: l5 R- E
在HAL里虽然HalBeginSystemInterrupt仍然是IRQL机制的发动引擎,但是因为有APIC的支持,它和其它共同实现IRQL的函数要比PIC HAL里对应的函数功能简单得多。HalBeginSystemInterrupt通过用IRQL做索引在HalpIRQLtoTPR数组中获取该IRQL对应的任务优先级,用该优先级设置任务优先级寄存器TPR,并把TPR中原先的任务优先级/16做为索引在HalpVectorToIRQL数组中获取对应的原先的IRQL然后返回。若IRQL是从低于DISPATCH_LEVEL提升到高于DISPATCH_LEVEL,还需要设置KPCR+0x95(0xffdff095)为DISPATCH_LEVEL(0x2),表示是从DISPATCH_LEVEL以下的级别提升IRQL。HalEndSystemInterrupt向本地APIC的EOI寄存发送0,表示中断结束,可以接收新中断。并还要判断要降到的IRQL是否小于DISPATCH_LEVEL,若小于则进一步判断KPCR+0x96(0xffdff096)是否置位,若置位则表示有DPC中断在等待(在IRQL高于DISPATCH_LEVEL被引发,然后等待直到IRQL降到低于DISPATCH_LEVEL),则将KPCR+0x95和KPCR+0x96清0后调用KiDispatchInterrupt响应DPC软中断。否则做的工作就是和HalBeginSystemInterrupt一样的过程:把要降到的IRQL转换成任务优先级设置TRP,并把久的任务优先级转成IRQL返回。KfRaiseIrql、KfLowerIrql之类的函数也是这么一回事,把当前IRQL转成任务优先级修改TPR,并把原先TPR的值转成原先的IRQL并返回。而现在软中断的产生也有了APIC支持,APIC通过产生一个发向自己的处理器间中断,就可以产生一个软中断,因为可以指定该中断的向量,所以软中断就可以区分优先级别,如APC_LEVEL、DISPATCH_LEVEL。产生软中断的函数一样还是HalRequestSoftwareInterrupt,该函数会先判断KPCR+0x95是否和要产生的软中断IRQL一样,若是的话则置位KPCR+0x96并返回,表示现在IRQL大于DISPATCH_LEVEL所以不处理DPC中断。否则以要产生的软中断的IRQL为索引从HalpIRQLtoTPRHAL取出对应任务优先级,并或上0x4000,表示是发向自身的固定处理间中断,并用该值设置中断命令寄存器ICW的低32位,然后读取中断命令寄存器ICW的低32位是否为0x1000,确定中断消息已经发送后就返回,这时候软中断已经产生。值得注意的是APIC HAL里没有HalEndSoftwareInterrupt这个函数。HAL为软中断的IRQL提供了一个固定的中断向量:( s- \$ J, v! N6 o M) d: m
7 {9 [7 F- y5 M1 U4 h$ s
#define ZERO_VECTOR 0x00 // IRQL 00
# a# X3 w$ a$ J3 A3 E7 F2 l#define APC_VECTOR 0x3D // IRQL 01" |: L3 y. v ]1 t% R( s, \
#define DPC_VECTOR 0x41 // IRQL 02) a3 [1 c m# h* g; Y$ A
#define APIC_GENERIC_VECTOR 0xC1 // IRQL 27$ X5 M6 Z6 V9 i4 m; P
#define APIC_CLOCK_VECTOR 0xD1 // IRQL 28. |/ H& I4 U$ K4 I, I' b$ c
#define APIC_SYNCH_VECTOR 0xD1 // IRQL 28
3 @. w. m: `" U) O6 V#define APIC_IPI_VECTOR 0xE1 // IRQL 29$ \& r- @& b3 B+ ^- a: f8 j. s+ ~
#define POWERFAIL_VECTOR 0xEF // IRQL 30, f. a$ V) K! l+ @2 h- f+ o' N- }
#define APIC_PROFILE_VECTOR 0xFD // IRQL 31% @9 S" \; M6 E- T1 ^! n% z' f9 m
/ u, N: I3 ]8 Q
8 A7 q# M3 G& N' i2 h4 P现在看一下一些重要的数据:
# K8 ^' i+ |: ^ Z9 p' w! m0 r: k9 ~# ^+ s2 y9 u7 C3 F! a/ w
这是我写的代码输出的IO APIC重定向表内容:" j x+ V, M0 p3 `& C' S
) U$ B, p. D( N1 }. Y) }Redirect Table Index: 0x17
5 j( `( e& G pRedirect Table[ 0]: ff
$ y$ v: c) l& fRedirect Table[ 1]: b36 P1 L, C J; i$ a
Redirect Table[ 2]: ff9 h2 ?7 |7 ~; g% [* D" C. |( o
Redirect Table[ 3]: 51
# h; ]% _: ^$ X1 \Redirect Table[ 4]: ff
( o) L! l0 X$ }& TRedirect Table[ 5]: ff& V* h. U, T x6 Y5 {
Redirect Table[ 6]: 620 R- U$ \! c7 T e; f+ d+ g
Redirect Table[ 7]: ff6 v2 G. E: @9 G) L5 {7 | n6 B5 l
Redirect Table[ 8]: d1' ]$ H" g* K- n& T3 Y, f% [
Redirect Table[ 9]: b1
) w9 G e- U. X+ `4 \Redirect Table[ a]: ff1 B4 S/ T: L9 e9 o
Redirect Table[ b]: ff
% T2 e, }, D/ j2 R1 ?Redirect Table[ c]: 529 m8 u7 g/ x$ m
Redirect Table[ d]: ff
- _/ G( i& { c1 S0 aRedirect Table[ e]: ff- r3 Q4 p! W/ a$ @/ Y( D" C5 ^" u
Redirect Table[ f]: 92! O1 f; n- N+ V$ G' q
Redirect Table[10]: ff
6 l- s! T9 F& v" S9 d& o3 ?Redirect Table[11]: a3( S9 }, ~6 o# o9 m; _& T) Z
Redirect Table[12]: 83
, x. ]% j/ \2 @' MRedirect Table[13]: 93
5 |) N$ j0 y/ m/ N4 M6 m3 A5 KRedirect Table[14]: ff2 e7 z8 j7 [0 G( ^ m, ^
Redirect Table[15]: ff
$ I, @) l4 I/ j9 g X+ J. ORedirect Table[16]: ff
: i |5 N" l# V# bRedirect Table[17]: ff
6 R7 g& F, M: I9 z/ j
6 F% y( ]0 {. D1 j这是IDT表中被注册的向量:& T0 `6 {" k9 Q" W" i# D
7 s# L" H+ ^3 G+ ^1 N3 L1f: 80064908 (hal!HalpApicSpuriousService)
0 K6 J( z, T0 L0 H37: 800640b8 (hal!PicSpuriousService37)# u9 H2 Z& C+ A$ J1 m
3d: 80065254 (hal!HalpApcInterrupt)' ` Z0 ~; U6 {
41: 800650c8 (hal!HalpDispatchInterrupt), t5 b& O$ \( v8 ?
50: 80064190 (hal!HalpApicRebootService)
; n3 t7 w# F. Y51: 817f59e4
9 D. j! h9 j. i) z) H' n6 ](Vector:51,Irql:4,SyncIrql:4,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:serial!SerialCIsrSw(f3c607c7))8 b4 R- W% n4 v' ?1 o7 j7 R
52: 817f5044
& l* Q$ v: W& f6 q: T5 `* H3 x(Vector:52,Irql:4,SyncIrql:a,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:i8042prt!I8042MouseInterruptService(f3c57a2c))
& n8 c1 e/ z( N" B" O1 c' g% V: f, R83: 817d2d44
% X w C6 Q( O5 T3 P4 C* M/ G. V(Vector:83,Irql:7,SyncIrql:7,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:NDIS!ndisMIsr(bff1b794))
+ Y' p/ l6 b7 O92: 81821384 ! z5 K8 X, @. j8 a8 O* `
(Vector:92,Irql:8,SyncIrql:8,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:atapi!ScsiPortInterrupt(bff892be)). d7 h& L1 @2 D( ?+ l3 Q
93: 8185ed64
. k) _- u; p9 I% x( p7 |, q0 `(Vector:93,Irql:8,SyncIrql:8,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:uhcd!UHCD_InterruptService(f3f0253e))# C8 I! @3 J$ @! q: ? K7 e
a3: 8186cdc4 & [9 d) G8 f6 }8 {
(Vector:a3,Irql:9,SyncIrql:9,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:SCSIPORT!ScsiPortInterrupt(bff719f0))) q' C$ y* u' \% l9 E% I
b1: 818902e4 4 ?0 |& W* X/ A9 s: [8 N+ g. R9 w
(Vector:b1,Irql:a,SyncIrql:a,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:ACPI!ACPIInterruptServiceRoutine(bffe14b4))
( n c) f2 K* d7 C xb3: 81881664
$ b; k; Q/ A1 z c(Vector:b3,Irql:a,SyncIrql:a,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:i8042prt!I8042KeyboardInterruptService(f3c51918))1 W' U+ G* V: |3 L' l
c1: 800642fc (hal!HalpBroadcastCallService)
9 D* ^& T8 A [2 Q; gd1: 80063964 (hal!HalpClockInterrupt), E1 u* A3 L" k7 H
e1: 80064858 (hal!HalpIpiHandler)
) K+ m# B& _+ M% \5 f. T( Ye3: 800645d4 (hal!HalpLocalApicErrorService)
9 I5 n% `" H* L7 ]5 Q! pfd: 80064d64 (hal!HalpProfileInterrupt), c3 Z! Q! `( ^* `" G
fe: 80064eec (hal!HalpPerfInterrupt)
! z5 i3 m) T1 K; h
. Q* e+ s3 R* L象a3、b1这类输出内容很多的是被硬件注册的中断向量,而象d1、e3这种输出内容少的是注册为了的HAL内部使用的中断向量和本地APIC中断向量
& P4 x- a! N2 K" N" B" X) b# F) O/ D3 y+ p( ?. \( {6 i/ M( b2 E
这是几个重要的数组:
4 Y2 V- e) M8 \) ?$ q
- i8 u/ d- r" z8 e# v/ FHalVectorToIrql(这个数组是以向量除于16做索引):
) @6 ?9 @ W* G: y5 c/ g8006a304 00 ff ff 01 02 04 05 06-07 08 09 0a 1b 1c 1d 1e
' s5 }' H; z$ M# V6 M( z' x/ y6 p5 v' V, W/ \ }/ K6 `+ F3 C$ v0 V7 A$ L
HalpIRQLtoTPR:
& ~: V2 q; ?+ n$ E; a$ b9 B1 n8006a1e4 00 3d 41 41 51 61 71 81-91 a1 b1 b1 b1 b1 b1 b1
7 [- X: ?# _- A8006a1f4 b1 b1 b1 b1 b1 b1 b1 b1-b1 b1 b1 c1 d1 e1 ef ff+ P% } y0 [3 } n( M. ?
$ N' c0 C4 H! q y6 _HalpINTItoVector:. n9 [1 X! E# \9 y8 Y0 V
8006ada0 00 b3 61 51 a2 b2 62 91-a1 b1 71 81 52 82 72 92
" Y9 ]6 w8 ]' N8006adb0 00 a3 83 93 00 00 00 00-00 00 00 00 00 00 00 00
, B x( d# w7 s3 f
4 b: |7 `. ^$ k) e9 I' R3 ~2 iHalVectorToINTI:
( L$ i! ?- \7 u# Z3 y5 t9 }8006a204 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
]2 {- K5 {% R! o) D8006a214 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff4 u2 @' |- u$ D- Y1 [7 r$ A$ E) d3 u
8006a224 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
4 s/ w( T3 s! v r0 d3 G8006a234 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff& q1 o: ?$ d) J& |( p m5 S$ \6 S5 K
8006a244 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff% z# A3 o4 ]6 \! _
8006a254 ff 03 0c ff ff ff ff ff-ff ff ff ff ff ff ff ff
2 J$ E) S4 s# f0 F" o8 j9 I1 A' N* }: q8006a264 ff 02 06 ff ff ff ff ff-ff ff ff ff ff ff ff ff# s9 ^3 ]# c" Z' v
8006a274 ff 0a 0e ff ff ff ff ff-ff ff ff ff ff ff ff ff
! _" s7 C0 G9 o0 t1 t; F8006a284 ff 0b 0d 12 ff ff ff ff-ff ff ff ff ff ff ff ff1 C9 P) V8 n- \( T# o, K
8006a294 ff 07 0f 13 ff ff ff ff-ff ff ff ff ff ff ff ff6 f' z) g/ g7 r- k4 o, M8 d, ^
8006a2a4 ff 08 04 11 ff ff ff ff-ff ff ff ff ff ff ff ff
0 I5 n( H+ P9 O( d/ T8006a2b4 ff 09 05 01 ff ff ff ff-ff ff ff ff ff ff ff ff2 ~( A! q5 |) `: Y1 U
8006a2c4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff* V$ a) m8 V+ e7 v8 O9 K" z" i) V0 }
8006a2d4 ff 08 ff ff ff ff ff ff-ff ff ff ff ff ff ff ff+ P z1 n$ b1 @- P8 t& r9 V ~
8006a2e4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
4 q7 p6 F" r% x, g4 l0 ]8006a2f4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff 2 y# T: }( N3 Q; x6 M$ S) R: M& r
# v; V4 T) {% u9 A1 r
& k% Z/ S% m4 T! U# W! jvBucket:
* g+ K. w g0 } r- C! f8006ae30 02 02 02 03 03 03 03
, K! @' C! d" O' b/ S" s8 i7 s+ T& t1 h3 U
举个例子来说明一下,在我虚拟机里SCSI Controller的IRQ是17(注意,已经大于16了),到重定向表中查找第17项,得到中断向量为0xa3,再看IDT,0xa3对应处理例程是SCSIPORT!ScsiPortInterrupt。
9 B6 r G" i/ @7 d8 B: F: E4 Q. |6 j- X+ l+ v2 P
vBucket数组干啥用的?它就是用来分配新的向量。分配算法很简单,当要分配一个新的向量时,就在vBucket数组从右到左搜索最小的一个数i,该数对应在vBucket中索引为Index,新向量为(0x50+Index*16+i+1),新向量对应的IRQL为(4+i+1),同时会把vBucket中这个i加1,i不等大于16。象给出的这个vBucket,下一次计算时i=2, index=2。不过这些用于硬件的向量在IO系统初始化时调用HalpGetSystemInterruptVector分配好了,然后通过IoConnectInterrupt把IDT中注册的向量位置的例程注册为中断处理程序。这里并不是每个注册的向量都会对应中断处理程序,象上面给出的例子中,0xa1、0xa2、0xb1等向量就没有对应。( x3 ~- Q! C& W% E( [! w
1 ^' f2 d3 J" G6 ?! ? F* r IRQL机制为内核同步提供了很大的便利,既对驱动开发者隐藏了底层中断机制,也方便了驱动开发者的内核同步。LINUX从2.5内核开始引进的软中断和任务队列等机制,很大程度上也来自windows这套机制的借鉴。
( Y; S* n* \9 G9 u- [
4 w( y8 u# |& d1 ? 终于考完试,解放了,呵呵。这个东西其实还有很多可写的,只是没空再深入去分析了。在未来的64位系统里,APIC这种基于中断引脚的机制很快也要被SAPIC这种基于消息的更强大的机制所取代 |
|