|
|
楼主 |
发表于 2008-2-27 14:35:05
|
显示全部楼层
从IRQ到IRQL(APIC版)
来自:http://www.nsfocus.net/index.php ... o=view&mid=2534) L1 ?( [' h2 ]9 m' {: F, x0 h
7 y& Q) V( ?5 T
从IRQ到IRQL(APIC版)" ]6 F Y0 S w# R y( H
& R9 z% x) Q2 P- o, X3 d& Q/ s' q# U
作者:SoBeIt7 X5 ~- e: u. ^
出处:https://www.xfocus.net/bbs/index.php?act=ST&f=2&t=45502
/ }2 m0 G0 G5 C1 ~* W日期:2005-02-04
: {* g; |1 r7 O: @0 {) @+ [- l- L5 t1 L- s6 i7 j& Z; P
事实上,老久的PIC在很早以前就被淘汰了,取而代之的是APIC。由于APIC可以兼容PIC,所以在很多单处理器系统上我们看到的PIC实际是APIC的兼容PIC模式。APIC主要应用于多处理器操作系统,是为了解决IRQ太少和处理器间中断而产生的,当然,单处理器操作系统也可以使用APIC(不是模拟PIC)。APIC的HAL和PIC的HAL有很大的不同,很突出的一个特点就是APIC的HAL不用再象PIC的HAL那样虚拟一个中断控制器,IRQL的概念已经可以通过中断向量的形式被APIC支持。事实上,因为被APIC所支持,所以在APIC HAL里IRQL的实现比PIC HAL那样虚拟一个中断控制器要简单得多了。7 t: U! R* I- w5 m/ I
, Y4 s4 \( _# a- [( ~: w
现在来简单介绍一下APIC的结构(关于APIC详细的描述请参考《IA-32 Inel Architecture Software Developer's Manual Volume 3 Chapter 8》)。整个APIC系统由本地APIC、IO APIC和APIC串行总线组成(在Pentium 4和Xeon以后,APIC总线放到了系统总线中)组成。每个处理器中集成了一个本地APIC,而IO APIC是系统芯片组中一部分,APIC总线负责连接IO APIC和各个本地APIC。本地APIC接收该处理器产生的本地中断比如时钟中断,以及由该处理器产生的处理器间中断,并从APIC串行总线接收来自IO APIC的消息;IO APIC负责接收所有外部的硬件中断,并翻译成消息选择发给接收中断的处理器,以及从本地APIC接收处理器间中断消息。
6 V! U! b! r$ A) ?6 B9 Y; ]* Q1 _ O* z5 l$ [+ }
和PIC一样,控制本地APIC和IO APIC的方法是通过读写该单元中的相关寄存器。不过和PIC不一样的是,Intel把本地APIC和IO APIC的寄存器都映射到了物理地址空间,本地APIC默认映射到物理地址0xffe00000,IO APIC默认映射到物理地址0xfec00000。windows HAL再进一步把本地APIC映射到虚拟地址0xfffe0000,把IO APIC映射到虚拟地址0xffd06000,也就是说对该地址的读写实际就是对寄存器的读写,本地APIC里几个重要的寄存有EOI寄存器,任务优先级寄存器(TPR),处理器优先级寄存器(PPR),中断命令寄存器(ICR,64位),中断请求寄存器(IRR,256位,对应每个向量一位),中断在服务寄存器(ISR,256位)等。IO APIC里几个重要的寄存器有版本寄存器,I/O寄存器选择寄存器、I/O窗口寄存器(用要访问的I/O APIC寄存器的索引设置地址I/O寄存器选择寄存器,此时访问I/O窗口寄存器就是访问被选定的寄存器)还有很重要的是一个IO重定向表,每一个表项是一个64位寄存器,包括向量和目标模式、传输模式等相关位,每一个表项连接一条IRQ线,表项的数目随处理器的版本而不一样,在Pentium 4上为24个表项。表项的数目保存在IO APIC版本寄存器的[16:23]位。APIC系统支持255个中断向量,但Intel保留了0-15向量,可用的向量是16-255。并引进一个概念叫做任务优先级=中断向量/16,因为保留了16个向量,所以可用的优先级是2-15。当用一个指定的优先级设置本地APIC中的任务优先级寄存器TPR后,所有优先级低于TPR中优先级的中断都被屏蔽,是不是很象IRQL的机制?事实上,APIC HAL里的IRQL机制也就是靠着这个任务优先级寄存器得以实现。同一个任务优先级包括了16个中断向量,可以进一步细粒度地区分中断的优先级。
0 M5 w* M( {3 n2 ?: M/ ? f+ d! x+ p+ d/ u, C& Q
在HAL里虽然HalBeginSystemInterrupt仍然是IRQL机制的发动引擎,但是因为有APIC的支持,它和其它共同实现IRQL的函数要比PIC HAL里对应的函数功能简单得多。HalBeginSystemInterrupt通过用IRQL做索引在HalpIRQLtoTPR数组中获取该IRQL对应的任务优先级,用该优先级设置任务优先级寄存器TPR,并把TPR中原先的任务优先级/16做为索引在HalpVectorToIRQL数组中获取对应的原先的IRQL然后返回。若IRQL是从低于DISPATCH_LEVEL提升到高于DISPATCH_LEVEL,还需要设置KPCR+0x95(0xffdff095)为DISPATCH_LEVEL(0x2),表示是从DISPATCH_LEVEL以下的级别提升IRQL。HalEndSystemInterrupt向本地APIC的EOI寄存发送0,表示中断结束,可以接收新中断。并还要判断要降到的IRQL是否小于DISPATCH_LEVEL,若小于则进一步判断KPCR+0x96(0xffdff096)是否置位,若置位则表示有DPC中断在等待(在IRQL高于DISPATCH_LEVEL被引发,然后等待直到IRQL降到低于DISPATCH_LEVEL),则将KPCR+0x95和KPCR+0x96清0后调用KiDispatchInterrupt响应DPC软中断。否则做的工作就是和HalBeginSystemInterrupt一样的过程:把要降到的IRQL转换成任务优先级设置TRP,并把久的任务优先级转成IRQL返回。KfRaiseIrql、KfLowerIrql之类的函数也是这么一回事,把当前IRQL转成任务优先级修改TPR,并把原先TPR的值转成原先的IRQL并返回。而现在软中断的产生也有了APIC支持,APIC通过产生一个发向自己的处理器间中断,就可以产生一个软中断,因为可以指定该中断的向量,所以软中断就可以区分优先级别,如APC_LEVEL、DISPATCH_LEVEL。产生软中断的函数一样还是HalRequestSoftwareInterrupt,该函数会先判断KPCR+0x95是否和要产生的软中断IRQL一样,若是的话则置位KPCR+0x96并返回,表示现在IRQL大于DISPATCH_LEVEL所以不处理DPC中断。否则以要产生的软中断的IRQL为索引从HalpIRQLtoTPRHAL取出对应任务优先级,并或上0x4000,表示是发向自身的固定处理间中断,并用该值设置中断命令寄存器ICW的低32位,然后读取中断命令寄存器ICW的低32位是否为0x1000,确定中断消息已经发送后就返回,这时候软中断已经产生。值得注意的是APIC HAL里没有HalEndSoftwareInterrupt这个函数。HAL为软中断的IRQL提供了一个固定的中断向量:
5 X+ O; v! I- v. ~& K$ G3 ^
5 e; r1 n1 f) v0 C- _#define ZERO_VECTOR 0x00 // IRQL 00
5 s! `7 o5 Z( C1 u#define APC_VECTOR 0x3D // IRQL 01
; t1 [! H+ M' X$ |0 N: M% q#define DPC_VECTOR 0x41 // IRQL 02/ |0 P. @+ s9 X# `" S# A
#define APIC_GENERIC_VECTOR 0xC1 // IRQL 27
1 |3 H4 m1 T* i$ L$ `#define APIC_CLOCK_VECTOR 0xD1 // IRQL 28
( m R: ?: J! J#define APIC_SYNCH_VECTOR 0xD1 // IRQL 28: o) Q6 L8 ^5 {* y# h8 e: ?* D
#define APIC_IPI_VECTOR 0xE1 // IRQL 29/ L* X# B3 }) g3 m% \- f% Q5 O1 X$ l
#define POWERFAIL_VECTOR 0xEF // IRQL 307 I, N4 x, L0 B+ Q+ a/ p& v
#define APIC_PROFILE_VECTOR 0xFD // IRQL 31
: R# o. \+ f. f
; v( M, c. u& w8 G) }+ Z
2 G- i4 g) q' `! y现在看一下一些重要的数据:: x. Q: N$ Z# ] g2 q6 t. m
! M% T/ S, I' O这是我写的代码输出的IO APIC重定向表内容:
/ ^& V1 A9 ?% m, w) f2 |0 j+ L# \% _, X6 a
Redirect Table Index: 0x17. @% A! l7 P9 r4 g9 v6 _7 l
Redirect Table[ 0]: ff8 T- s$ `; l3 n4 M5 v" T& Q5 Z" P6 N
Redirect Table[ 1]: b3' L0 D+ Z0 ~2 N/ A/ R. ]
Redirect Table[ 2]: ff
B% `; S' v! [- L+ }" mRedirect Table[ 3]: 51, j: t6 q3 H0 J% m3 m9 J/ [* t
Redirect Table[ 4]: ff% G. C* Y" K- K1 V; t
Redirect Table[ 5]: ff
; f2 ^( Z, |1 B! m2 ~+ BRedirect Table[ 6]: 62
2 c5 c2 V+ o* Z( M1 G: g/ iRedirect Table[ 7]: ff
9 I; y# |& @+ f' b# r; W" m5 j6 J/ gRedirect Table[ 8]: d1
+ m& h, v0 r& S4 zRedirect Table[ 9]: b1! J6 D; r& I J7 ]# c1 `) C; K. W8 L3 K
Redirect Table[ a]: ff
; l6 D7 c% Z2 f. l. W4 P* IRedirect Table[ b]: ff
8 h2 `, G% F- ARedirect Table[ c]: 52
% e H5 s* Q! B& ?0 Z& kRedirect Table[ d]: ff4 |0 B u" w. H9 K" J
Redirect Table[ e]: ff: G* E1 l; }. v" O1 Q% P( b
Redirect Table[ f]: 92
7 e: i' X& D% ]: VRedirect Table[10]: ff, X& G! _" @7 f' u* @. h' f6 H
Redirect Table[11]: a3 r4 P5 N: X# Y# z
Redirect Table[12]: 838 i! S Q z d
Redirect Table[13]: 93. n5 P% S" N& M
Redirect Table[14]: ff! W: e" ?$ l2 B/ Z
Redirect Table[15]: ff
5 e( e/ a5 h% e) @; K ~) mRedirect Table[16]: ff9 T) |& U, k' @8 A3 U5 g
Redirect Table[17]: ff+ P: L) P8 ~+ T
$ M- A4 f4 Y7 | L( l, ~这是IDT表中被注册的向量:
* v, @/ D+ `* M' z
0 A% |1 o1 b8 p+ ^: ~1f: 80064908 (hal!HalpApicSpuriousService)' M/ e1 s! h/ K5 R4 X" S
37: 800640b8 (hal!PicSpuriousService37)
7 N' d0 T5 }$ T/ ]8 W# e8 b3d: 80065254 (hal!HalpApcInterrupt)# C3 s3 @; a% Z7 N0 {
41: 800650c8 (hal!HalpDispatchInterrupt)" |5 n/ C( c3 d# {7 _/ z1 E
50: 80064190 (hal!HalpApicRebootService)
. W3 p+ [1 t" a+ \" g51: 817f59e4
* Z C# v, W" w6 S% S7 T! P(Vector:51,Irql:4,SyncIrql:4,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:serial!SerialCIsrSw(f3c607c7))' a7 w- {1 ]4 X" F) ^3 {# [
52: 817f5044 4 c- m4 R3 `8 f; B* N- m# t
(Vector:52,Irql:4,SyncIrql:a,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:i8042prt!I8042MouseInterruptService(f3c57a2c))
7 Z. q) O! B0 |; e! G7 e83: 817d2d44 K9 V4 }! p5 O' w
(Vector:83,Irql:7,SyncIrql:7,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:NDIS!ndisMIsr(bff1b794))
& v# g7 | C. I5 T92: 81821384 * H) Z3 ^# C+ M2 I. d. p
(Vector:92,Irql:8,SyncIrql:8,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:atapi!ScsiPortInterrupt(bff892be)): _/ t5 O. c0 `2 T# y6 x% y. R
93: 8185ed64 V; U6 N' y( X) ` k
(Vector:93,Irql:8,SyncIrql:8,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:uhcd!UHCD_InterruptService(f3f0253e))
0 |+ |4 J5 v# \; |a3: 8186cdc4 4 k; E5 t1 V1 {1 v3 ^) U# K) O E i
(Vector:a3,Irql:9,SyncIrql:9,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:SCSIPORT!ScsiPortInterrupt(bff719f0))
* `' W2 m0 C# s: f- [b1: 818902e4
1 D; v# _0 n4 K& L" d4 d8 X(Vector:b1,Irql:a,SyncIrql:a,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:ACPI!ACPIInterruptServiceRoutine(bffe14b4))
- d" k! D/ `' q9 \ B7 R4 F8 Fb3: 81881664
6 h7 d& M+ `) I# m# e% h(Vector:b3,Irql:a,SyncIrql:a,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:i8042prt!I8042KeyboardInterruptService(f3c51918))& z* n2 b, ^1 f# K& W
c1: 800642fc (hal!HalpBroadcastCallService)( ^' {% s8 U( ]4 r
d1: 80063964 (hal!HalpClockInterrupt)
E/ J8 h! Q: b4 }# K- s5 xe1: 80064858 (hal!HalpIpiHandler)
: E) o% d7 |8 P* q1 Me3: 800645d4 (hal!HalpLocalApicErrorService)
* ^2 j& N2 R! S' Afd: 80064d64 (hal!HalpProfileInterrupt)6 W5 q) [6 P% s' O' W6 g
fe: 80064eec (hal!HalpPerfInterrupt): x: ?) I, C, a5 o: G4 p
& Q; i! ` V1 q4 q( p: }- n, r
象a3、b1这类输出内容很多的是被硬件注册的中断向量,而象d1、e3这种输出内容少的是注册为了的HAL内部使用的中断向量和本地APIC中断向量! X8 l. K4 P. {& H, p) q) S
7 ~* z- m8 k% t) r/ B' Z" q. d这是几个重要的数组:0 v7 E# N) d8 y
) x" O5 n* W9 k# e# @ E3 F0 PHalVectorToIrql(这个数组是以向量除于16做索引):
- @+ r% ^; s4 |4 r( a' x8006a304 00 ff ff 01 02 04 05 06-07 08 09 0a 1b 1c 1d 1e
8 v) s* P) b5 [3 o) Y! E& X, V! X! Z* i1 q3 }
HalpIRQLtoTPR:
b$ N; @) N2 p( z' \6 z8006a1e4 00 3d 41 41 51 61 71 81-91 a1 b1 b1 b1 b1 b1 b1+ z7 t/ {4 B9 E3 a4 M
8006a1f4 b1 b1 b1 b1 b1 b1 b1 b1-b1 b1 b1 c1 d1 e1 ef ff0 p3 f! h' y% g3 O0 i
. b9 Z4 h6 d* w2 t2 }' T3 @ T9 v
HalpINTItoVector:+ q$ N6 p- T T S0 O. L
8006ada0 00 b3 61 51 a2 b2 62 91-a1 b1 71 81 52 82 72 92. p3 u; m) y- C
8006adb0 00 a3 83 93 00 00 00 00-00 00 00 00 00 00 00 007 R# L# U+ a7 c% Q- @
* P% Y: B# g4 a
HalVectorToINTI:
, q" k& w4 y% g0 D5 o8006a204 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
+ ^$ ? m, q8 G8006a214 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
7 U/ y# Q& k) e5 D. m8006a224 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
9 C# u5 T; Z$ p( `% l' n' ?8006a234 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff- k8 |6 Z/ c7 i$ o; U9 h" c2 P
8006a244 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
' p# [+ ?* ]0 A. q8006a254 ff 03 0c ff ff ff ff ff-ff ff ff ff ff ff ff ff
1 f% B3 u6 w: V" v7 I) ?8006a264 ff 02 06 ff ff ff ff ff-ff ff ff ff ff ff ff ff
1 a: l2 i2 E' g* S- M0 w1 e8006a274 ff 0a 0e ff ff ff ff ff-ff ff ff ff ff ff ff ff
- W j1 z, m) J0 X8006a284 ff 0b 0d 12 ff ff ff ff-ff ff ff ff ff ff ff ff0 F" C9 ~& Y6 p5 ^+ ?
8006a294 ff 07 0f 13 ff ff ff ff-ff ff ff ff ff ff ff ff& R" ^0 C+ t: k% d9 c+ ~
8006a2a4 ff 08 04 11 ff ff ff ff-ff ff ff ff ff ff ff ff
% d$ E% S' R0 `8 p2 j8006a2b4 ff 09 05 01 ff ff ff ff-ff ff ff ff ff ff ff ff
; N: c7 I9 s( N) i' H2 ], {8006a2c4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
; e: W$ Y, p5 m4 C" D8006a2d4 ff 08 ff ff ff ff ff ff-ff ff ff ff ff ff ff ff! q5 D- M. U- a, ^! P: ?9 W
8006a2e4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff; d( j# m9 M' W/ |
8006a2f4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff 4 |' w0 i) O2 X. p! ~6 f
! @* ]& [2 A+ [+ B6 U
3 ^3 H( {$ g4 r& T: ~4 bvBucket:
/ b% i {7 x$ o8006ae30 02 02 02 03 03 03 03
@' K6 w& ^/ d3 a4 T# W/ h1 l4 N' S2 |0 N5 d9 W! p7 A& {0 g- z2 b7 m1 D
举个例子来说明一下,在我虚拟机里SCSI Controller的IRQ是17(注意,已经大于16了),到重定向表中查找第17项,得到中断向量为0xa3,再看IDT,0xa3对应处理例程是SCSIPORT!ScsiPortInterrupt。
, K, u; [) h5 s7 v A' P. |. ]7 f: p: w) Y! Y6 V
vBucket数组干啥用的?它就是用来分配新的向量。分配算法很简单,当要分配一个新的向量时,就在vBucket数组从右到左搜索最小的一个数i,该数对应在vBucket中索引为Index,新向量为(0x50+Index*16+i+1),新向量对应的IRQL为(4+i+1),同时会把vBucket中这个i加1,i不等大于16。象给出的这个vBucket,下一次计算时i=2, index=2。不过这些用于硬件的向量在IO系统初始化时调用HalpGetSystemInterruptVector分配好了,然后通过IoConnectInterrupt把IDT中注册的向量位置的例程注册为中断处理程序。这里并不是每个注册的向量都会对应中断处理程序,象上面给出的例子中,0xa1、0xa2、0xb1等向量就没有对应。
2 N& }9 `% \! T8 G, ]9 |
, ?4 {$ K' S* K7 S6 i IRQL机制为内核同步提供了很大的便利,既对驱动开发者隐藏了底层中断机制,也方便了驱动开发者的内核同步。LINUX从2.5内核开始引进的软中断和任务队列等机制,很大程度上也来自windows这套机制的借鉴。
/ S6 a1 C. b: P3 a
( }' d! C# C! U t3 s, b 终于考完试,解放了,呵呵。这个东西其实还有很多可写的,只是没空再深入去分析了。在未来的64位系统里,APIC这种基于中断引脚的机制很快也要被SAPIC这种基于消息的更强大的机制所取代 |
|