|
楼主 |
发表于 2008-2-27 14:35:05
|
显示全部楼层
从IRQ到IRQL(APIC版)
来自:http://www.nsfocus.net/index.php ... o=view&mid=2534- _7 t9 o5 N) U; T
$ F/ P1 N/ b8 e( j从IRQ到IRQL(APIC版)
+ M) u- W4 T U( K8 y& K2 O
- G; y& D. m8 j" }作者:SoBeIt! r. U; _$ p$ i+ D
出处:https://www.xfocus.net/bbs/index.php?act=ST&f=2&t=45502; \+ X$ I2 V) }* u
日期:2005-02-04
( b9 c5 h- P7 _: E u6 a; q
# W5 h4 R& x# X, h1 b事实上,老久的PIC在很早以前就被淘汰了,取而代之的是APIC。由于APIC可以兼容PIC,所以在很多单处理器系统上我们看到的PIC实际是APIC的兼容PIC模式。APIC主要应用于多处理器操作系统,是为了解决IRQ太少和处理器间中断而产生的,当然,单处理器操作系统也可以使用APIC(不是模拟PIC)。APIC的HAL和PIC的HAL有很大的不同,很突出的一个特点就是APIC的HAL不用再象PIC的HAL那样虚拟一个中断控制器,IRQL的概念已经可以通过中断向量的形式被APIC支持。事实上,因为被APIC所支持,所以在APIC HAL里IRQL的实现比PIC HAL那样虚拟一个中断控制器要简单得多了。
( |6 f# k" E" D) L( H! S z2 m2 z- p! }% p# T( o2 c* a
现在来简单介绍一下APIC的结构(关于APIC详细的描述请参考《IA-32 Inel Architecture Software Developer's Manual Volume 3 Chapter 8》)。整个APIC系统由本地APIC、IO APIC和APIC串行总线组成(在Pentium 4和Xeon以后,APIC总线放到了系统总线中)组成。每个处理器中集成了一个本地APIC,而IO APIC是系统芯片组中一部分,APIC总线负责连接IO APIC和各个本地APIC。本地APIC接收该处理器产生的本地中断比如时钟中断,以及由该处理器产生的处理器间中断,并从APIC串行总线接收来自IO APIC的消息;IO APIC负责接收所有外部的硬件中断,并翻译成消息选择发给接收中断的处理器,以及从本地APIC接收处理器间中断消息。: F) ~4 V! F/ X T; l
4 x( W, \' a$ w. K# l
和PIC一样,控制本地APIC和IO APIC的方法是通过读写该单元中的相关寄存器。不过和PIC不一样的是,Intel把本地APIC和IO APIC的寄存器都映射到了物理地址空间,本地APIC默认映射到物理地址0xffe00000,IO APIC默认映射到物理地址0xfec00000。windows HAL再进一步把本地APIC映射到虚拟地址0xfffe0000,把IO APIC映射到虚拟地址0xffd06000,也就是说对该地址的读写实际就是对寄存器的读写,本地APIC里几个重要的寄存有EOI寄存器,任务优先级寄存器(TPR),处理器优先级寄存器(PPR),中断命令寄存器(ICR,64位),中断请求寄存器(IRR,256位,对应每个向量一位),中断在服务寄存器(ISR,256位)等。IO APIC里几个重要的寄存器有版本寄存器,I/O寄存器选择寄存器、I/O窗口寄存器(用要访问的I/O APIC寄存器的索引设置地址I/O寄存器选择寄存器,此时访问I/O窗口寄存器就是访问被选定的寄存器)还有很重要的是一个IO重定向表,每一个表项是一个64位寄存器,包括向量和目标模式、传输模式等相关位,每一个表项连接一条IRQ线,表项的数目随处理器的版本而不一样,在Pentium 4上为24个表项。表项的数目保存在IO APIC版本寄存器的[16:23]位。APIC系统支持255个中断向量,但Intel保留了0-15向量,可用的向量是16-255。并引进一个概念叫做任务优先级=中断向量/16,因为保留了16个向量,所以可用的优先级是2-15。当用一个指定的优先级设置本地APIC中的任务优先级寄存器TPR后,所有优先级低于TPR中优先级的中断都被屏蔽,是不是很象IRQL的机制?事实上,APIC HAL里的IRQL机制也就是靠着这个任务优先级寄存器得以实现。同一个任务优先级包括了16个中断向量,可以进一步细粒度地区分中断的优先级。
5 t& ^9 u) U& a& D7 k4 r; @! X- t" {$ \9 q9 ?, u5 o. q
在HAL里虽然HalBeginSystemInterrupt仍然是IRQL机制的发动引擎,但是因为有APIC的支持,它和其它共同实现IRQL的函数要比PIC HAL里对应的函数功能简单得多。HalBeginSystemInterrupt通过用IRQL做索引在HalpIRQLtoTPR数组中获取该IRQL对应的任务优先级,用该优先级设置任务优先级寄存器TPR,并把TPR中原先的任务优先级/16做为索引在HalpVectorToIRQL数组中获取对应的原先的IRQL然后返回。若IRQL是从低于DISPATCH_LEVEL提升到高于DISPATCH_LEVEL,还需要设置KPCR+0x95(0xffdff095)为DISPATCH_LEVEL(0x2),表示是从DISPATCH_LEVEL以下的级别提升IRQL。HalEndSystemInterrupt向本地APIC的EOI寄存发送0,表示中断结束,可以接收新中断。并还要判断要降到的IRQL是否小于DISPATCH_LEVEL,若小于则进一步判断KPCR+0x96(0xffdff096)是否置位,若置位则表示有DPC中断在等待(在IRQL高于DISPATCH_LEVEL被引发,然后等待直到IRQL降到低于DISPATCH_LEVEL),则将KPCR+0x95和KPCR+0x96清0后调用KiDispatchInterrupt响应DPC软中断。否则做的工作就是和HalBeginSystemInterrupt一样的过程:把要降到的IRQL转换成任务优先级设置TRP,并把久的任务优先级转成IRQL返回。KfRaiseIrql、KfLowerIrql之类的函数也是这么一回事,把当前IRQL转成任务优先级修改TPR,并把原先TPR的值转成原先的IRQL并返回。而现在软中断的产生也有了APIC支持,APIC通过产生一个发向自己的处理器间中断,就可以产生一个软中断,因为可以指定该中断的向量,所以软中断就可以区分优先级别,如APC_LEVEL、DISPATCH_LEVEL。产生软中断的函数一样还是HalRequestSoftwareInterrupt,该函数会先判断KPCR+0x95是否和要产生的软中断IRQL一样,若是的话则置位KPCR+0x96并返回,表示现在IRQL大于DISPATCH_LEVEL所以不处理DPC中断。否则以要产生的软中断的IRQL为索引从HalpIRQLtoTPRHAL取出对应任务优先级,并或上0x4000,表示是发向自身的固定处理间中断,并用该值设置中断命令寄存器ICW的低32位,然后读取中断命令寄存器ICW的低32位是否为0x1000,确定中断消息已经发送后就返回,这时候软中断已经产生。值得注意的是APIC HAL里没有HalEndSoftwareInterrupt这个函数。HAL为软中断的IRQL提供了一个固定的中断向量:7 _4 l6 b- J! Q% W0 n5 {
9 ~6 w) U N6 D t" n#define ZERO_VECTOR 0x00 // IRQL 00 $ C7 b# @! p. r& E( l8 a
#define APC_VECTOR 0x3D // IRQL 01
5 o9 U* f, F9 a#define DPC_VECTOR 0x41 // IRQL 02% y% K K; m" E
#define APIC_GENERIC_VECTOR 0xC1 // IRQL 272 A& z4 ~0 r2 i2 O! M( w
#define APIC_CLOCK_VECTOR 0xD1 // IRQL 289 e5 c8 V, E/ A
#define APIC_SYNCH_VECTOR 0xD1 // IRQL 284 x ?8 _5 h, G# |! Y V
#define APIC_IPI_VECTOR 0xE1 // IRQL 290 a+ b# V3 V3 J+ T' d. z% H4 p/ ^
#define POWERFAIL_VECTOR 0xEF // IRQL 30
, U) F3 G3 g5 p% u0 p#define APIC_PROFILE_VECTOR 0xFD // IRQL 31
5 _% l. r) g( A/ S/ l: Z# M7 c( C ~6 J- d0 d1 L
8 k6 V/ y& H6 R4 j. j
现在看一下一些重要的数据:
( I# J5 m3 l$ J6 ?) o" p5 s' N2 L4 C% i
这是我写的代码输出的IO APIC重定向表内容: _% g9 S4 i% U4 D
5 W2 y' ?& f& U- uRedirect Table Index: 0x17
4 ]7 S x9 j6 |7 LRedirect Table[ 0]: ff2 C9 A6 d7 x$ o4 \3 @. ~
Redirect Table[ 1]: b3( a2 H( \( b: P; }. g/ y( Z% {. _
Redirect Table[ 2]: ff
7 b1 V' |% Y8 q+ ` p2 [' }( _Redirect Table[ 3]: 51
9 x, ^8 L7 f* E n; ?2 ]Redirect Table[ 4]: ff
6 Y8 f4 e) L; lRedirect Table[ 5]: ff
3 j+ I! A4 _* n6 z. x9 r6 M& ?Redirect Table[ 6]: 629 D! V- [5 ^& g7 z1 C& `5 _) p* y
Redirect Table[ 7]: ff
6 {0 @! e& o" Q; b6 e CRedirect Table[ 8]: d1: [- U! ]0 ~" V8 H& B9 I
Redirect Table[ 9]: b1
/ p9 V3 l/ t# T$ Y# e) xRedirect Table[ a]: ff' q* r) P2 m; l+ z0 H
Redirect Table[ b]: ff
. j; Q( x: V& O3 r9 w' r+ `Redirect Table[ c]: 52
% b7 j4 y' z6 G1 q! ^Redirect Table[ d]: ff% |9 \" V0 T! N& w# ]
Redirect Table[ e]: ff! A1 h. r& l9 Y; Y) V
Redirect Table[ f]: 92( [; v! L, c2 }+ [5 s, [
Redirect Table[10]: ff* {5 {. q4 h& t4 G
Redirect Table[11]: a3
" y# }' _5 P8 r4 y1 }, kRedirect Table[12]: 837 c$ C' y: I# ^# C
Redirect Table[13]: 93% b7 {; `9 M, ]
Redirect Table[14]: ff+ g8 h Z4 Y: y0 f3 B3 a9 |/ A# _ s
Redirect Table[15]: ff' K* A# J+ m! v
Redirect Table[16]: ff( x* ^5 k6 i& }! T6 L& Y" j
Redirect Table[17]: ff. q- q1 J' [$ ]* o% Z+ m
8 y( v4 {& Q6 v5 q. t' `+ [这是IDT表中被注册的向量:
' f- ?" u% b, h: \5 ]" j
4 |$ R$ @9 K8 n, `1f: 80064908 (hal!HalpApicSpuriousService)
5 m" I% k& }( t9 z. N! n+ D37: 800640b8 (hal!PicSpuriousService37)
" x* ?7 g h2 O* U- D c9 ~ K$ c3d: 80065254 (hal!HalpApcInterrupt)( P# M) O* F+ |0 b% V9 k( X
41: 800650c8 (hal!HalpDispatchInterrupt)" D1 B/ k3 S1 n- r) S
50: 80064190 (hal!HalpApicRebootService)
7 z9 j x8 W$ W& _3 `( V; g; S51: 817f59e4
K- P. U" c' ^) |% J(Vector:51,Irql:4,SyncIrql:4,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:serial!SerialCIsrSw(f3c607c7))
7 {( q0 x+ `; w5 p- `' g52: 817f5044 + ?5 }+ V8 W+ {$ a2 H% V/ c! m
(Vector:52,Irql:4,SyncIrql:a,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:i8042prt!I8042MouseInterruptService(f3c57a2c))
- d5 ~( e2 |: |2 W* V83: 817d2d44
) `! G7 N; p% P% w p(Vector:83,Irql:7,SyncIrql:7,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:NDIS!ndisMIsr(bff1b794))& ?3 s5 _% ~/ U% q0 _
92: 81821384 1 e M8 O( K- H: ?9 ~5 C2 n: {
(Vector:92,Irql:8,SyncIrql:8,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:atapi!ScsiPortInterrupt(bff892be))) L9 Y1 Y; \; Q4 u
93: 8185ed64 ! s5 D4 q& [( F0 f3 A% m; l" e
(Vector:93,Irql:8,SyncIrql:8,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:uhcd!UHCD_InterruptService(f3f0253e))
. I/ Z7 m) `& \+ a7 sa3: 8186cdc4 0 Z" U( }; C. P" S c& V1 I% m
(Vector:a3,Irql:9,SyncIrql:9,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:SCSIPORT!ScsiPortInterrupt(bff719f0))
8 E2 b; b, r" ?- kb1: 818902e4
6 d. Z+ A8 a* L4 o" m(Vector:b1,Irql:a,SyncIrql:a,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:ACPI!ACPIInterruptServiceRoutine(bffe14b4)): E' A0 H+ K- T
b3: 81881664 4 D% g2 X a: L
(Vector:b3,Irql:a,SyncIrql:a,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:i8042prt!I8042KeyboardInterruptService(f3c51918))
8 @6 }* R) q0 P% ]7 fc1: 800642fc (hal!HalpBroadcastCallService)
e) u, T5 u! R: Q: Bd1: 80063964 (hal!HalpClockInterrupt)/ ~+ T* l; H+ H% k" S+ ~/ z
e1: 80064858 (hal!HalpIpiHandler)- f* |7 h* t4 C0 ~0 Y
e3: 800645d4 (hal!HalpLocalApicErrorService)& l: s9 H: ~1 X& k3 D0 _6 Q! ]
fd: 80064d64 (hal!HalpProfileInterrupt)
# s7 {6 ?3 E8 C, ^: tfe: 80064eec (hal!HalpPerfInterrupt)
) S0 C, Y$ c. \- M
4 l. N7 Q5 }$ h& `& P象a3、b1这类输出内容很多的是被硬件注册的中断向量,而象d1、e3这种输出内容少的是注册为了的HAL内部使用的中断向量和本地APIC中断向量) k+ K2 h$ d8 P' u# g' i
/ ]! \# Y4 C+ c( s6 @1 ?0 n, Z这是几个重要的数组:
W+ D2 U& |; }# Z$ y B' }3 w4 I/ i* l1 N2 Y! K: l
HalVectorToIrql(这个数组是以向量除于16做索引):) t+ `, V) I$ @9 Q/ ?
8006a304 00 ff ff 01 02 04 05 06-07 08 09 0a 1b 1c 1d 1e" X5 C9 n) ]4 s3 o
F. g' o! ~4 R
HalpIRQLtoTPR:
% `. t; F" z5 Q. v! p2 X8006a1e4 00 3d 41 41 51 61 71 81-91 a1 b1 b1 b1 b1 b1 b1
7 x v, M5 B& U4 Z4 u: `- v8006a1f4 b1 b1 b1 b1 b1 b1 b1 b1-b1 b1 b1 c1 d1 e1 ef ff
& ?2 H7 e& S9 Y* w0 `
" ]( @2 @ y( X5 G. y! UHalpINTItoVector:
. G! a1 h. r4 z0 n/ O, U2 I1 q8 U8006ada0 00 b3 61 51 a2 b2 62 91-a1 b1 71 81 52 82 72 92
" [2 U. m3 I: \( I7 h% s8006adb0 00 a3 83 93 00 00 00 00-00 00 00 00 00 00 00 00' y! Q# r: [' [! Y
5 W% a0 ?5 [3 |- f6 R
HalVectorToINTI:
B8 q& H- N! c3 g' i% A$ D2 |5 g8006a204 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff7 }1 Q/ ~; a" v) X2 m/ j
8006a214 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
& e+ W3 d% F. w' X8006a224 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
4 t" O# y9 @. q# @7 I! T; V8006a234 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
% h9 j1 E0 O( R$ |% d6 [6 U1 L7 ?+ f8006a244 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff: Z( d/ h7 B; e0 r
8006a254 ff 03 0c ff ff ff ff ff-ff ff ff ff ff ff ff ff
O- O7 Q, a F. R: z I8006a264 ff 02 06 ff ff ff ff ff-ff ff ff ff ff ff ff ff
0 w, q- a ^- n2 i: T* Y' [+ G8006a274 ff 0a 0e ff ff ff ff ff-ff ff ff ff ff ff ff ff
- q# L6 Z% u( y8 x$ F1 U8006a284 ff 0b 0d 12 ff ff ff ff-ff ff ff ff ff ff ff ff8 ]+ }" b' j. b+ H% K1 i5 O; e: o
8006a294 ff 07 0f 13 ff ff ff ff-ff ff ff ff ff ff ff ff
6 O9 _% Y# Y: c3 O5 d8006a2a4 ff 08 04 11 ff ff ff ff-ff ff ff ff ff ff ff ff6 o+ V% ?5 M- r
8006a2b4 ff 09 05 01 ff ff ff ff-ff ff ff ff ff ff ff ff
, m* z- c/ f% m |! h( c- N1 F8006a2c4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff4 C! G. z8 b; d' {" _4 G9 w6 x! y8 V
8006a2d4 ff 08 ff ff ff ff ff ff-ff ff ff ff ff ff ff ff) n, g2 y4 E3 l. J. `
8006a2e4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
/ y; l% ~, v+ I( C8006a2f4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff 0 n) J: y5 U& s5 q) _1 j2 d
8 T! b1 l. G: v; ~. W6 T4 M3 \0 c% i5 D' w" F# b. O/ y
vBucket:- x, ~) n1 r2 R3 l/ P
8006ae30 02 02 02 03 03 03 03. c# y4 b1 i6 X7 {( Q8 c( T, }
+ p- @ [* M# w7 d/ I! j
举个例子来说明一下,在我虚拟机里SCSI Controller的IRQ是17(注意,已经大于16了),到重定向表中查找第17项,得到中断向量为0xa3,再看IDT,0xa3对应处理例程是SCSIPORT!ScsiPortInterrupt。
# z9 M& {7 `! W1 p, `( W) g, @& H" C3 Y8 s$ N, G% X( f! M
vBucket数组干啥用的?它就是用来分配新的向量。分配算法很简单,当要分配一个新的向量时,就在vBucket数组从右到左搜索最小的一个数i,该数对应在vBucket中索引为Index,新向量为(0x50+Index*16+i+1),新向量对应的IRQL为(4+i+1),同时会把vBucket中这个i加1,i不等大于16。象给出的这个vBucket,下一次计算时i=2, index=2。不过这些用于硬件的向量在IO系统初始化时调用HalpGetSystemInterruptVector分配好了,然后通过IoConnectInterrupt把IDT中注册的向量位置的例程注册为中断处理程序。这里并不是每个注册的向量都会对应中断处理程序,象上面给出的例子中,0xa1、0xa2、0xb1等向量就没有对应。) o5 d/ i2 `3 @. }, H% {
, k* V& k) _ W8 d' n, ? IRQL机制为内核同步提供了很大的便利,既对驱动开发者隐藏了底层中断机制,也方便了驱动开发者的内核同步。LINUX从2.5内核开始引进的软中断和任务队列等机制,很大程度上也来自windows这套机制的借鉴。+ v. Y) |0 M6 P7 Z* _ Z2 o
9 W+ D4 m) H" s' H( v& C7 |
终于考完试,解放了,呵呵。这个东西其实还有很多可写的,只是没空再深入去分析了。在未来的64位系统里,APIC这种基于中断引脚的机制很快也要被SAPIC这种基于消息的更强大的机制所取代 |
|