|
|
楼主 |
发表于 2008-2-27 14:35:05
|
显示全部楼层
从IRQ到IRQL(APIC版)
来自:http://www.nsfocus.net/index.php ... o=view&mid=25346 A( s2 O8 l# c, F/ @& o3 r7 D
: r, B; i y5 z
从IRQ到IRQL(APIC版)
! e" g6 V3 Q& [/ {- `) F
8 Z& Q k3 e) |作者:SoBeIt
# r* j8 z9 R0 B1 A& B出处:https://www.xfocus.net/bbs/index.php?act=ST&f=2&t=45502. w% c) o# u: ?* E7 V' I4 F
日期:2005-02-04
& K1 M+ a( ^ d3 _) l% N. e* `0 l
事实上,老久的PIC在很早以前就被淘汰了,取而代之的是APIC。由于APIC可以兼容PIC,所以在很多单处理器系统上我们看到的PIC实际是APIC的兼容PIC模式。APIC主要应用于多处理器操作系统,是为了解决IRQ太少和处理器间中断而产生的,当然,单处理器操作系统也可以使用APIC(不是模拟PIC)。APIC的HAL和PIC的HAL有很大的不同,很突出的一个特点就是APIC的HAL不用再象PIC的HAL那样虚拟一个中断控制器,IRQL的概念已经可以通过中断向量的形式被APIC支持。事实上,因为被APIC所支持,所以在APIC HAL里IRQL的实现比PIC HAL那样虚拟一个中断控制器要简单得多了。
9 a/ `# A& j' F' w1 l
# F1 s" @$ c/ v a% b 现在来简单介绍一下APIC的结构(关于APIC详细的描述请参考《IA-32 Inel Architecture Software Developer's Manual Volume 3 Chapter 8》)。整个APIC系统由本地APIC、IO APIC和APIC串行总线组成(在Pentium 4和Xeon以后,APIC总线放到了系统总线中)组成。每个处理器中集成了一个本地APIC,而IO APIC是系统芯片组中一部分,APIC总线负责连接IO APIC和各个本地APIC。本地APIC接收该处理器产生的本地中断比如时钟中断,以及由该处理器产生的处理器间中断,并从APIC串行总线接收来自IO APIC的消息;IO APIC负责接收所有外部的硬件中断,并翻译成消息选择发给接收中断的处理器,以及从本地APIC接收处理器间中断消息。 n/ h, ^" N% b3 h# V7 X4 |. t2 N# F3 \7 I
0 J6 h8 B! S2 a6 d& c, ]
和PIC一样,控制本地APIC和IO APIC的方法是通过读写该单元中的相关寄存器。不过和PIC不一样的是,Intel把本地APIC和IO APIC的寄存器都映射到了物理地址空间,本地APIC默认映射到物理地址0xffe00000,IO APIC默认映射到物理地址0xfec00000。windows HAL再进一步把本地APIC映射到虚拟地址0xfffe0000,把IO APIC映射到虚拟地址0xffd06000,也就是说对该地址的读写实际就是对寄存器的读写,本地APIC里几个重要的寄存有EOI寄存器,任务优先级寄存器(TPR),处理器优先级寄存器(PPR),中断命令寄存器(ICR,64位),中断请求寄存器(IRR,256位,对应每个向量一位),中断在服务寄存器(ISR,256位)等。IO APIC里几个重要的寄存器有版本寄存器,I/O寄存器选择寄存器、I/O窗口寄存器(用要访问的I/O APIC寄存器的索引设置地址I/O寄存器选择寄存器,此时访问I/O窗口寄存器就是访问被选定的寄存器)还有很重要的是一个IO重定向表,每一个表项是一个64位寄存器,包括向量和目标模式、传输模式等相关位,每一个表项连接一条IRQ线,表项的数目随处理器的版本而不一样,在Pentium 4上为24个表项。表项的数目保存在IO APIC版本寄存器的[16:23]位。APIC系统支持255个中断向量,但Intel保留了0-15向量,可用的向量是16-255。并引进一个概念叫做任务优先级=中断向量/16,因为保留了16个向量,所以可用的优先级是2-15。当用一个指定的优先级设置本地APIC中的任务优先级寄存器TPR后,所有优先级低于TPR中优先级的中断都被屏蔽,是不是很象IRQL的机制?事实上,APIC HAL里的IRQL机制也就是靠着这个任务优先级寄存器得以实现。同一个任务优先级包括了16个中断向量,可以进一步细粒度地区分中断的优先级。% g# }" l" d9 B! u; F
L3 x! k/ U2 [4 J' ] 在HAL里虽然HalBeginSystemInterrupt仍然是IRQL机制的发动引擎,但是因为有APIC的支持,它和其它共同实现IRQL的函数要比PIC HAL里对应的函数功能简单得多。HalBeginSystemInterrupt通过用IRQL做索引在HalpIRQLtoTPR数组中获取该IRQL对应的任务优先级,用该优先级设置任务优先级寄存器TPR,并把TPR中原先的任务优先级/16做为索引在HalpVectorToIRQL数组中获取对应的原先的IRQL然后返回。若IRQL是从低于DISPATCH_LEVEL提升到高于DISPATCH_LEVEL,还需要设置KPCR+0x95(0xffdff095)为DISPATCH_LEVEL(0x2),表示是从DISPATCH_LEVEL以下的级别提升IRQL。HalEndSystemInterrupt向本地APIC的EOI寄存发送0,表示中断结束,可以接收新中断。并还要判断要降到的IRQL是否小于DISPATCH_LEVEL,若小于则进一步判断KPCR+0x96(0xffdff096)是否置位,若置位则表示有DPC中断在等待(在IRQL高于DISPATCH_LEVEL被引发,然后等待直到IRQL降到低于DISPATCH_LEVEL),则将KPCR+0x95和KPCR+0x96清0后调用KiDispatchInterrupt响应DPC软中断。否则做的工作就是和HalBeginSystemInterrupt一样的过程:把要降到的IRQL转换成任务优先级设置TRP,并把久的任务优先级转成IRQL返回。KfRaiseIrql、KfLowerIrql之类的函数也是这么一回事,把当前IRQL转成任务优先级修改TPR,并把原先TPR的值转成原先的IRQL并返回。而现在软中断的产生也有了APIC支持,APIC通过产生一个发向自己的处理器间中断,就可以产生一个软中断,因为可以指定该中断的向量,所以软中断就可以区分优先级别,如APC_LEVEL、DISPATCH_LEVEL。产生软中断的函数一样还是HalRequestSoftwareInterrupt,该函数会先判断KPCR+0x95是否和要产生的软中断IRQL一样,若是的话则置位KPCR+0x96并返回,表示现在IRQL大于DISPATCH_LEVEL所以不处理DPC中断。否则以要产生的软中断的IRQL为索引从HalpIRQLtoTPRHAL取出对应任务优先级,并或上0x4000,表示是发向自身的固定处理间中断,并用该值设置中断命令寄存器ICW的低32位,然后读取中断命令寄存器ICW的低32位是否为0x1000,确定中断消息已经发送后就返回,这时候软中断已经产生。值得注意的是APIC HAL里没有HalEndSoftwareInterrupt这个函数。HAL为软中断的IRQL提供了一个固定的中断向量:: E/ y0 m1 Z2 S; I9 B% M1 x/ ~
# w2 Y" e" @# O* b#define ZERO_VECTOR 0x00 // IRQL 00
L2 w$ z9 N' y( Y#define APC_VECTOR 0x3D // IRQL 014 q0 h. {3 o3 D& ~ k D' W' g
#define DPC_VECTOR 0x41 // IRQL 02
" O- Q$ h4 N! i/ h* C' { D4 W#define APIC_GENERIC_VECTOR 0xC1 // IRQL 27, u5 O& v# l) `2 F1 v) o" G; f5 S
#define APIC_CLOCK_VECTOR 0xD1 // IRQL 28) h$ K( x3 x, W& @9 y' o% _
#define APIC_SYNCH_VECTOR 0xD1 // IRQL 28( T3 p& }$ v* f7 F" t8 d
#define APIC_IPI_VECTOR 0xE1 // IRQL 29# l5 K+ B8 T+ v, Q0 [
#define POWERFAIL_VECTOR 0xEF // IRQL 30 l: b' _+ G: Y* _
#define APIC_PROFILE_VECTOR 0xFD // IRQL 31
4 P& n/ M1 L$ l y, m. V/ }3 ~8 q0 c) O: x! n# s1 v% m1 W
8 m" n3 m z4 R/ s
现在看一下一些重要的数据:
6 }5 u, |! y# Z1 W
# ~/ z! G7 t4 P, ~0 x$ a) S1 U这是我写的代码输出的IO APIC重定向表内容:
1 Y! W/ z( E! u8 ~! C/ q3 u9 j# V9 ?6 ]. @* V
Redirect Table Index: 0x17
0 P' C$ m- ?4 N; `Redirect Table[ 0]: ff* U, w7 l0 {8 J4 `
Redirect Table[ 1]: b3% r2 `6 k+ [8 |' r+ J5 O
Redirect Table[ 2]: ff
# \/ x2 l/ K5 K8 c) k. V" gRedirect Table[ 3]: 515 J* C+ B+ ^- E) U: ^" R- @! b( ^+ S
Redirect Table[ 4]: ff- G0 w k: v9 j- m, F0 q9 j
Redirect Table[ 5]: ff w2 k- d8 O7 V# ~# Q( _
Redirect Table[ 6]: 62
1 E: |" H1 W/ P5 KRedirect Table[ 7]: ff- p& m) b) z" N3 X% J7 O9 C2 n+ o
Redirect Table[ 8]: d1
) q& q: @2 H8 J# t7 zRedirect Table[ 9]: b1
8 Q' A' N7 `5 B9 X# _Redirect Table[ a]: ff
( N4 Q) L0 [6 kRedirect Table[ b]: ff/ c4 A: \4 P0 N2 |8 k j" p# d
Redirect Table[ c]: 52' L+ F0 R7 t1 J7 d C9 s! K
Redirect Table[ d]: ff
% h& M+ D; y: `3 URedirect Table[ e]: ff: |2 S( R, ^' ?3 b* ~/ L
Redirect Table[ f]: 92
# K/ A0 A, \# u" {Redirect Table[10]: ff% ?8 l1 A9 M! E! \
Redirect Table[11]: a37 z. W* Q) ]+ o$ f8 e
Redirect Table[12]: 836 T P" L2 n7 Q0 i* `; q# F$ n9 @
Redirect Table[13]: 93) [0 F1 H7 ~! l: w- L
Redirect Table[14]: ff
0 s" k/ N$ s7 V0 pRedirect Table[15]: ff- f+ Q7 c3 D* H& }
Redirect Table[16]: ff
- u& _+ ]% r. Y; R0 ~. D, [" \4 u0 URedirect Table[17]: ff/ D9 f9 }: |. d. ?: A: P) C
0 q+ k" V. Z$ ?# l5 \' Z! {( Y这是IDT表中被注册的向量:
4 S3 u: E1 f, v1 U+ D, B1 r4 G) q* G/ X% U" B( e) y5 Y* M% l; |
1f: 80064908 (hal!HalpApicSpuriousService)
1 H3 l ^0 F- {1 b8 A f37: 800640b8 (hal!PicSpuriousService37)
% T4 |" P1 F; X' C6 C N3d: 80065254 (hal!HalpApcInterrupt)
' N0 I2 l4 n1 w! F4 r. J* x; R41: 800650c8 (hal!HalpDispatchInterrupt)
8 h6 E" g8 B( b; u' D j50: 80064190 (hal!HalpApicRebootService)* K' W2 V5 O4 ~* M% {" f0 y
51: 817f59e42 \7 J* N4 P9 v) c0 n% M
(Vector:51,Irql:4,SyncIrql:4,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:serial!SerialCIsrSw(f3c607c7))
! ?; s# s/ P+ ]( y( o7 K52: 817f5044
4 e# O+ m( A* B0 R(Vector:52,Irql:4,SyncIrql:a,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:i8042prt!I8042MouseInterruptService(f3c57a2c))# B, p2 U4 e$ F, \( M4 U
83: 817d2d44 6 m" r1 N) j2 l, R3 z1 `5 `
(Vector:83,Irql:7,SyncIrql:7,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:NDIS!ndisMIsr(bff1b794))( B: x# }) S' s& o
92: 81821384
' \& A" h8 y5 [, q" |6 \(Vector:92,Irql:8,SyncIrql:8,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:atapi!ScsiPortInterrupt(bff892be))
6 r, ^) V( ]5 J+ l) r93: 8185ed64 $ x: ^. J r. G
(Vector:93,Irql:8,SyncIrql:8,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:uhcd!UHCD_InterruptService(f3f0253e))
4 j1 Y3 T* F+ J7 ia3: 8186cdc4 6 S8 o* K0 }. E! B+ K
(Vector:a3,Irql:9,SyncIrql:9,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:SCSIPORT!ScsiPortInterrupt(bff719f0))8 x" b3 r6 {$ B3 G
b1: 818902e4
5 Q$ E8 H+ i" v9 m C/ C) R(Vector:b1,Irql:a,SyncIrql:a,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:ACPI!ACPIInterruptServiceRoutine(bffe14b4))
7 y& S- H, A* T5 nb3: 81881664
, M1 ]- T' m4 a9 @! T(Vector:b3,Irql:a,SyncIrql:a,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:i8042prt!I8042KeyboardInterruptService(f3c51918))
o a% w& d7 N8 d3 d( Ic1: 800642fc (hal!HalpBroadcastCallService)* n+ \% {$ q8 P
d1: 80063964 (hal!HalpClockInterrupt)4 h5 O8 t) t' o4 \5 V/ `! p
e1: 80064858 (hal!HalpIpiHandler)
7 b7 s6 L0 j7 l; o. s% f% Ve3: 800645d4 (hal!HalpLocalApicErrorService)' @% P+ I4 ]! B1 y/ |& V
fd: 80064d64 (hal!HalpProfileInterrupt)
) s z. {; g" @: w% ^3 vfe: 80064eec (hal!HalpPerfInterrupt)# K) L0 Y5 h+ O# @" f- ]0 L
' m$ c+ n" @$ W# ?' r) C. \
象a3、b1这类输出内容很多的是被硬件注册的中断向量,而象d1、e3这种输出内容少的是注册为了的HAL内部使用的中断向量和本地APIC中断向量$ ~' g7 S$ h: K. R
7 l& o: \1 d' ~; c$ y0 [这是几个重要的数组:
5 ~4 u1 V! D0 `$ s2 {5 U* y+ q ?, L5 M8 G0 S+ F: b
HalVectorToIrql(这个数组是以向量除于16做索引):0 S" ^3 }+ k1 G* Y$ q
8006a304 00 ff ff 01 02 04 05 06-07 08 09 0a 1b 1c 1d 1e% o) }5 \. M+ y6 F' ~; Q( o6 D4 g
! t, E% ~ P6 F; ?0 b
HalpIRQLtoTPR:
, D5 r/ d' s. D8006a1e4 00 3d 41 41 51 61 71 81-91 a1 b1 b1 b1 b1 b1 b1+ w) u ]; j6 c" W G/ [, j3 e; X
8006a1f4 b1 b1 b1 b1 b1 b1 b1 b1-b1 b1 b1 c1 d1 e1 ef ff; ]! }: V; T5 X" n5 m2 U/ B N
& B1 W! ]! H! V; vHalpINTItoVector:7 W5 \* v! b4 ]7 t6 L/ l
8006ada0 00 b3 61 51 a2 b2 62 91-a1 b1 71 81 52 82 72 920 R3 z" y8 S G+ U; `
8006adb0 00 a3 83 93 00 00 00 00-00 00 00 00 00 00 00 00
) N- V" v, K% S K2 ~ ^6 C
' c! S, M0 e- Z+ n3 e' MHalVectorToINTI:
5 Q' d4 ~6 c2 A1 ~, k7 }5 ~2 `8006a204 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff. X7 F) s' Z" ~
8006a214 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
/ Z2 {; H9 Y T ~ S8006a224 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
( s% k8 U3 K0 M7 V% G# v+ n8006a234 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff E" ]2 W' D5 Q# I# d4 R e
8006a244 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff6 f+ d4 W5 O! ~" p9 Z% F
8006a254 ff 03 0c ff ff ff ff ff-ff ff ff ff ff ff ff ff
" y! I* i9 p2 [8006a264 ff 02 06 ff ff ff ff ff-ff ff ff ff ff ff ff ff/ Z( K) G8 F9 R- r" h
8006a274 ff 0a 0e ff ff ff ff ff-ff ff ff ff ff ff ff ff
5 r9 U- h( M' ]* U3 z8006a284 ff 0b 0d 12 ff ff ff ff-ff ff ff ff ff ff ff ff2 O' j0 G- I6 d$ _
8006a294 ff 07 0f 13 ff ff ff ff-ff ff ff ff ff ff ff ff
9 [/ }# B0 u8 _4 r# H, P3 |8006a2a4 ff 08 04 11 ff ff ff ff-ff ff ff ff ff ff ff ff& }3 N: g5 B/ p. S. M
8006a2b4 ff 09 05 01 ff ff ff ff-ff ff ff ff ff ff ff ff. L& _3 d b; I% v6 M# _' c$ p
8006a2c4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
- o7 f4 m# M P; m8 T& [5 D4 e' K8006a2d4 ff 08 ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
* Z: ~4 |6 j2 t! [8006a2e4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
+ X+ p/ i$ t- V2 W0 z5 e8006a2f4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff , m7 d Q$ i. A
" t: ~5 g; P# a7 T
& h" v* k. {) e! KvBucket:
3 l7 P: s( d/ i( ^1 z, T8006ae30 02 02 02 03 03 03 03
9 `' K, o& z4 u+ d* K3 U
( L L5 ~: M0 ~. a7 V7 x+ _; r 举个例子来说明一下,在我虚拟机里SCSI Controller的IRQ是17(注意,已经大于16了),到重定向表中查找第17项,得到中断向量为0xa3,再看IDT,0xa3对应处理例程是SCSIPORT!ScsiPortInterrupt。. x/ C- o- x% ]3 `4 ]
9 e" Z j8 ] Z# P* m
vBucket数组干啥用的?它就是用来分配新的向量。分配算法很简单,当要分配一个新的向量时,就在vBucket数组从右到左搜索最小的一个数i,该数对应在vBucket中索引为Index,新向量为(0x50+Index*16+i+1),新向量对应的IRQL为(4+i+1),同时会把vBucket中这个i加1,i不等大于16。象给出的这个vBucket,下一次计算时i=2, index=2。不过这些用于硬件的向量在IO系统初始化时调用HalpGetSystemInterruptVector分配好了,然后通过IoConnectInterrupt把IDT中注册的向量位置的例程注册为中断处理程序。这里并不是每个注册的向量都会对应中断处理程序,象上面给出的例子中,0xa1、0xa2、0xb1等向量就没有对应。
0 P3 J( E P9 E; [" v6 Z2 B0 g
7 ]3 Z G* t# d* E IRQL机制为内核同步提供了很大的便利,既对驱动开发者隐藏了底层中断机制,也方便了驱动开发者的内核同步。LINUX从2.5内核开始引进的软中断和任务队列等机制,很大程度上也来自windows这套机制的借鉴。6 m* _1 [2 W4 T" d7 a! y
) G( ?! j- r# |9 @4 }4 B [/ ]/ C 终于考完试,解放了,呵呵。这个东西其实还有很多可写的,只是没空再深入去分析了。在未来的64位系统里,APIC这种基于中断引脚的机制很快也要被SAPIC这种基于消息的更强大的机制所取代 |
|