|
|
楼主 |
发表于 2008-2-27 14:35:05
|
显示全部楼层
从IRQ到IRQL(APIC版)
来自:http://www.nsfocus.net/index.php ... o=view&mid=2534
2 m- K7 s F9 N/ ?% t9 V# N, P
' f7 ^9 O$ x; ]1 [从IRQ到IRQL(APIC版)6 E, A; l; a. ?' \1 c0 L
0 d# U& c9 Q% G, {: B/ y. O0 l
作者:SoBeIt
# W" d4 y( _3 S. S+ ~出处:https://www.xfocus.net/bbs/index.php?act=ST&f=2&t=45502
* ?2 Q8 Y1 f r日期:2005-02-04' v Q `# i9 X, O' T1 w
! ?' ^1 A: y9 H: p( F. d( T1 D
事实上,老久的PIC在很早以前就被淘汰了,取而代之的是APIC。由于APIC可以兼容PIC,所以在很多单处理器系统上我们看到的PIC实际是APIC的兼容PIC模式。APIC主要应用于多处理器操作系统,是为了解决IRQ太少和处理器间中断而产生的,当然,单处理器操作系统也可以使用APIC(不是模拟PIC)。APIC的HAL和PIC的HAL有很大的不同,很突出的一个特点就是APIC的HAL不用再象PIC的HAL那样虚拟一个中断控制器,IRQL的概念已经可以通过中断向量的形式被APIC支持。事实上,因为被APIC所支持,所以在APIC HAL里IRQL的实现比PIC HAL那样虚拟一个中断控制器要简单得多了。
/ T, }9 e; C( l( L+ d5 A0 w1 g T$ t- P
现在来简单介绍一下APIC的结构(关于APIC详细的描述请参考《IA-32 Inel Architecture Software Developer's Manual Volume 3 Chapter 8》)。整个APIC系统由本地APIC、IO APIC和APIC串行总线组成(在Pentium 4和Xeon以后,APIC总线放到了系统总线中)组成。每个处理器中集成了一个本地APIC,而IO APIC是系统芯片组中一部分,APIC总线负责连接IO APIC和各个本地APIC。本地APIC接收该处理器产生的本地中断比如时钟中断,以及由该处理器产生的处理器间中断,并从APIC串行总线接收来自IO APIC的消息;IO APIC负责接收所有外部的硬件中断,并翻译成消息选择发给接收中断的处理器,以及从本地APIC接收处理器间中断消息。
/ k- l5 L1 m! s7 |) F7 j- o% V/ L/ R# A9 T8 q3 ]1 V
和PIC一样,控制本地APIC和IO APIC的方法是通过读写该单元中的相关寄存器。不过和PIC不一样的是,Intel把本地APIC和IO APIC的寄存器都映射到了物理地址空间,本地APIC默认映射到物理地址0xffe00000,IO APIC默认映射到物理地址0xfec00000。windows HAL再进一步把本地APIC映射到虚拟地址0xfffe0000,把IO APIC映射到虚拟地址0xffd06000,也就是说对该地址的读写实际就是对寄存器的读写,本地APIC里几个重要的寄存有EOI寄存器,任务优先级寄存器(TPR),处理器优先级寄存器(PPR),中断命令寄存器(ICR,64位),中断请求寄存器(IRR,256位,对应每个向量一位),中断在服务寄存器(ISR,256位)等。IO APIC里几个重要的寄存器有版本寄存器,I/O寄存器选择寄存器、I/O窗口寄存器(用要访问的I/O APIC寄存器的索引设置地址I/O寄存器选择寄存器,此时访问I/O窗口寄存器就是访问被选定的寄存器)还有很重要的是一个IO重定向表,每一个表项是一个64位寄存器,包括向量和目标模式、传输模式等相关位,每一个表项连接一条IRQ线,表项的数目随处理器的版本而不一样,在Pentium 4上为24个表项。表项的数目保存在IO APIC版本寄存器的[16:23]位。APIC系统支持255个中断向量,但Intel保留了0-15向量,可用的向量是16-255。并引进一个概念叫做任务优先级=中断向量/16,因为保留了16个向量,所以可用的优先级是2-15。当用一个指定的优先级设置本地APIC中的任务优先级寄存器TPR后,所有优先级低于TPR中优先级的中断都被屏蔽,是不是很象IRQL的机制?事实上,APIC HAL里的IRQL机制也就是靠着这个任务优先级寄存器得以实现。同一个任务优先级包括了16个中断向量,可以进一步细粒度地区分中断的优先级。
# w4 m) M' O) P Y* E
2 t: t" \) P0 D) C' e: M% G6 r) ^ 在HAL里虽然HalBeginSystemInterrupt仍然是IRQL机制的发动引擎,但是因为有APIC的支持,它和其它共同实现IRQL的函数要比PIC HAL里对应的函数功能简单得多。HalBeginSystemInterrupt通过用IRQL做索引在HalpIRQLtoTPR数组中获取该IRQL对应的任务优先级,用该优先级设置任务优先级寄存器TPR,并把TPR中原先的任务优先级/16做为索引在HalpVectorToIRQL数组中获取对应的原先的IRQL然后返回。若IRQL是从低于DISPATCH_LEVEL提升到高于DISPATCH_LEVEL,还需要设置KPCR+0x95(0xffdff095)为DISPATCH_LEVEL(0x2),表示是从DISPATCH_LEVEL以下的级别提升IRQL。HalEndSystemInterrupt向本地APIC的EOI寄存发送0,表示中断结束,可以接收新中断。并还要判断要降到的IRQL是否小于DISPATCH_LEVEL,若小于则进一步判断KPCR+0x96(0xffdff096)是否置位,若置位则表示有DPC中断在等待(在IRQL高于DISPATCH_LEVEL被引发,然后等待直到IRQL降到低于DISPATCH_LEVEL),则将KPCR+0x95和KPCR+0x96清0后调用KiDispatchInterrupt响应DPC软中断。否则做的工作就是和HalBeginSystemInterrupt一样的过程:把要降到的IRQL转换成任务优先级设置TRP,并把久的任务优先级转成IRQL返回。KfRaiseIrql、KfLowerIrql之类的函数也是这么一回事,把当前IRQL转成任务优先级修改TPR,并把原先TPR的值转成原先的IRQL并返回。而现在软中断的产生也有了APIC支持,APIC通过产生一个发向自己的处理器间中断,就可以产生一个软中断,因为可以指定该中断的向量,所以软中断就可以区分优先级别,如APC_LEVEL、DISPATCH_LEVEL。产生软中断的函数一样还是HalRequestSoftwareInterrupt,该函数会先判断KPCR+0x95是否和要产生的软中断IRQL一样,若是的话则置位KPCR+0x96并返回,表示现在IRQL大于DISPATCH_LEVEL所以不处理DPC中断。否则以要产生的软中断的IRQL为索引从HalpIRQLtoTPRHAL取出对应任务优先级,并或上0x4000,表示是发向自身的固定处理间中断,并用该值设置中断命令寄存器ICW的低32位,然后读取中断命令寄存器ICW的低32位是否为0x1000,确定中断消息已经发送后就返回,这时候软中断已经产生。值得注意的是APIC HAL里没有HalEndSoftwareInterrupt这个函数。HAL为软中断的IRQL提供了一个固定的中断向量:
% h4 _$ H. Y. U7 x2 i; y* W
( s1 k- E! I J#define ZERO_VECTOR 0x00 // IRQL 00 + @7 {- S9 ^+ U: ^9 u) @+ H9 Y) l ]
#define APC_VECTOR 0x3D // IRQL 01
, t- Y' Y: D# }6 P/ d8 r. W+ x& q#define DPC_VECTOR 0x41 // IRQL 02
, U$ ~* \5 c5 a( T#define APIC_GENERIC_VECTOR 0xC1 // IRQL 279 ?; F+ x+ j, j% R( X3 T# X
#define APIC_CLOCK_VECTOR 0xD1 // IRQL 28* n) X: g# v O0 P* x4 o
#define APIC_SYNCH_VECTOR 0xD1 // IRQL 28. h& k, l% m2 o% Q0 l
#define APIC_IPI_VECTOR 0xE1 // IRQL 29
) e0 I" A2 P' U/ M$ \#define POWERFAIL_VECTOR 0xEF // IRQL 30
8 v; D* r# P2 g9 _2 y#define APIC_PROFILE_VECTOR 0xFD // IRQL 31
7 j4 |4 Y3 s2 v1 o5 \! `1 h! I% E6 k' M0 |- p" n0 H. x
7 f9 G& O. ~, L2 G& \9 X( Q) ?
现在看一下一些重要的数据:
; b5 U! H3 e& n; A! O4 O# ]8 O
6 s5 k$ U- g- R2 |5 T这是我写的代码输出的IO APIC重定向表内容:$ h: ^+ _' `9 v. t5 o. O
& Q" o0 B5 ~9 F+ Q4 B" q: n7 C3 }
Redirect Table Index: 0x17. L2 L" o6 o( U" z& K+ Y h! B
Redirect Table[ 0]: ff
8 i" s0 n3 I" g( L: r: u! i3 m7 PRedirect Table[ 1]: b3+ G' U) ?8 G0 F: S/ i: ]
Redirect Table[ 2]: ff% E7 v2 D9 g' e, E }5 B) w: n
Redirect Table[ 3]: 51# {0 i( c: @/ `1 ^
Redirect Table[ 4]: ff7 M1 _7 d! `; {
Redirect Table[ 5]: ff
( U" W: z8 v+ E K/ R3 t9 r; iRedirect Table[ 6]: 62% R% {3 ] q. Y9 r$ c
Redirect Table[ 7]: ff
( a% M& u8 o% {! JRedirect Table[ 8]: d13 {9 U) N2 q' P% v
Redirect Table[ 9]: b1
, l% x# y* ?: u2 ~. D; _- }Redirect Table[ a]: ff
! c2 e5 W, L, r, j6 K+ U3 gRedirect Table[ b]: ff
% T- ~/ `$ [' g1 R: y. T4 NRedirect Table[ c]: 52; ]6 X$ l. T' W! E5 Y; @* @
Redirect Table[ d]: ff6 K2 g3 J y$ v4 m+ p9 Z
Redirect Table[ e]: ff
' `0 S& x1 l0 |' B8 C& PRedirect Table[ f]: 92- t5 v( D% V9 A1 m: {, v
Redirect Table[10]: ff
7 E9 b7 o9 C0 v6 j" O0 iRedirect Table[11]: a3
# ~& [: n8 e7 t0 {0 KRedirect Table[12]: 83
; H. w6 z+ y/ Y3 G0 B1 Q$ R) {Redirect Table[13]: 93: y/ Q- C8 C' T+ J1 M
Redirect Table[14]: ff6 o* G, b# ^; V7 u% V
Redirect Table[15]: ff4 ?4 m$ d4 _; K
Redirect Table[16]: ff
$ n6 p4 q, X- y1 [7 {% T" q/ w, TRedirect Table[17]: ff- N, O0 r% R7 A7 l% Y7 u$ H, ?1 Z
4 G1 t7 _- P' G5 l& j这是IDT表中被注册的向量:5 V; s+ J# G- C; `' b
5 |5 K" G& P/ u: H
1f: 80064908 (hal!HalpApicSpuriousService)
* E5 K( f& K$ |. ]& V! |2 D37: 800640b8 (hal!PicSpuriousService37)
- @+ l- [" K/ V3 G3d: 80065254 (hal!HalpApcInterrupt)$ `4 _8 g) a2 z8 z& n7 O% Z
41: 800650c8 (hal!HalpDispatchInterrupt). ~3 Q, {' J) Q
50: 80064190 (hal!HalpApicRebootService)# C4 J$ u" H5 d7 x
51: 817f59e4' a/ N T& O( k! t/ B5 G
(Vector:51,Irql:4,SyncIrql:4,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:serial!SerialCIsrSw(f3c607c7)): l+ ^: r% I- y2 M: t- O
52: 817f5044 1 `: t& ], i8 g g7 u
(Vector:52,Irql:4,SyncIrql:a,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:i8042prt!I8042MouseInterruptService(f3c57a2c))
& h# n( E6 V. h% l# E% F. m2 }83: 817d2d44
# V' ?' f. T5 Z(Vector:83,Irql:7,SyncIrql:7,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:NDIS!ndisMIsr(bff1b794))
% s, w$ f" E( z! U7 ]# c$ R92: 81821384 ' n8 \+ w6 h6 t( E
(Vector:92,Irql:8,SyncIrql:8,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:atapi!ScsiPortInterrupt(bff892be))" p. R9 U& C3 v( L5 S8 n5 ~
93: 8185ed64
9 u! K6 m: n1 Y6 x8 ~$ w" E7 j. B(Vector:93,Irql:8,SyncIrql:8,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:uhcd!UHCD_InterruptService(f3f0253e))
) _ M* q# Y$ t; R( Ra3: 8186cdc4 ; L9 M( N3 h4 M/ l
(Vector:a3,Irql:9,SyncIrql:9,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:SCSIPORT!ScsiPortInterrupt(bff719f0))- y) D* U4 D+ m2 C9 D& z
b1: 818902e4
0 J2 x' H* V2 c; o(Vector:b1,Irql:a,SyncIrql:a,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:ACPI!ACPIInterruptServiceRoutine(bffe14b4))& X" x1 ~9 e( s. ~* S4 G
b3: 81881664
% r8 o, T# V ~3 U6 u9 V( q; B0 E(Vector:b3,Irql:a,SyncIrql:a,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:i8042prt!I8042KeyboardInterruptService(f3c51918))
" P) x% P: l5 U, B0 S2 S! oc1: 800642fc (hal!HalpBroadcastCallService)
' R4 ~% H+ A3 s3 Xd1: 80063964 (hal!HalpClockInterrupt). @7 m, W. K( z) Z4 @1 {2 i
e1: 80064858 (hal!HalpIpiHandler)
/ l6 b6 K0 B4 m& Y4 v5 t9 W2 Ne3: 800645d4 (hal!HalpLocalApicErrorService)8 }; o: e7 I1 x! k2 ^5 N* \
fd: 80064d64 (hal!HalpProfileInterrupt)
$ e' q3 h# J" F) F5 u8 ^fe: 80064eec (hal!HalpPerfInterrupt)1 g1 Y: _$ u! a& R4 h
" R1 S6 @' R7 s
象a3、b1这类输出内容很多的是被硬件注册的中断向量,而象d1、e3这种输出内容少的是注册为了的HAL内部使用的中断向量和本地APIC中断向量: O/ B* ?2 ?" r( n
B# `2 M6 ] m. _这是几个重要的数组:5 B/ ^& i, M! S4 L" N9 T
2 s% s+ W- e0 @0 hHalVectorToIrql(这个数组是以向量除于16做索引):
2 T: v& y$ u' N: z' ~8006a304 00 ff ff 01 02 04 05 06-07 08 09 0a 1b 1c 1d 1e5 |: L. z0 Q4 I2 R$ W. s
' P, p* D8 Q1 g* V+ M- AHalpIRQLtoTPR:
+ [# ?0 D4 p! B0 B9 o7 P5 C1 ~8006a1e4 00 3d 41 41 51 61 71 81-91 a1 b1 b1 b1 b1 b1 b1
1 [$ e) a% D; t+ s7 j {% c8006a1f4 b1 b1 b1 b1 b1 b1 b1 b1-b1 b1 b1 c1 d1 e1 ef ff
. g* C# S6 j2 l; {/ |8 I- n7 P8 q8 ]% c9 b* `( r: H8 }! w- l; y
HalpINTItoVector:
/ s& n2 d/ [% x4 {+ P8006ada0 00 b3 61 51 a2 b2 62 91-a1 b1 71 81 52 82 72 92
! a6 w, s: C4 Y- O0 A6 Z# ^" Y8006adb0 00 a3 83 93 00 00 00 00-00 00 00 00 00 00 00 00
% Q* k% b4 G; Q1 S) [# l' V% g( w( C/ {9 ^5 R8 k+ B7 E* s4 R
HalVectorToINTI:
% Y* `2 }* W9 G1 L" a8006a204 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
! s; m; q4 ~7 ]+ U8006a214 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff+ k+ E' H! ^/ L5 k- e
8006a224 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff( T9 _' s5 o5 q7 L, y
8006a234 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff1 B, x+ p" c* M- ~9 i% l
8006a244 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff# q7 e# n- X3 u8 U. y
8006a254 ff 03 0c ff ff ff ff ff-ff ff ff ff ff ff ff ff
* R1 A! t# u* y6 a8006a264 ff 02 06 ff ff ff ff ff-ff ff ff ff ff ff ff ff0 o4 Z( |+ g5 T E
8006a274 ff 0a 0e ff ff ff ff ff-ff ff ff ff ff ff ff ff
Y4 T i( H: |, V/ K3 V2 A8006a284 ff 0b 0d 12 ff ff ff ff-ff ff ff ff ff ff ff ff3 F, `- y* X' l! k( f+ J y; S6 t& ]
8006a294 ff 07 0f 13 ff ff ff ff-ff ff ff ff ff ff ff ff
- w$ N8 m! c4 I6 S4 l8006a2a4 ff 08 04 11 ff ff ff ff-ff ff ff ff ff ff ff ff
+ D5 ]% U ?$ J/ Q! c4 J8006a2b4 ff 09 05 01 ff ff ff ff-ff ff ff ff ff ff ff ff& n6 R( ^3 R* a* Y9 a) L B, d8 P
8006a2c4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
- i6 ?+ k% }" Y8 s1 X( Z8006a2d4 ff 08 ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
$ s: h+ N: K6 Y6 S0 x. g# f8 Q8006a2e4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff! K5 m# W: l" d) d g. _. I
8006a2f4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff
, Z2 l& z1 I4 C/ |7 M& L: H5 z4 ~# H2 l5 Q% @- t$ P8 t* S
Q/ q9 W7 z7 D- q& d$ u1 e
vBucket:8 A& N5 ^( @1 C7 M- h9 b
8006ae30 02 02 02 03 03 03 03( M. h) c9 Z$ f$ G; D! n8 |
7 U- h$ x; m- ^) a2 A3 B
举个例子来说明一下,在我虚拟机里SCSI Controller的IRQ是17(注意,已经大于16了),到重定向表中查找第17项,得到中断向量为0xa3,再看IDT,0xa3对应处理例程是SCSIPORT!ScsiPortInterrupt。, T3 g" e+ U" G" _" A& Z! q+ F& U
& g6 l- Y! m! V' Z b* q4 }) a vBucket数组干啥用的?它就是用来分配新的向量。分配算法很简单,当要分配一个新的向量时,就在vBucket数组从右到左搜索最小的一个数i,该数对应在vBucket中索引为Index,新向量为(0x50+Index*16+i+1),新向量对应的IRQL为(4+i+1),同时会把vBucket中这个i加1,i不等大于16。象给出的这个vBucket,下一次计算时i=2, index=2。不过这些用于硬件的向量在IO系统初始化时调用HalpGetSystemInterruptVector分配好了,然后通过IoConnectInterrupt把IDT中注册的向量位置的例程注册为中断处理程序。这里并不是每个注册的向量都会对应中断处理程序,象上面给出的例子中,0xa1、0xa2、0xb1等向量就没有对应。
) P8 M# M. g* k' l/ T9 ~/ N5 {# I
IRQL机制为内核同步提供了很大的便利,既对驱动开发者隐藏了底层中断机制,也方便了驱动开发者的内核同步。LINUX从2.5内核开始引进的软中断和任务队列等机制,很大程度上也来自windows这套机制的借鉴。
2 ^$ h# ^0 F9 G) M
: q+ D; O) Q+ t5 t( D2 E4 E/ c$ `7 x 终于考完试,解放了,呵呵。这个东西其实还有很多可写的,只是没空再深入去分析了。在未来的64位系统里,APIC这种基于中断引脚的机制很快也要被SAPIC这种基于消息的更强大的机制所取代 |
|