找回密码
 加入计匠网
搜索
热搜: BIOS ACPI CPU Windows
查看: 32302|回复: 30

[原创]AC In/Out OS Slow Response

[复制链接]
发表于 2009-5-19 08:11:52 | 显示全部楼层 |阅读模式
AC In/Out OS Slow Response

& K9 G: W- \, o0 `6 P- i
  • Phenomenon3 @) `  `3 B/ A' d

) ?. j1 P& F. D' p0 |! m) F手上一个超薄NB的案子DQA报了这样一条bug:频繁的插拔ACvista右下角的power icon有时反应很慢,AC插拔过后有时需要等几秒或十几秒才发现power icon有变化。Power icon指的是下图红色圆圈标出的部分:

1 U, |8 Y) Y! B5 a) A
1
  • Why???
    ) _8 b( z. S0 [; |0 k
3 C- N" q! W" u: j, G- D6 z
& d, Y% x0 E8 @9 Z" T
刚看到这条bug时,我有点不以为然,因为有些机种也有这样的状况,所以我以为这个有可能是不同的测试人员认知上差异。而且超薄NB为了解决好功耗、导热的问题都使用比较低的配置,我最初还觉得可能跟配置有关。但是他们找了个相同chipset的机器去试,反应很流畅没有这样的现象L!我的猜测站不住脚了,这时我觉得应该是FW有些地方没有处理好导致的了。随后我们开始debug,首先我们要理清AC in/out 过程中ECBIOSOS都做了哪些动作,我所知道的状况是这样:1. EC检测到AC in/out的中断,更新EC ram中的AC状态并引发SCI IRQ通知OS2.OS收到SCI IRQ后调用BIOS中的_Q method并通过Notify function通知OS power source change3.OS调用_PSR function获取AC的状态并据此更新power icon显示。上述過程sample code 如下述所示:

- ^* I3 i8 U5 x1 ?9 p6 G. Y) @// AC Change event
# f. Y; ~$ B; j( z/ s& u$ _0 _
: E3 }+ P, q7 K6 d* m% P# oMethod(_QXX)

$ R) u. C& m/ L. w. c7 ]( v
7 q' G% K# o$ t  }# ?4 n% J; {{

0 h" @5 U7 o. l) J  L1 J
4 l4 s" S! Q2 Z. lStore(0x09, DBG8)

& K1 C, ^# _2 W
: I; W1 G$ N( f7 G  r9 b8 O4 UNotify(\_SB. ADP,0x80)
6 ^7 G: X$ L0 w2 S0 H' T//Power Source status changed

5 V, {* |  x2 `4 d6 l8 L' d+ t5 H/ L/ g. D, f% J6 ?7 |( u) ~
Store(0x0A, DBG8)
6 ^. M# F) }/ h+ F

' |' b' @3 Z- L2 m8 d8 n' a6 G: t5 l6 ?. d; u5 K7 V
}
0 F( }5 N$ x: A$ K2 ?

5 n( J  X& g6 @- V

: o/ S1 A& Y6 S/ G; i' k
% u0 n( Z; K$ \2 _0 X+ M- EMethod(_PSR,0)
& c' [; ]. U3 }: ~; N
9 a' _4 X8 j: a5 c, ~# g9 y# r

: A0 \% I4 ]2 Y3 t{  u- ~6 \0 n( I% t
+ j! @+ A7 ^+ y

, X8 v5 I$ S( h% VStore(0x0B, DBG8)  U$ y. V2 m2 i5 s/ U
( P! x; @& D( [5 W" w8 w

- l  V, {$ Z. [' g7 W* k; JIf(ACST)
: ^# c% h2 N/ i. U  a+ s+ o' O//check AC status
' M: ]) p* F5 n4 x1 F  T
' T4 J" s7 |) Q0 z- G/ e
{
/ z0 x8 V3 L4 x8 u

; i* m: O% [4 B9 d' ]
5 ~) Q( c: M5 a6 E, xreturn(One)
% ?/ A* e) K! M0 x+ q// AC Present
2 w: j& m6 i; _, W: A7 t

& c- ^0 f' y: a( p}

/ J! N/ c) T5 ?3 B* ~/ Q
. N( x% K! V$ u8 |* w6 @+ Melse
3 M, S/ K7 A6 F3 }9 j$ E
2 E6 ^' u8 r0 g5 y; E7 Z- ^
{
! ^& b9 C7 E, w9 w
7 D; a" h: l: L  c$ \  I
return(Zero)9 d1 u9 N- u3 q+ t
// AC Not Present

  j, y5 |+ B4 k2 s( V
, v; P; Z* T/ @0 Z7 H}
1 R* |# a+ c, L5 p. b# x

' `2 a1 K$ m( i# U9 wStore(0x0C, DBG8)

( T( i! t* ^% x
5 o3 A) Y6 a7 X5 `0 }}
& O; o) A. d" I1 F  B7 j
0 d2 H7 e3 m( ~  ~
2 U2 f0 @% I' Q& \# G
我能猜到的大概的流程应该就是这样了。那我们就从头开始追,先在AC change qevent中抛点,可是发现AC change对应的_Q method反应很快,一旦AC in/out debug card马上就会有显示。那么说明什么呢?跟EC没有关系吗?接着抛,又发现有时停在’0x0A’比较久才会出现,有时’0x0C’比较久。" f$ X! I, h. }8 ?. o" Y+ z1 s
状况不太一致;没感觉就把网撒大点,在几乎所有的ACPI method中都抛上点然后再try,试了几个回合以后有感觉了,我们发现一旦现象出现在Device Battery _BST method中停的久的几率非常高,也就是说AC in/out OS还会更新battery的信息。这段代码最明显的特征就是它会从EC ram中获取非常多的电池信息,sample code如下所示:
, |/ w! [$ N3 U; f- r/ RMethod(_BST)) ?- M( l3 x/ }/ n4 ?, x
{
4 Y" N% U+ B" {
! G+ q  u1 x8 MStore(BSTS,Local0)
& K6 B( J# h) P( y' x# E' ?. L2 t
  H, @$ {8 J' q2 t
% f1 v. W# ?$ o# ~8 R0 Q' Q3 Y8 y
If(LEqual(Local0,1)) //Check Battery Present Bit

# i3 r& J4 U) N' |+ g. O5 P$ }" @% C* K3 R$ V- J
{
/ C, n- n5 X9 `
1 |/ p* l8 @8 Z% G: ~4 F0 l4 X- X5 E4 a

) O# ?" V+ v4 r7 ^/ C
7 h0 H) X. R( {1 n7 j. L4 ~! Q& S' \+ M& @8 y& T3 c0 Q; G2 q
//Read Battery information from EC
  M( }" P6 D1 ]! {( R( j' e/ s1 H

8 _( P: }, k: H… …

/ X) F4 v- i1 p& `% g& l1 K. y0 F- D8 W9 Z
6 Y, w4 y$ s$ }6 f' r% z5 k# w4 C* r5 ?- X' j" O3 z4 p
}
& b8 y7 N0 {$ w3 z* A- w/ ^! l
! u3 Z4 H5 |6 d% o" i
Store(0x0D, DBG8)

( O+ V+ B0 S2 R}
/ M3 f1 ?1 k- |那么问题好像是由读EC ram导致的,ACPI中读取EC内容的方式是发0x80 cmdox66 port,随后EC产生一个SCI通知OS,接着OSEC ram index发给0x62 portEC将数据送给0x62 port再产生一个SCI通知0S,接着OS0x62 port就获得了EC ram指定位置的数据了。我在EC 端加入debug信息,发现出现状况时0x80 cmd EC很晚才收到,0x80 cmdOS发的,所以貌似和EC也没什么关系吗?继续思考,EC产生一个SCI的目的应该是产生一个IRQACPI driver获悉前面的指令已经完成,ACPI driver可以继续送指令下来了。如果某一条指令慢则有可能是前一个SCI IRQ通知 ACPI drive driver还没有处理好导致,也有可能ACPI driver已经处理好但是EC没有ready所致。
2 v1 u6 N+ \, P' d那么SCI中断机制是怎样的呢?EC SCICFG register通常将SCI IRQ配置成HLHpulse trigger,而且L的时间通常设置成64us,如下图2所示:
" z# q3 m0 k1 J$ L8 P; V
: A" e4 q1 y( D! h8 c7 P3 h" E
& _4 C' O& ^* m
BIOSSB SCI pin通常配置成low edge trig SCIpulse trig有个优点就是它能够自动复位,产生一个中断后SCI pinpull high。可是因为BIOS是下降沿触发,所以EC SCI保持64us低电平会不会太长呢?会不会导致ACPI driver收到IRQ后下命令给EC,EC SCI pin还没有复位而太久才收到?又或者说EC SCI pin保持低会影响到ACPI driver IRQ latency?有了这个想法以后,我就开始放大它,修改EC SCICFGSCI IRQ配置成128 us pulse trig,然后再做AC in/out的实验,嘿嘿病情加重了,fail率接近了80%之前只有10%;那我再将pulse width调整为16us再试,结果200次竟然没有一次出现症状J.
" o) {" T2 |% Q4 u! c! v 9 Q, s3 g' s6 D, y
  • Solution
- d! W! D9 x; m, G3 K  `

9 N9 N1 N9 B* J/ _% K8 ^' ]经过上面的分析,大概的原因已经清楚了。所以解决问题的方法应该是调整SCI IRQ pulse width,将保持低电平的时间调短,这样就可以有效的避免这条bug。通过这条bug我发现在分析问题的过程中需要理清问题的各个环节,并且对各个环节所涉及到的细节也要深入分析。不能够看到现象就轻易的下结论,更不能想当然,正确的态度是不放过任何蛛丝马迹,大胆假设多方求证!$ W/ L8 c/ E/ M& N* V7 P

( X7 o5 E+ E. X+ ~! Y$ Q' P
% v( |# A5 h- i; o! y& D* V; W

# ]) x* }# ~9 d. Z. a) ^
$ D: R0 a! W, AThat’s all!
% q4 d& x" ]+ a, [& s 6 G1 i8 g! |) Q% Y
Peter

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?加入计匠网

×
发表于 2009-5-19 18:31:57 | 显示全部楼层
原来如此!!!
9 l7 D. b  `/ A* {9 b# u, i% ^% F- m1 ^" o) @
谢谢!
回复

使用道具 举报

发表于 2009-5-20 08:52:57 | 显示全部楼层
Bug起因为本
回复

使用道具 举报

发表于 2009-5-21 14:42:55 | 显示全部楼层
好帖,学习了 谢谢!!!!!
回复

使用道具 举报

发表于 2009-5-21 22:48:47 | 显示全部楼层

好贴

感谢分享!真的很有用,以前我也遇到这个问题,还以为是OS的问题呢!真的好贴啊!
3 N8 v, k; A* p6 Z& C我看了您的分析代码,好像不是EC的代码吧!我现在就是OS-BIOS-EC三者的关系有点迷糊,版主能否指点一下!谢谢
回复

使用道具 举报

 楼主| 发表于 2009-5-22 07:53:35 | 显示全部楼层
hehe...
# m* ]" e. ]! \很高心这篇文章能够对你有帮助。7 P. B  i) K$ B! R  S' v7 n$ V
上述代码是BIOS中的ASL code,理清OS-BIOS-EC之间的关系的最好途径就是
+ R: \2 W6 O  fACPI spec,没事翻翻ACPI spec会有不少收获的。
回复

使用道具 举报

发表于 2009-5-23 09:04:24 | 显示全部楼层

谢谢

感谢指导!谢谢!有时间经常关注你帖子。
回复

使用道具 举报

发表于 2009-5-23 09:18:01 | 显示全部楼层

请教一下,关于oemmain.c中的几毫秒中断问题

您好!我现在手上有一个小本项目!用的是华邦的代码!我发现在oemmain.c中的几毫秒中断中是不是不能添加太多的代码啊!打个比方我就在一毫秒中断里加的代码,而这些代码是执行时间加入超过了一毫秒,是不是会造成EC死掉啊!因为在我修改后的代码发现有时很不稳定!我想了想是不是问题出现在这!请指教一下
回复

使用道具 举报

 楼主| 发表于 2009-5-23 10:43:26 | 显示全部楼层
中断的处理通常分顶半部和底半部,很多driver都是这样处理的.
( v* f% x2 O; ]+ d简单来讲就是在中断到来时置flag,后续再处理(DPC).
回复

使用道具 举报

发表于 2009-5-23 13:09:50 | 显示全部楼层

感谢回复

谢谢了!刚才我又仔细的查看了一下我的代码!终于找到了!EC死掉的原因了,就是我在上电时序那加了一个类似看门狗的小程序!来保证开机的效率。结果硬件始终有一个S电没有上来才导致我EC死在那里。2 s+ n4 [1 D4 P: Z, h
对于您的解释我还是有点迷糊!对winbond的EC他的oemmain.c中的1MS,10MS,100MS,500MS,1000MS。它用的是中断还是轮询!!中断和轮询是不是没有什么太大的区别啊!我现在就是担心我在比如1MS的函数里加的代码太多,会不会出现在这段代码执行一半的时候,1MS的中断又来了。那代码不就不能完全执行了吗?
回复

使用道具 举报

发表于 2009-5-23 13:59:00 | 显示全部楼层

回复 10# zhanghmjm 的帖子

oemmain.c的是service,是具体的执行处理过程,而实际的中断呢,是由Timer 来触发的(有定时1ms),只要不在中断的Routine 里加太多东西,在 service 里加,应该没事。个人看法,呵呵
回复

使用道具 举报

发表于 2009-5-24 10:02:18 | 显示全部楼层
谢谢了!明天有时间我做个小的实验!我想就应该清楚了,到时与您分享!呵呵
回复

使用道具 举报

发表于 2009-5-26 18:20:08 | 显示全部楼层
为啥你们的是C,我的是汇编啊,
回复

使用道具 举报

发表于 2009-5-27 13:48:06 | 显示全部楼层

回复 13# amty.wang 的帖子

用汇编写才牛呢,呵呵
回复

使用道具 举报

发表于 2009-6-5 10:35:35 | 显示全部楼层
文章很精采,分析很透彻!
/ H9 _% r9 _+ \
回复

使用道具 举报

 楼主| 发表于 2009-6-5 11:17:59 | 显示全部楼层
conol你也來這里了
$ l8 R" ]  c! u8 q( B  K呵呵...
回复

使用道具 举报

发表于 2009-6-9 22:12:26 | 显示全部楼层

请教一个关于重启的问题

您好!; O% D0 I* c2 [1 x. w. K. n
     不好意思又打扰你了,我现在遇到一个问题就是在重启电脑时EC为什么会几率性的死掉!在重启的时候我们EC都做什么啊!现在真的有点头痛了!!!
回复

使用道具 举报

 楼主| 发表于 2009-6-10 07:53:53 | 显示全部楼层
之前有追过reboot它的大致过程是这样的:
' _  |8 U. l! {6 s, \1.BIOS发FE给KBC,KBC pull low KBRST#一段时间,然后sb会将init# pin pull low 16个pci clock; P4 V1 L. @; D9 l5 b
chipset reset pci reset系统重启。0 ]* b+ M, f' Z5 f9 M
2.一旦重启后面的动作看上去正常开机没多少差别,对ec来讲无非是keyboard init、进出idle(update escd)
0 n% k, A3 H5 L" m8 v0 }. l/ G等等一些琐碎的动作。- q! O% Y# e! y6 j# D
之前碰到问题比较多的地方就在idle这部分了。
7 n9 _! @8 `- x; v, F9 a你所说的EC死掉指的是所有的function 都失效吗?keyboard能不能用,hot key能用吗,四秒关机呢.../ g: y3 \+ i: y! R% o! d9 \" ~; ]- d; Y- V
还有如果单台fail几率比较高,建议你接串口debug去看EC死在哪里。/ x! B. J$ S0 X: D" X% F
以上希望对你有所帮助。
回复

使用道具 举报

发表于 2009-6-10 21:45:30 | 显示全部楼层

重启死机

谢谢您的答复!8 n  |$ C& C6 v# \2 L& v
    我在做重启的时候EC是死掉的,四秒不能关机。键盘和热键无效!至于死机的原因真的很难找的。因为串口debug调试的功能我还没有弄呢!
& M2 {% I9 x: s. s# G' g     对了您说的BIOS发FE给我们EC应该是通过SCI吧!请指教一下!
回复

使用道具 举报

 楼主| 发表于 2009-6-11 08:15:47 | 显示全部楼层
to zhanghmjm:
2 t* p, Y; R) V' G0 QBIOS发FE不是通过SCI,而是透过60h,64h port。
* {( s/ _1 d9 k# XBIOS应该没有办法发SCI给EC,而EC是可以发SCI给BIOS的。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 加入计匠网

本版积分规则

Archiver|手机版|小黑屋|计匠网

GMT+8, 2025-2-21 03:09 , Processed in 0.050648 second(s), 17 queries .

Powered by Discuz! X3.5

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表