找回密码
 加入计匠网
搜索
热搜: BIOS ACPI CPU Windows
查看: 32779|回复: 30

[原创]AC In/Out OS Slow Response

[复制链接]
发表于 2009-5-19 08:11:52 | 显示全部楼层 |阅读模式
AC In/Out OS Slow Response
& }& c3 z3 a- W! y
  • Phenomenon
    5 w1 x" A. U% k5 p( z

1 |* }# Y2 o# a3 \. A# c2 {手上一个超薄NB的案子DQA报了这样一条bug:频繁的插拔ACvista右下角的power icon有时反应很慢,AC插拔过后有时需要等几秒或十几秒才发现power icon有变化。Power icon指的是下图红色圆圈标出的部分:
1 U) V! b+ Q2 H# a
1
  • Why???
    8 M: `5 \/ s( H6 W
- n9 s+ N8 Z$ b$ u, _
; g  R' e4 i* G9 _: L
刚看到这条bug时,我有点不以为然,因为有些机种也有这样的状况,所以我以为这个有可能是不同的测试人员认知上差异。而且超薄NB为了解决好功耗、导热的问题都使用比较低的配置,我最初还觉得可能跟配置有关。但是他们找了个相同chipset的机器去试,反应很流畅没有这样的现象L!我的猜测站不住脚了,这时我觉得应该是FW有些地方没有处理好导致的了。随后我们开始debug,首先我们要理清AC in/out 过程中ECBIOSOS都做了哪些动作,我所知道的状况是这样:1. EC检测到AC in/out的中断,更新EC ram中的AC状态并引发SCI IRQ通知OS2.OS收到SCI IRQ后调用BIOS中的_Q method并通过Notify function通知OS power source change3.OS调用_PSR function获取AC的状态并据此更新power icon显示。上述過程sample code 如下述所示:

+ N' {+ w0 [1 d2 T# U// AC Change event2 h0 b  j% Z8 P

7 O7 Y3 y5 u) B. W% I; u) H- z7 Y# pMethod(_QXX)

$ v$ f6 P: \4 Z7 j& q$ P" A& n$ ]$ h
- S- V" C8 b, U5 z1 H{

) g' }9 Q' g! N) r0 H8 N% k
5 V+ n* @& O6 G& {+ N! x( LStore(0x09, DBG8)

; [6 t: x! V6 a5 [5 L) z3 ^
, @, S: u; E' G- G( Z  ~5 kNotify(\_SB. ADP,0x80)( K' a  u* w1 D- G+ ]8 T
//Power Source status changed

+ u" t5 s+ n% ~# O) f9 U6 i* r. ~. D% \, C% u6 }
Store(0x0A, DBG8)
+ F8 M; f6 G& v: a! W

9 C( ?5 h' \2 p" T! i; i0 P5 _4 \! g& ^$ F2 K( Q
}
* p9 D  G* R+ A1 @9 \

1 _$ |& c& [& }' U+ T' m: H) w' e

7 w) X8 P# p+ l" `: N/ s$ o$ y
8 B9 E$ U5 i2 ^Method(_PSR,0)
% ~* X2 F; ~% W6 f( x

  X6 D  d: T5 h5 Z6 i+ B6 p3 v5 n0 ?- `1 @" \5 [5 K  P
{% `- n  r. F/ g% ^, j" F
/ }' L# u: B) S: U
. C( A1 P1 w/ n& a0 f
Store(0x0B, DBG8)
) o+ z& t& [# t  e

! m; {8 X: h1 l5 z0 K) @1 E* {. I6 e/ ~$ L
If(ACST)4 T& P5 \; ]. k" ~/ B3 @4 m% T; ?0 h
//check AC status
9 l& u; {1 g- z6 L! M3 ?- A8 U
% e5 |/ W' m+ |$ M" h% i) e
{
  }0 I  R& M3 j
# t; u# r' L! q8 f. W& n
. Z: `" W) m& I; y8 {% @3 E
return(One)
; }8 T, y) u1 s7 e// AC Present
$ ~5 Q9 D4 I  ]) g
! z; y; l# {. X1 `7 L4 ~2 y' D
}
' _1 Z$ x9 j; ^: M# o
2 j6 j8 |8 X1 h1 R4 L6 f5 Q" g* C8 i
else
7 d- X' D* W- e' e9 i

( ~# V! q. |2 I, I% d! {4 ^{
1 v( V+ ]+ H2 }1 W% v6 P$ a7 Z

1 H) h* s( Z$ w6 U3 [return(Zero)
$ |. Y" @' r7 V0 r// AC Not Present
  e1 z/ m- x6 h' F; h

2 Y% ]/ f3 A* L5 y. R6 y}
9 N# G4 F; G0 S  H$ O2 Q
. N% A5 l& D0 J  V% }, Z3 |
Store(0x0C, DBG8)

& X$ e9 U* U9 m8 P: [* M. W
9 s* ^; a; }% _7 Q. W2 U7 k8 I}3 w. D# o6 A) }. X/ K1 I

2 `9 W% h. v2 R6 S2 j
9 I$ Q3 |$ p" O$ t& `
我能猜到的大概的流程应该就是这样了。那我们就从头开始追,先在AC change qevent中抛点,可是发现AC change对应的_Q method反应很快,一旦AC in/out debug card马上就会有显示。那么说明什么呢?跟EC没有关系吗?接着抛,又发现有时停在’0x0A’比较久才会出现,有时’0x0C’比较久。
  G1 L( H5 ^- i* }- f: \9 k' K状况不太一致;没感觉就把网撒大点,在几乎所有的ACPI method中都抛上点然后再try,试了几个回合以后有感觉了,我们发现一旦现象出现在Device Battery _BST method中停的久的几率非常高,也就是说AC in/out OS还会更新battery的信息。这段代码最明显的特征就是它会从EC ram中获取非常多的电池信息,sample code如下所示:
4 c# q' h! [. T8 V* W2 b  XMethod(_BST)( g- N* G8 M" u+ {  e9 I& j
{$ l: \' _. f9 ^+ l. E
% V' X% ^0 J0 ?) T
Store(BSTS,Local0)
! `) p7 {  D: N, C) ]5 V1 h& b- q" _
9 E" A7 b; N9 G
% R- u0 K9 a2 D, f
If(LEqual(Local0,1)) //Check Battery Present Bit

( a: u7 Y+ F0 f5 V3 P, j; K: k+ Z- `% ~0 I( [" t) a
{6 g( ~) ]* Q. K9 m' O$ e2 c9 X- O& `/ i
% `# S  \# i% I3 b3 L9 ]
, ~  K: B: i2 C* E& q3 r

5 ^* C3 X- q/ d" E$ J% ?) I1 U) P  h
  k& T- ]6 l' A9 O% u  Q" D
//Read Battery information from EC

  q! K# q8 u9 j$ g8 [: E6 ?+ V2 X  J' I9 E- a6 h
… …
; \( k# T7 D. K" L" w
) m# J( Y6 z) p2 \
! z# O' I# B; j
}
' D. N) h$ \1 y0 I
# q8 c/ C2 H8 P% u0 z5 Q1 M
Store(0x0D, DBG8)
7 D. y$ D! P& q/ t" |0 @1 Y2 C
} ; r4 u- N- E; J* H: \
那么问题好像是由读EC ram导致的,ACPI中读取EC内容的方式是发0x80 cmdox66 port,随后EC产生一个SCI通知OS,接着OSEC ram index发给0x62 portEC将数据送给0x62 port再产生一个SCI通知0S,接着OS0x62 port就获得了EC ram指定位置的数据了。我在EC 端加入debug信息,发现出现状况时0x80 cmd EC很晚才收到,0x80 cmdOS发的,所以貌似和EC也没什么关系吗?继续思考,EC产生一个SCI的目的应该是产生一个IRQACPI driver获悉前面的指令已经完成,ACPI driver可以继续送指令下来了。如果某一条指令慢则有可能是前一个SCI IRQ通知 ACPI drive driver还没有处理好导致,也有可能ACPI driver已经处理好但是EC没有ready所致。
& C" u7 ]# i# s那么SCI中断机制是怎样的呢?EC SCICFG register通常将SCI IRQ配置成HLHpulse trigger,而且L的时间通常设置成64us,如下图2所示:

8 T5 r: I8 ?8 N  p4 I; G$ D
4 e$ {2 z- ^* f2 X  l4 w

7 g) J# j4 V  @  N: T  a
BIOSSB SCI pin通常配置成low edge trig SCIpulse trig有个优点就是它能够自动复位,产生一个中断后SCI pinpull high。可是因为BIOS是下降沿触发,所以EC SCI保持64us低电平会不会太长呢?会不会导致ACPI driver收到IRQ后下命令给EC,EC SCI pin还没有复位而太久才收到?又或者说EC SCI pin保持低会影响到ACPI driver IRQ latency?有了这个想法以后,我就开始放大它,修改EC SCICFGSCI IRQ配置成128 us pulse trig,然后再做AC in/out的实验,嘿嘿病情加重了,fail率接近了80%之前只有10%;那我再将pulse width调整为16us再试,结果200次竟然没有一次出现症状J.+ v; j! V1 H, B6 F% w& p

  w2 e/ v, T2 Q
  • Solution
8 U' ^2 M& G2 ?+ }& z
. _% z+ X) ~  C* z& A
经过上面的分析,大概的原因已经清楚了。所以解决问题的方法应该是调整SCI IRQ pulse width,将保持低电平的时间调短,这样就可以有效的避免这条bug。通过这条bug我发现在分析问题的过程中需要理清问题的各个环节,并且对各个环节所涉及到的细节也要深入分析。不能够看到现象就轻易的下结论,更不能想当然,正确的态度是不放过任何蛛丝马迹,大胆假设多方求证!' n: W$ i& O) l

( Z& P5 V. V  Z8 E
$ M! b+ _' h+ T2 j4 Y9 x9 E( U& a

( W1 R7 \  g1 R3 t 1 g$ v4 ?+ Q) M) F0 o! h
That’s all!
& |5 o. i- M0 l* {: y: r * H) G0 F6 F$ I/ [' G8 N2 t
Peter

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?加入计匠网

×
发表于 2009-5-19 18:31:57 | 显示全部楼层
原来如此!!!' g$ y5 f* b' n# s8 S. `, }+ }
* F% {- P" E9 Y
谢谢!
回复

使用道具 举报

发表于 2009-5-20 08:52:57 | 显示全部楼层
Bug起因为本
回复

使用道具 举报

发表于 2009-5-21 14:42:55 | 显示全部楼层
好帖,学习了 谢谢!!!!!
回复

使用道具 举报

发表于 2009-5-21 22:48:47 | 显示全部楼层

好贴

感谢分享!真的很有用,以前我也遇到这个问题,还以为是OS的问题呢!真的好贴啊!
  ^, W% x8 z7 u1 a6 g+ s0 R. e我看了您的分析代码,好像不是EC的代码吧!我现在就是OS-BIOS-EC三者的关系有点迷糊,版主能否指点一下!谢谢
回复

使用道具 举报

 楼主| 发表于 2009-5-22 07:53:35 | 显示全部楼层
hehe...& x" L9 c/ d2 t, e9 L7 [
很高心这篇文章能够对你有帮助。' X; k/ i% ^# L% `3 O
上述代码是BIOS中的ASL code,理清OS-BIOS-EC之间的关系的最好途径就是: D% P( N% Y/ ?- |) u) @8 j
ACPI spec,没事翻翻ACPI spec会有不少收获的。
回复

使用道具 举报

发表于 2009-5-23 09:04:24 | 显示全部楼层

谢谢

感谢指导!谢谢!有时间经常关注你帖子。
回复

使用道具 举报

发表于 2009-5-23 09:18:01 | 显示全部楼层

请教一下,关于oemmain.c中的几毫秒中断问题

您好!我现在手上有一个小本项目!用的是华邦的代码!我发现在oemmain.c中的几毫秒中断中是不是不能添加太多的代码啊!打个比方我就在一毫秒中断里加的代码,而这些代码是执行时间加入超过了一毫秒,是不是会造成EC死掉啊!因为在我修改后的代码发现有时很不稳定!我想了想是不是问题出现在这!请指教一下
回复

使用道具 举报

 楼主| 发表于 2009-5-23 10:43:26 | 显示全部楼层
中断的处理通常分顶半部和底半部,很多driver都是这样处理的.
3 v- `' s* C  V* U# L8 N! l简单来讲就是在中断到来时置flag,后续再处理(DPC).
回复

使用道具 举报

发表于 2009-5-23 13:09:50 | 显示全部楼层

感谢回复

谢谢了!刚才我又仔细的查看了一下我的代码!终于找到了!EC死掉的原因了,就是我在上电时序那加了一个类似看门狗的小程序!来保证开机的效率。结果硬件始终有一个S电没有上来才导致我EC死在那里。. O  m7 x2 H9 D5 }+ z. P3 H
对于您的解释我还是有点迷糊!对winbond的EC他的oemmain.c中的1MS,10MS,100MS,500MS,1000MS。它用的是中断还是轮询!!中断和轮询是不是没有什么太大的区别啊!我现在就是担心我在比如1MS的函数里加的代码太多,会不会出现在这段代码执行一半的时候,1MS的中断又来了。那代码不就不能完全执行了吗?
回复

使用道具 举报

发表于 2009-5-23 13:59:00 | 显示全部楼层

回复 10# zhanghmjm 的帖子

oemmain.c的是service,是具体的执行处理过程,而实际的中断呢,是由Timer 来触发的(有定时1ms),只要不在中断的Routine 里加太多东西,在 service 里加,应该没事。个人看法,呵呵
回复

使用道具 举报

发表于 2009-5-24 10:02:18 | 显示全部楼层
谢谢了!明天有时间我做个小的实验!我想就应该清楚了,到时与您分享!呵呵
回复

使用道具 举报

发表于 2009-5-26 18:20:08 | 显示全部楼层
为啥你们的是C,我的是汇编啊,
回复

使用道具 举报

发表于 2009-5-27 13:48:06 | 显示全部楼层

回复 13# amty.wang 的帖子

用汇编写才牛呢,呵呵
回复

使用道具 举报

发表于 2009-6-5 10:35:35 | 显示全部楼层
文章很精采,分析很透彻!2 D' Z- k  f0 ?' \
回复

使用道具 举报

 楼主| 发表于 2009-6-5 11:17:59 | 显示全部楼层
conol你也來這里了& I, c% X3 T! ?; K
呵呵...
回复

使用道具 举报

发表于 2009-6-9 22:12:26 | 显示全部楼层

请教一个关于重启的问题

您好!4 s5 [7 r7 @" P/ {2 L) r+ G# r
     不好意思又打扰你了,我现在遇到一个问题就是在重启电脑时EC为什么会几率性的死掉!在重启的时候我们EC都做什么啊!现在真的有点头痛了!!!
回复

使用道具 举报

 楼主| 发表于 2009-6-10 07:53:53 | 显示全部楼层
之前有追过reboot它的大致过程是这样的:
7 x  V6 C$ ~0 o4 r. T+ W, X  u8 `1.BIOS发FE给KBC,KBC pull low KBRST#一段时间,然后sb会将init# pin pull low 16个pci clock# H- I& V5 `' M& E! q" N6 p
chipset reset pci reset系统重启。% ^* c5 Q- M' K, }6 `: t; e  T
2.一旦重启后面的动作看上去正常开机没多少差别,对ec来讲无非是keyboard init、进出idle(update escd)
2 j: R; R7 I* y; l4 A8 o等等一些琐碎的动作。
5 Q8 B" `/ i# k+ F1 k. _) u% f之前碰到问题比较多的地方就在idle这部分了。
$ w$ S% V1 I# }你所说的EC死掉指的是所有的function 都失效吗?keyboard能不能用,hot key能用吗,四秒关机呢..., a% Y2 u# ^' d. p
还有如果单台fail几率比较高,建议你接串口debug去看EC死在哪里。/ K, k* X0 v9 C" a2 k1 m
以上希望对你有所帮助。
回复

使用道具 举报

发表于 2009-6-10 21:45:30 | 显示全部楼层

重启死机

谢谢您的答复!
- _# H1 O6 `, E4 S6 m    我在做重启的时候EC是死掉的,四秒不能关机。键盘和热键无效!至于死机的原因真的很难找的。因为串口debug调试的功能我还没有弄呢!7 B4 I1 d9 ~$ A
     对了您说的BIOS发FE给我们EC应该是通过SCI吧!请指教一下!
回复

使用道具 举报

 楼主| 发表于 2009-6-11 08:15:47 | 显示全部楼层
to zhanghmjm:
; b) C* l" \- n! GBIOS发FE不是通过SCI,而是透过60h,64h port。# T1 E* f/ @1 [, f: e" o* U  I
BIOS应该没有办法发SCI给EC,而EC是可以发SCI给BIOS的。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 加入计匠网

本版积分规则

Archiver|手机版|小黑屋|计匠网

GMT+8, 2025-4-28 18:01 , Processed in 0.082579 second(s), 18 queries .

Powered by Discuz! X3.5

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表