找回密码
 加入计匠网
搜索
热搜: BIOS ACPI CPU Windows
查看: 33464|回复: 30

[原创]AC In/Out OS Slow Response

[复制链接]
发表于 2009-5-19 08:11:52 | 显示全部楼层 |阅读模式
AC In/Out OS Slow Response
2 s1 A: a  }. k; s- L, B0 \5 {/ r
  • Phenomenon- H$ c$ `: C  w0 @+ H

# S2 ]2 T/ Q: ?! t1 p手上一个超薄NB的案子DQA报了这样一条bug:频繁的插拔ACvista右下角的power icon有时反应很慢,AC插拔过后有时需要等几秒或十几秒才发现power icon有变化。Power icon指的是下图红色圆圈标出的部分:
8 H% s7 M+ a% Q' O0 k
1
  • Why???
    ! J/ _1 k/ i' G: b8 @# g# r
% u* @% A5 D& N2 H. b4 ~5 Q
- Q2 `) L# `5 ?, z' I  @0 u
刚看到这条bug时,我有点不以为然,因为有些机种也有这样的状况,所以我以为这个有可能是不同的测试人员认知上差异。而且超薄NB为了解决好功耗、导热的问题都使用比较低的配置,我最初还觉得可能跟配置有关。但是他们找了个相同chipset的机器去试,反应很流畅没有这样的现象L!我的猜测站不住脚了,这时我觉得应该是FW有些地方没有处理好导致的了。随后我们开始debug,首先我们要理清AC in/out 过程中ECBIOSOS都做了哪些动作,我所知道的状况是这样:1. EC检测到AC in/out的中断,更新EC ram中的AC状态并引发SCI IRQ通知OS2.OS收到SCI IRQ后调用BIOS中的_Q method并通过Notify function通知OS power source change3.OS调用_PSR function获取AC的状态并据此更新power icon显示。上述過程sample code 如下述所示:

1 x  f3 V6 c0 a9 E// AC Change event
7 M/ F- a/ _5 A
3 D' [4 i0 a" z5 |- j% j  ^+ vMethod(_QXX)
: b+ A6 @/ o& Z. }4 W/ [- I  R, H
3 R/ Q9 d9 @* `
{

8 H: H& N/ G* u9 s
" a1 O7 S3 S' ^: A6 l7 f5 ^* VStore(0x09, DBG8)

, V$ ^# }' `& H- D$ p4 y" w, |$ @, G' B+ c7 |
Notify(\_SB. ADP,0x80)& I( R! j# h  A' C% O8 U! @, _3 I
//Power Source status changed
  @- m8 |- c0 V& i# Q
9 T5 F" h& `2 L3 y# I) |
Store(0x0A, DBG8)

$ `$ @0 [- n: i" _5 W/ ~ 9 |! G( E9 Z, _. c2 ?2 {3 P
0 R$ \) C1 g( i; j  |# }. }
}
  L. ?( E/ Y4 r  D2 ^
8 D: E7 n2 v% `5 u0 @/ {
) I: c1 O( N" J3 r) n; W4 v  ?1 b
0 L: T0 z' G$ U7 R
Method(_PSR,0); V7 R8 N, G9 L4 A# u# R- ?1 i

! H& X, z1 D$ s) W
4 r; y* J6 Q! o6 _- v9 @9 g{
. w8 I; ?, n, n* U/ x- S
4 a/ ]$ f9 d( Z. @$ w

8 V) r, w) [) T* Y, mStore(0x0B, DBG8)/ }7 j1 e9 z2 k
2 i/ p+ M8 z- C

3 M0 O4 [; J. nIf(ACST)- c* _( {* v6 v" [; B% B* X7 R
//check AC status

; i. y3 V9 v( r7 W! O
, ]4 {; _* U0 P3 l9 T9 h9 f  z{

4 S% X/ j1 m  g
% L+ v+ T/ q+ E& W, ~3 s  n7 ]  \, Y" J* r* g
return(One)
5 Y" M7 m1 n9 a. D8 j# e1 J8 Z// AC Present
( J( i) w+ m7 I$ S7 |7 @+ u; [# k
5 o( t, b) _) ^, f( M+ f
}

, X3 {- b* X- C2 c
7 X2 o+ k! \  |& Z6 R- _/ L' `else
4 ~# O# t8 Q6 L7 a

  C  R" ]: u" ]. I: _7 g{

" Q& H. f5 i* A2 a' H) A) k% b% G2 e6 j% ]# a( P7 ~: U% o
return(Zero); J6 d9 \0 P7 |+ v9 b
// AC Not Present
; x' z& K) }( h1 ]( ^
2 B+ a# p, k7 o
}

0 |6 m1 z' q- |2 e0 }, T) E" J/ `5 |8 ^1 A3 N1 b- D9 ~0 J
Store(0x0C, DBG8)

  G3 _6 e+ h3 A' c( ~7 G+ ~# d* d( T1 l5 b1 v# [# \* f9 z
}
. {3 m4 t# l7 e% X  i2 d9 U. p$ }& r- F( q* h
- w/ A/ Q9 G, F, v/ O# m! n
我能猜到的大概的流程应该就是这样了。那我们就从头开始追,先在AC change qevent中抛点,可是发现AC change对应的_Q method反应很快,一旦AC in/out debug card马上就会有显示。那么说明什么呢?跟EC没有关系吗?接着抛,又发现有时停在’0x0A’比较久才会出现,有时’0x0C’比较久。
4 J9 V; L& v& S; i7 O状况不太一致;没感觉就把网撒大点,在几乎所有的ACPI method中都抛上点然后再try,试了几个回合以后有感觉了,我们发现一旦现象出现在Device Battery _BST method中停的久的几率非常高,也就是说AC in/out OS还会更新battery的信息。这段代码最明显的特征就是它会从EC ram中获取非常多的电池信息,sample code如下所示:8 G1 c: F9 H& ?" U
Method(_BST): E' H! B6 r. |! V" x# P+ r/ C
{9 S/ O' w. m! t9 f. @

, ~2 o/ u. H3 bStore(BSTS,Local0)

3 B8 |0 k8 G7 r" T3 _6 M
1 o  k! Y) g- n- N
* T9 m7 N) y! C/ qIf(LEqual(Local0,1)) //Check Battery Present Bit
1 `) `4 D/ a$ u. L  F6 b& u
- I3 ]8 f: S8 q
{" z0 s3 _9 l- x1 H' a
# Y- O# H) Z" N7 o+ P; q2 `

1 C% v& k5 x4 q. N; W# w! T7 O. r, B: c

3 H4 h1 |7 w2 E6 O. J. z4 m( t; p" G+ R$ _7 |8 Y( l9 Q
//Read Battery information from EC
% m/ e! ^+ S4 w* e3 ]6 H8 x2 w" s/ I

9 o0 r, X3 O4 D, A5 S… …

1 l2 k; @7 |6 R; j6 i9 W# A. g% i. T  N' }% x% Z

2 M) q4 E$ c+ C& l}

( U' _5 l& v$ \- F  m) {3 q9 }- ^* N! L( N' i
Store(0x0D, DBG8)
7 M% Y3 x1 |4 s
}
' ]4 o2 [0 \. A+ y* ]8 \2 l那么问题好像是由读EC ram导致的,ACPI中读取EC内容的方式是发0x80 cmdox66 port,随后EC产生一个SCI通知OS,接着OSEC ram index发给0x62 portEC将数据送给0x62 port再产生一个SCI通知0S,接着OS0x62 port就获得了EC ram指定位置的数据了。我在EC 端加入debug信息,发现出现状况时0x80 cmd EC很晚才收到,0x80 cmdOS发的,所以貌似和EC也没什么关系吗?继续思考,EC产生一个SCI的目的应该是产生一个IRQACPI driver获悉前面的指令已经完成,ACPI driver可以继续送指令下来了。如果某一条指令慢则有可能是前一个SCI IRQ通知 ACPI drive driver还没有处理好导致,也有可能ACPI driver已经处理好但是EC没有ready所致。1 X( P5 m# z: r! n0 b
那么SCI中断机制是怎样的呢?EC SCICFG register通常将SCI IRQ配置成HLHpulse trigger,而且L的时间通常设置成64us,如下图2所示:
+ C3 _1 j% s: j( C

5 @2 X: s* u- V2 s2 v5 S3 M
) I/ S( k+ E% T  s
BIOSSB SCI pin通常配置成low edge trig SCIpulse trig有个优点就是它能够自动复位,产生一个中断后SCI pinpull high。可是因为BIOS是下降沿触发,所以EC SCI保持64us低电平会不会太长呢?会不会导致ACPI driver收到IRQ后下命令给EC,EC SCI pin还没有复位而太久才收到?又或者说EC SCI pin保持低会影响到ACPI driver IRQ latency?有了这个想法以后,我就开始放大它,修改EC SCICFGSCI IRQ配置成128 us pulse trig,然后再做AC in/out的实验,嘿嘿病情加重了,fail率接近了80%之前只有10%;那我再将pulse width调整为16us再试,结果200次竟然没有一次出现症状J.
. Y0 @. a6 Q: L8 _ : ^& Q5 V. ]" x
  • Solution
6 j# d' E5 o# @3 @

1 R! @' S, @/ d( P, k9 ]3 q* W经过上面的分析,大概的原因已经清楚了。所以解决问题的方法应该是调整SCI IRQ pulse width,将保持低电平的时间调短,这样就可以有效的避免这条bug。通过这条bug我发现在分析问题的过程中需要理清问题的各个环节,并且对各个环节所涉及到的细节也要深入分析。不能够看到现象就轻易的下结论,更不能想当然,正确的态度是不放过任何蛛丝马迹,大胆假设多方求证!
6 H+ H# Y2 M( G

1 U  ?, z6 z5 J; b4 T8 u/ c
6 ?# Y, o2 B- B

; ~* b" S. y$ x9 a# F0 O
3 J! Z/ J% b) C6 H; T! k2 h' S# {That’s all!3 I9 q! \' ?5 e- C' {# d; c; k# I

. j% C+ Y( [* R* d* LPeter

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?加入计匠网

×
发表于 2009-5-19 18:31:57 | 显示全部楼层
原来如此!!!
0 G6 a) ?# U  @1 V$ Q$ `/ v$ f! |0 U) |& t( ^) Q- @% o
谢谢!
回复

使用道具 举报

发表于 2009-5-20 08:52:57 | 显示全部楼层
Bug起因为本
回复

使用道具 举报

发表于 2009-5-21 14:42:55 | 显示全部楼层
好帖,学习了 谢谢!!!!!
回复

使用道具 举报

发表于 2009-5-21 22:48:47 | 显示全部楼层

好贴

感谢分享!真的很有用,以前我也遇到这个问题,还以为是OS的问题呢!真的好贴啊!# F0 m( T/ W% L
我看了您的分析代码,好像不是EC的代码吧!我现在就是OS-BIOS-EC三者的关系有点迷糊,版主能否指点一下!谢谢
回复

使用道具 举报

 楼主| 发表于 2009-5-22 07:53:35 | 显示全部楼层
hehe.../ t: {0 ^* L: b% i0 r- R$ E# z
很高心这篇文章能够对你有帮助。
+ C# T# y5 d% N上述代码是BIOS中的ASL code,理清OS-BIOS-EC之间的关系的最好途径就是7 L; q/ X8 d: [2 m0 W5 U
ACPI spec,没事翻翻ACPI spec会有不少收获的。
回复

使用道具 举报

发表于 2009-5-23 09:04:24 | 显示全部楼层

谢谢

感谢指导!谢谢!有时间经常关注你帖子。
回复

使用道具 举报

发表于 2009-5-23 09:18:01 | 显示全部楼层

请教一下,关于oemmain.c中的几毫秒中断问题

您好!我现在手上有一个小本项目!用的是华邦的代码!我发现在oemmain.c中的几毫秒中断中是不是不能添加太多的代码啊!打个比方我就在一毫秒中断里加的代码,而这些代码是执行时间加入超过了一毫秒,是不是会造成EC死掉啊!因为在我修改后的代码发现有时很不稳定!我想了想是不是问题出现在这!请指教一下
回复

使用道具 举报

 楼主| 发表于 2009-5-23 10:43:26 | 显示全部楼层
中断的处理通常分顶半部和底半部,很多driver都是这样处理的.
1 k' t/ F: r9 @4 n简单来讲就是在中断到来时置flag,后续再处理(DPC).
回复

使用道具 举报

发表于 2009-5-23 13:09:50 | 显示全部楼层

感谢回复

谢谢了!刚才我又仔细的查看了一下我的代码!终于找到了!EC死掉的原因了,就是我在上电时序那加了一个类似看门狗的小程序!来保证开机的效率。结果硬件始终有一个S电没有上来才导致我EC死在那里。  Q! l! w9 j+ @3 \2 @9 B' z7 l
对于您的解释我还是有点迷糊!对winbond的EC他的oemmain.c中的1MS,10MS,100MS,500MS,1000MS。它用的是中断还是轮询!!中断和轮询是不是没有什么太大的区别啊!我现在就是担心我在比如1MS的函数里加的代码太多,会不会出现在这段代码执行一半的时候,1MS的中断又来了。那代码不就不能完全执行了吗?
回复

使用道具 举报

发表于 2009-5-23 13:59:00 | 显示全部楼层

回复 10# zhanghmjm 的帖子

oemmain.c的是service,是具体的执行处理过程,而实际的中断呢,是由Timer 来触发的(有定时1ms),只要不在中断的Routine 里加太多东西,在 service 里加,应该没事。个人看法,呵呵
回复

使用道具 举报

发表于 2009-5-24 10:02:18 | 显示全部楼层
谢谢了!明天有时间我做个小的实验!我想就应该清楚了,到时与您分享!呵呵
回复

使用道具 举报

发表于 2009-5-26 18:20:08 | 显示全部楼层
为啥你们的是C,我的是汇编啊,
回复

使用道具 举报

发表于 2009-5-27 13:48:06 | 显示全部楼层

回复 13# amty.wang 的帖子

用汇编写才牛呢,呵呵
回复

使用道具 举报

发表于 2009-6-5 10:35:35 | 显示全部楼层
文章很精采,分析很透彻!1 n; k' ]1 ]* T
回复

使用道具 举报

 楼主| 发表于 2009-6-5 11:17:59 | 显示全部楼层
conol你也來這里了
" k  I: Q( e# i3 M0 _呵呵...
回复

使用道具 举报

发表于 2009-6-9 22:12:26 | 显示全部楼层

请教一个关于重启的问题

您好!
) G3 Y0 {) U4 n, ]1 h     不好意思又打扰你了,我现在遇到一个问题就是在重启电脑时EC为什么会几率性的死掉!在重启的时候我们EC都做什么啊!现在真的有点头痛了!!!
回复

使用道具 举报

 楼主| 发表于 2009-6-10 07:53:53 | 显示全部楼层
之前有追过reboot它的大致过程是这样的:$ J4 b: s+ ^/ k
1.BIOS发FE给KBC,KBC pull low KBRST#一段时间,然后sb会将init# pin pull low 16个pci clock
3 T: {' M3 a; r, _3 v. Z$ [4 n; Ochipset reset pci reset系统重启。  e0 o! s( A2 E
2.一旦重启后面的动作看上去正常开机没多少差别,对ec来讲无非是keyboard init、进出idle(update escd)6 Q- Q4 ?& I0 r0 x) g  e* e
等等一些琐碎的动作。
9 v8 C" x/ i) ]% C之前碰到问题比较多的地方就在idle这部分了。! \, I4 X2 g* T4 N
你所说的EC死掉指的是所有的function 都失效吗?keyboard能不能用,hot key能用吗,四秒关机呢...
+ }' ?/ p8 k: ]- t& ^还有如果单台fail几率比较高,建议你接串口debug去看EC死在哪里。2 e9 {- r4 o+ Z1 G$ \8 C1 F
以上希望对你有所帮助。
回复

使用道具 举报

发表于 2009-6-10 21:45:30 | 显示全部楼层

重启死机

谢谢您的答复!
6 N1 i# @5 N& N; L9 Y+ [    我在做重启的时候EC是死掉的,四秒不能关机。键盘和热键无效!至于死机的原因真的很难找的。因为串口debug调试的功能我还没有弄呢!  W0 o$ E6 |- z& k" q  [
     对了您说的BIOS发FE给我们EC应该是通过SCI吧!请指教一下!
回复

使用道具 举报

 楼主| 发表于 2009-6-11 08:15:47 | 显示全部楼层
to zhanghmjm:' ], C6 Y$ Y. }8 B& n
BIOS发FE不是通过SCI,而是透过60h,64h port。; x. D9 c! L& A9 W1 O
BIOS应该没有办法发SCI给EC,而EC是可以发SCI给BIOS的。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 加入计匠网

本版积分规则

Archiver|手机版|小黑屋|计匠网

GMT+8, 2025-12-1 07:49 , Processed in 0.088071 second(s), 18 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表