找回密码
 加入计匠网
搜索
热搜: BIOS ACPI CPU Windows
查看: 32842|回复: 30

[原创]AC In/Out OS Slow Response

[复制链接]
发表于 2009-5-19 08:11:52 | 显示全部楼层 |阅读模式
AC In/Out OS Slow Response

- }4 n1 h/ h& C# O- z' e  R+ x
  • Phenomenon3 b& P* s* X1 `+ Y  C) t! E) D
8 a, }! N# y2 z( A' Y
手上一个超薄NB的案子DQA报了这样一条bug:频繁的插拔ACvista右下角的power icon有时反应很慢,AC插拔过后有时需要等几秒或十几秒才发现power icon有变化。Power icon指的是下图红色圆圈标出的部分:
. ~9 J. A# \/ [( p( l
1
  • Why???2 f# j2 B$ S; _# ^, Z. m" l' X
* K) O! e" K8 u6 c
& {8 h8 Y/ A9 H
刚看到这条bug时,我有点不以为然,因为有些机种也有这样的状况,所以我以为这个有可能是不同的测试人员认知上差异。而且超薄NB为了解决好功耗、导热的问题都使用比较低的配置,我最初还觉得可能跟配置有关。但是他们找了个相同chipset的机器去试,反应很流畅没有这样的现象L!我的猜测站不住脚了,这时我觉得应该是FW有些地方没有处理好导致的了。随后我们开始debug,首先我们要理清AC in/out 过程中ECBIOSOS都做了哪些动作,我所知道的状况是这样:1. EC检测到AC in/out的中断,更新EC ram中的AC状态并引发SCI IRQ通知OS2.OS收到SCI IRQ后调用BIOS中的_Q method并通过Notify function通知OS power source change3.OS调用_PSR function获取AC的状态并据此更新power icon显示。上述過程sample code 如下述所示:
" D; L5 M/ N+ o  C" c
// AC Change event9 x, {0 u- f6 b: q5 ~" Q
9 F" `; q# F( I0 _* i  q
Method(_QXX)

% s3 u& e* k+ k$ i' V. B2 T% t; f
4 S, m" ]4 p  v{

- g" i9 H6 h3 k$ B& F
) _0 Z: L2 L& R% P5 m( p" qStore(0x09, DBG8)
, ~( [+ p# G% I

$ c; C$ w4 f# ?0 @Notify(\_SB. ADP,0x80)! H4 y( j% ?6 n& \
//Power Source status changed

6 l3 W7 G1 X4 F3 [2 T* \: j
* e4 ^  _" A6 \; U1 @Store(0x0A, DBG8)

( ~  p. d; k" e( t' p( S
! H8 {9 j; p4 _" W& S9 }( i7 W! ~( w8 ~+ S" L& [& _! Z: f9 z
}

! [; r& y7 N7 A$ q" P3 B
1 U; W3 U) f/ H! ^

3 J, q4 {& |( }$ Q* U1 v# v5 y
2 @" ~- ^4 G# m$ x1 S: F  i% }Method(_PSR,0)
' [' u9 `. X8 g7 z  T

& S/ w2 E: L6 e, e. ^4 U: [1 x" K' R" }! t/ i- h7 Z% U4 {
{$ T/ p' q- A2 H, @4 q+ a
- w6 |8 T. O* h, b& s, o5 ]- P

0 Y8 m9 Y- a, S7 a3 i: U6 LStore(0x0B, DBG8)5 Q' y& K2 ?7 i5 M7 G

; e* P5 e# M& w
  e' S) s* V/ l, Q3 EIf(ACST)
5 d* S3 ^' E1 [//check AC status

8 M& \; p" o) `- A3 j% S2 P) F" w
) u4 p3 U9 H8 |, d+ U) ?. Q2 b{

8 a2 g; t; T- v
- J9 O+ ~5 y/ S/ e' z3 B7 C2 h+ B6 n' a5 i& O' P1 Q
return(One)
2 g' j. C3 u& {, o" i- s5 Y5 p// AC Present
3 j- N# N, k$ Y" R# Y

! [# E# V' U: U4 [7 E* F; D; L9 ]9 _}

! ^3 ]/ R& x" l' x+ R' j( d
9 V; {3 j& \* r9 }# x9 Melse

& l8 `: a. Y2 {6 j0 g; W$ T) L  Y0 f4 f7 Z. \$ n7 v) t9 K# i; K; ?
{

! V, C- X% f$ s& [/ O3 Y) f( Y$ n% y3 E5 R% N" k
return(Zero)
% z8 V+ l+ V! m// AC Not Present

! o* H  B& K- q, q  O
# D0 y7 u  b5 r( n( B}
* w3 C: }7 m" [

+ B) @1 o& O1 o- G- D( g5 T2 _/ lStore(0x0C, DBG8)
" a  G" l7 C8 t) X, P3 N) i5 |! j
' B" r" G% U' Q
}
3 ?. h! `6 z5 ~: u
! @8 o$ Q7 C) U( e: x7 P% {( v

, E/ z, E- B4 N我能猜到的大概的流程应该就是这样了。那我们就从头开始追,先在AC change qevent中抛点,可是发现AC change对应的_Q method反应很快,一旦AC in/out debug card马上就会有显示。那么说明什么呢?跟EC没有关系吗?接着抛,又发现有时停在’0x0A’比较久才会出现,有时’0x0C’比较久。
: u3 u) y% u! ~! |状况不太一致;没感觉就把网撒大点,在几乎所有的ACPI method中都抛上点然后再try,试了几个回合以后有感觉了,我们发现一旦现象出现在Device Battery _BST method中停的久的几率非常高,也就是说AC in/out OS还会更新battery的信息。这段代码最明显的特征就是它会从EC ram中获取非常多的电池信息,sample code如下所示:
+ O7 D2 m7 I  L, v+ FMethod(_BST)8 M" r, t) s# F3 w& h: a
{, o8 V$ V, `+ B2 b) o3 ^

! Q: |. `4 E3 A' d9 o: RStore(BSTS,Local0)

! o8 _9 o5 _) P7 L- b# r6 z
  s0 [0 p8 S1 U- r: ?
1 i9 [6 P3 S1 uIf(LEqual(Local0,1)) //Check Battery Present Bit

, i9 i7 n$ Y. Z3 m% D, Y. m' P* O% O! R. ?( X5 Y
{
, x3 V& E  G6 r4 A, A
, S- p3 O$ |. w& C3 g. J4 |( o3 S6 Z4 i3 s4 k* P, g0 x+ x4 N

/ A! g1 _( |/ m5 p. k6 L: N2 {. D
: a2 f9 f, x) \# c7 s' l& @
7 v1 q, T: d+ K) k2 [//Read Battery information from EC
  n4 L: p# m1 A4 b" F1 V) R# j  S
! _3 s/ j5 D3 z/ y
… …
3 d/ Q5 B# G9 s( Q! n# F/ N
2 }, L+ ~* y& x  W
" l" U# m# W. z" S7 l1 O
}

. o0 q; ~0 N. z1 f% a2 h+ R$ L* T1 b$ ^- y  v
Store(0x0D, DBG8)

. ]$ [2 K( n; v5 l6 K* [. n1 q} ( v& c$ M- ]/ e% @+ i" Y
那么问题好像是由读EC ram导致的,ACPI中读取EC内容的方式是发0x80 cmdox66 port,随后EC产生一个SCI通知OS,接着OSEC ram index发给0x62 portEC将数据送给0x62 port再产生一个SCI通知0S,接着OS0x62 port就获得了EC ram指定位置的数据了。我在EC 端加入debug信息,发现出现状况时0x80 cmd EC很晚才收到,0x80 cmdOS发的,所以貌似和EC也没什么关系吗?继续思考,EC产生一个SCI的目的应该是产生一个IRQACPI driver获悉前面的指令已经完成,ACPI driver可以继续送指令下来了。如果某一条指令慢则有可能是前一个SCI IRQ通知 ACPI drive driver还没有处理好导致,也有可能ACPI driver已经处理好但是EC没有ready所致。
6 Z0 d- [0 Y+ \! _" j& k3 |/ e那么SCI中断机制是怎样的呢?EC SCICFG register通常将SCI IRQ配置成HLHpulse trigger,而且L的时间通常设置成64us,如下图2所示:

2 q) t) ]/ l' ~! m8 Q0 L  _- C; e
" d6 U! H5 X, T  [6 z

: k+ g( p) M* l; B  T' u& e
BIOSSB SCI pin通常配置成low edge trig SCIpulse trig有个优点就是它能够自动复位,产生一个中断后SCI pinpull high。可是因为BIOS是下降沿触发,所以EC SCI保持64us低电平会不会太长呢?会不会导致ACPI driver收到IRQ后下命令给EC,EC SCI pin还没有复位而太久才收到?又或者说EC SCI pin保持低会影响到ACPI driver IRQ latency?有了这个想法以后,我就开始放大它,修改EC SCICFGSCI IRQ配置成128 us pulse trig,然后再做AC in/out的实验,嘿嘿病情加重了,fail率接近了80%之前只有10%;那我再将pulse width调整为16us再试,结果200次竟然没有一次出现症状J.; |$ r( C0 L3 q9 ]; Q+ E9 s
" z8 Y1 h0 h' H; w: m
  • Solution
5 s: u" b: W8 n0 c9 H

5 l+ g  |* I1 z# \0 A经过上面的分析,大概的原因已经清楚了。所以解决问题的方法应该是调整SCI IRQ pulse width,将保持低电平的时间调短,这样就可以有效的避免这条bug。通过这条bug我发现在分析问题的过程中需要理清问题的各个环节,并且对各个环节所涉及到的细节也要深入分析。不能够看到现象就轻易的下结论,更不能想当然,正确的态度是不放过任何蛛丝马迹,大胆假设多方求证!$ |2 m: O# E& [

, m  C5 `( ~- Y  P: d8 b( k3 ?, c2 e; H3 r
/ _  F& N/ |7 C" P8 m  v
+ w  D/ F& A. N- P9 |" k
That’s all!% o# M& a: n' Y; B" h
/ m4 x8 w: h2 }% W& X7 c
Peter

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?加入计匠网

×
发表于 2009-5-19 18:31:57 | 显示全部楼层
原来如此!!!7 `* x5 @# Y6 @5 `( |, m

* ?: m2 z+ v# q6 Z4 I# F谢谢!
回复

使用道具 举报

发表于 2009-5-20 08:52:57 | 显示全部楼层
Bug起因为本
回复

使用道具 举报

发表于 2009-5-21 14:42:55 | 显示全部楼层
好帖,学习了 谢谢!!!!!
回复

使用道具 举报

发表于 2009-5-21 22:48:47 | 显示全部楼层

好贴

感谢分享!真的很有用,以前我也遇到这个问题,还以为是OS的问题呢!真的好贴啊!# O( F4 j  \- h
我看了您的分析代码,好像不是EC的代码吧!我现在就是OS-BIOS-EC三者的关系有点迷糊,版主能否指点一下!谢谢
回复

使用道具 举报

 楼主| 发表于 2009-5-22 07:53:35 | 显示全部楼层
hehe...0 q3 O1 O5 w, i" R+ b
很高心这篇文章能够对你有帮助。3 Z% V; \0 p! K& ?1 d" e$ ^& \: U, L- r
上述代码是BIOS中的ASL code,理清OS-BIOS-EC之间的关系的最好途径就是
# ?& o, T2 Z: zACPI spec,没事翻翻ACPI spec会有不少收获的。
回复

使用道具 举报

发表于 2009-5-23 09:04:24 | 显示全部楼层

谢谢

感谢指导!谢谢!有时间经常关注你帖子。
回复

使用道具 举报

发表于 2009-5-23 09:18:01 | 显示全部楼层

请教一下,关于oemmain.c中的几毫秒中断问题

您好!我现在手上有一个小本项目!用的是华邦的代码!我发现在oemmain.c中的几毫秒中断中是不是不能添加太多的代码啊!打个比方我就在一毫秒中断里加的代码,而这些代码是执行时间加入超过了一毫秒,是不是会造成EC死掉啊!因为在我修改后的代码发现有时很不稳定!我想了想是不是问题出现在这!请指教一下
回复

使用道具 举报

 楼主| 发表于 2009-5-23 10:43:26 | 显示全部楼层
中断的处理通常分顶半部和底半部,很多driver都是这样处理的.
! P* _  ^! g2 g  E) ~; G简单来讲就是在中断到来时置flag,后续再处理(DPC).
回复

使用道具 举报

发表于 2009-5-23 13:09:50 | 显示全部楼层

感谢回复

谢谢了!刚才我又仔细的查看了一下我的代码!终于找到了!EC死掉的原因了,就是我在上电时序那加了一个类似看门狗的小程序!来保证开机的效率。结果硬件始终有一个S电没有上来才导致我EC死在那里。
' p  ~6 k8 \# H, @8 t对于您的解释我还是有点迷糊!对winbond的EC他的oemmain.c中的1MS,10MS,100MS,500MS,1000MS。它用的是中断还是轮询!!中断和轮询是不是没有什么太大的区别啊!我现在就是担心我在比如1MS的函数里加的代码太多,会不会出现在这段代码执行一半的时候,1MS的中断又来了。那代码不就不能完全执行了吗?
回复

使用道具 举报

发表于 2009-5-23 13:59:00 | 显示全部楼层

回复 10# zhanghmjm 的帖子

oemmain.c的是service,是具体的执行处理过程,而实际的中断呢,是由Timer 来触发的(有定时1ms),只要不在中断的Routine 里加太多东西,在 service 里加,应该没事。个人看法,呵呵
回复

使用道具 举报

发表于 2009-5-24 10:02:18 | 显示全部楼层
谢谢了!明天有时间我做个小的实验!我想就应该清楚了,到时与您分享!呵呵
回复

使用道具 举报

发表于 2009-5-26 18:20:08 | 显示全部楼层
为啥你们的是C,我的是汇编啊,
回复

使用道具 举报

发表于 2009-5-27 13:48:06 | 显示全部楼层

回复 13# amty.wang 的帖子

用汇编写才牛呢,呵呵
回复

使用道具 举报

发表于 2009-6-5 10:35:35 | 显示全部楼层
文章很精采,分析很透彻!7 G% Q0 j: s+ m( t: c$ @
回复

使用道具 举报

 楼主| 发表于 2009-6-5 11:17:59 | 显示全部楼层
conol你也來這里了
% a$ \( M$ x8 Y9 s1 _' r呵呵...
回复

使用道具 举报

发表于 2009-6-9 22:12:26 | 显示全部楼层

请教一个关于重启的问题

您好!
; r0 b3 s+ q: T! A! l$ r: Y     不好意思又打扰你了,我现在遇到一个问题就是在重启电脑时EC为什么会几率性的死掉!在重启的时候我们EC都做什么啊!现在真的有点头痛了!!!
回复

使用道具 举报

 楼主| 发表于 2009-6-10 07:53:53 | 显示全部楼层
之前有追过reboot它的大致过程是这样的:
4 R) d  B7 z& E" u6 D" X; ]# z1.BIOS发FE给KBC,KBC pull low KBRST#一段时间,然后sb会将init# pin pull low 16个pci clock. r! S; G$ `) F8 W* H& s7 e
chipset reset pci reset系统重启。: g& X4 R0 s+ ^7 ^; [
2.一旦重启后面的动作看上去正常开机没多少差别,对ec来讲无非是keyboard init、进出idle(update escd)
0 H& f- G' q! z' [8 I* ~等等一些琐碎的动作。6 ^) `: f7 F3 G0 s5 {4 A
之前碰到问题比较多的地方就在idle这部分了。
9 S/ A8 k3 ^* n' y$ \) k你所说的EC死掉指的是所有的function 都失效吗?keyboard能不能用,hot key能用吗,四秒关机呢...- i* w* l- E4 G* {* T
还有如果单台fail几率比较高,建议你接串口debug去看EC死在哪里。4 ^0 A( g/ p$ [7 r+ x- l3 y! G% D- r
以上希望对你有所帮助。
回复

使用道具 举报

发表于 2009-6-10 21:45:30 | 显示全部楼层

重启死机

谢谢您的答复!  M* ?& ~0 g1 p7 h/ s
    我在做重启的时候EC是死掉的,四秒不能关机。键盘和热键无效!至于死机的原因真的很难找的。因为串口debug调试的功能我还没有弄呢!
+ V9 ^  V  `2 @  ~1 k     对了您说的BIOS发FE给我们EC应该是通过SCI吧!请指教一下!
回复

使用道具 举报

 楼主| 发表于 2009-6-11 08:15:47 | 显示全部楼层
to zhanghmjm:4 X) \: m% c# N( o
BIOS发FE不是通过SCI,而是透过60h,64h port。
% ~" U: G  B- W: V, OBIOS应该没有办法发SCI给EC,而EC是可以发SCI给BIOS的。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 加入计匠网

本版积分规则

Archiver|手机版|小黑屋|计匠网

GMT+8, 2025-5-22 15:10 , Processed in 0.052169 second(s), 18 queries .

Powered by Discuz! X3.5

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表