找回密码
 加入计匠网
搜索
热搜: BIOS ACPI CPU Windows
查看: 30728|回复: 30

[原创]AC In/Out OS Slow Response

[复制链接]
发表于 2009-5-19 08:11:52 | 显示全部楼层 |阅读模式
AC In/Out OS Slow Response

) L0 {8 Z. ?9 U
  • Phenomenon5 f$ z# m, P8 Y, x

$ v) |4 ?& M, Z1 S4 [- g手上一个超薄NB的案子DQA报了这样一条bug:频繁的插拔ACvista右下角的power icon有时反应很慢,AC插拔过后有时需要等几秒或十几秒才发现power icon有变化。Power icon指的是下图红色圆圈标出的部分:

. D: A& y* Y! m6 |  ~
1
  • Why???
    ( T" i$ R5 Q: ^' f: U2 ^
4 W8 L" Z; P. ^/ U$ k( {

# E: T9 ~. X% D' r
刚看到这条bug时,我有点不以为然,因为有些机种也有这样的状况,所以我以为这个有可能是不同的测试人员认知上差异。而且超薄NB为了解决好功耗、导热的问题都使用比较低的配置,我最初还觉得可能跟配置有关。但是他们找了个相同chipset的机器去试,反应很流畅没有这样的现象L!我的猜测站不住脚了,这时我觉得应该是FW有些地方没有处理好导致的了。随后我们开始debug,首先我们要理清AC in/out 过程中ECBIOSOS都做了哪些动作,我所知道的状况是这样:1. EC检测到AC in/out的中断,更新EC ram中的AC状态并引发SCI IRQ通知OS2.OS收到SCI IRQ后调用BIOS中的_Q method并通过Notify function通知OS power source change3.OS调用_PSR function获取AC的状态并据此更新power icon显示。上述過程sample code 如下述所示:

1 L, [* }% Q6 V6 q/ ^! l. y: P. Y// AC Change event
$ W6 `, \! F. l, r; ^, A) e! Z# o3 }0 R) e
Method(_QXX)
% q3 P2 S" X5 b3 m

1 [$ |; J, ^! _( R{
9 \, K- J) w" m* A7 O8 `$ i  J

9 q0 s/ Y$ a6 w) y" s5 yStore(0x09, DBG8)
. }! A# C7 [, m+ u1 c
- {' n" ]. n& j: N5 n
Notify(\_SB. ADP,0x80)
9 f3 y) j% d: P: m//Power Source status changed
) \8 T5 f) P. d+ d. H9 r
+ m% D: B+ A$ C$ i0 T
Store(0x0A, DBG8)
; @9 l$ _' X. P5 Q4 n  l2 I
( n( _8 p& @5 g- W) G# i, c9 R
. w/ o# o. Y6 k9 q) Z# J1 g% r* D
}

+ H5 B7 ^! m( D4 ~- x
; E% V4 g6 l0 {9 t

% x6 v; H, V# H! j+ U
' u$ h# @3 J8 m: G7 K4 wMethod(_PSR,0)
" p2 C2 V$ b+ `! E1 v6 P
( J6 |, ~* ~# Q
- ^; c2 F: w1 I5 j9 {
{. B' W' M) t* v$ H
& F* _- k# W8 G  ?: H9 j! X

! T1 @9 O0 U" K' x& NStore(0x0B, DBG8)
( K1 j3 q1 a$ a/ H" R8 x4 I1 V) H. g0 v
$ R1 X! j4 Y4 j3 i
; `! j" R. q1 j5 G% M3 }5 X
If(ACST)
' y! t& ^7 ^2 X* g4 C4 `//check AC status
, S" L$ ]' _8 v
& k  \* Q/ ?/ H
{
% Y% ?6 B+ D8 y. u& t

6 s5 ~! L2 K( O' V
) q1 r5 ?0 B1 |return(One)& c: {2 o: S8 m, S" }5 G  Q; A
// AC Present

9 e8 t/ q# T2 }4 u/ {) @2 L% y2 h6 K. h
}

4 a& C" [- C2 ]
: S! M$ v* |1 ?' P! ]7 Z' gelse

* c" X, u; ~7 ~( w6 c; ]3 t( o7 d" m% C
{
  C! d+ Y4 U# M3 l! k

9 x& A% E7 R) e% ^& K, b! Dreturn(Zero)
) q8 j; K9 h( w% ]0 o& d$ u# h( X// AC Not Present
+ M4 K6 l  D: d3 e  ?" S

* M9 e6 {  f6 |}

# g" ]8 ~$ [1 l/ v) G# Y4 O, s! E% |- c
Store(0x0C, DBG8)
! J6 S- P! G, p1 u- s$ P0 r

- q/ P$ q6 z6 A& {3 h6 ~  c3 S}# l! d! P+ M. T2 |9 h

/ E* T4 k& \: s0 B$ j6 h

% k; W6 k$ ^1 |2 O) j: d我能猜到的大概的流程应该就是这样了。那我们就从头开始追,先在AC change qevent中抛点,可是发现AC change对应的_Q method反应很快,一旦AC in/out debug card马上就会有显示。那么说明什么呢?跟EC没有关系吗?接着抛,又发现有时停在’0x0A’比较久才会出现,有时’0x0C’比较久。
& V, e" E: ?0 a- d状况不太一致;没感觉就把网撒大点,在几乎所有的ACPI method中都抛上点然后再try,试了几个回合以后有感觉了,我们发现一旦现象出现在Device Battery _BST method中停的久的几率非常高,也就是说AC in/out OS还会更新battery的信息。这段代码最明显的特征就是它会从EC ram中获取非常多的电池信息,sample code如下所示:
* y  a, h7 u% vMethod(_BST). k7 _9 o) e9 g, P) w  c% ]& l& s$ D
{
) G, r# x/ L# \, c) ]/ g
9 W% ]9 b0 W% G8 I, X4 R, PStore(BSTS,Local0)
# h( g: }+ N' e4 _' p

* L& r6 V' }& t' W9 l. T- @2 \% ^3 [) t8 Y, {: D# U
If(LEqual(Local0,1)) //Check Battery Present Bit
: p/ B, y/ u7 O6 a; |2 z* {% J

: a- @3 U! J3 U  Y' h# p) S{2 [7 e# A7 k2 |% r+ f

. @5 x( n# G' L$ G$ K
& a; H. C* _) y+ W+ D4 L5 r/ B0 ?9 D/ D( d# X5 K  |7 E) g: K3 w
) ~! P$ ?1 s/ h" S- ^

% C! x1 Q0 z0 B8 q//Read Battery information from EC
7 U6 z% X- L" {% y/ p
: ]! X3 B7 ^; b! v0 h2 Z
… …

) K  c0 k3 U8 \: j  k0 x1 q  @4 v
( f2 N: d& N  \9 F- S/ n
* k9 \8 s4 A8 F) T}

0 y$ @$ w  m: F2 r7 o: [
; ]7 v9 l* h6 \& L( L$ q8 FStore(0x0D, DBG8)

; p0 x6 f) i, g( |; S}
" s5 e$ m/ Y8 Z! \那么问题好像是由读EC ram导致的,ACPI中读取EC内容的方式是发0x80 cmdox66 port,随后EC产生一个SCI通知OS,接着OSEC ram index发给0x62 portEC将数据送给0x62 port再产生一个SCI通知0S,接着OS0x62 port就获得了EC ram指定位置的数据了。我在EC 端加入debug信息,发现出现状况时0x80 cmd EC很晚才收到,0x80 cmdOS发的,所以貌似和EC也没什么关系吗?继续思考,EC产生一个SCI的目的应该是产生一个IRQACPI driver获悉前面的指令已经完成,ACPI driver可以继续送指令下来了。如果某一条指令慢则有可能是前一个SCI IRQ通知 ACPI drive driver还没有处理好导致,也有可能ACPI driver已经处理好但是EC没有ready所致。
  h( a: W/ c: g% q那么SCI中断机制是怎样的呢?EC SCICFG register通常将SCI IRQ配置成HLHpulse trigger,而且L的时间通常设置成64us,如下图2所示:
8 O- H/ ^/ |4 f

7 z& B( P% ?7 c. f# k. z- J- i

/ U, d! l, P+ H2 F8 M# B
BIOSSB SCI pin通常配置成low edge trig SCIpulse trig有个优点就是它能够自动复位,产生一个中断后SCI pinpull high。可是因为BIOS是下降沿触发,所以EC SCI保持64us低电平会不会太长呢?会不会导致ACPI driver收到IRQ后下命令给EC,EC SCI pin还没有复位而太久才收到?又或者说EC SCI pin保持低会影响到ACPI driver IRQ latency?有了这个想法以后,我就开始放大它,修改EC SCICFGSCI IRQ配置成128 us pulse trig,然后再做AC in/out的实验,嘿嘿病情加重了,fail率接近了80%之前只有10%;那我再将pulse width调整为16us再试,结果200次竟然没有一次出现症状J.5 q/ T% t' w9 o0 p6 q. ?) T3 q; R

3 _. z) j- b3 ~' C
  • Solution

* \2 j1 K; c. D* s+ X. l6 n+ X7 e* Z. C/ h! i: v! x: F" n1 i2 P: h
经过上面的分析,大概的原因已经清楚了。所以解决问题的方法应该是调整SCI IRQ pulse width,将保持低电平的时间调短,这样就可以有效的避免这条bug。通过这条bug我发现在分析问题的过程中需要理清问题的各个环节,并且对各个环节所涉及到的细节也要深入分析。不能够看到现象就轻易的下结论,更不能想当然,正确的态度是不放过任何蛛丝马迹,大胆假设多方求证!5 a5 [  n! ^$ X; Y( v
3 a- `: g3 D: s& Y; M/ Y5 L$ Z

. m( u. A" F) e. o9 f  L6 U: i
7 g' _! D! B! f2 W' a4 \( ^
5 z7 R% C/ g! E: [% Q6 f1 d
That’s all!3 o& {* I2 G! \! ?1 h) X3 W
  B; e2 }$ F3 K7 X
Peter

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?加入计匠网

×
发表于 2009-5-19 18:31:57 | 显示全部楼层
原来如此!!!4 r( _; V$ g0 V
' m: a2 V+ Z' |- v; Y* e6 _
谢谢!
回复

使用道具 举报

发表于 2009-5-20 08:52:57 | 显示全部楼层
Bug起因为本
回复

使用道具 举报

发表于 2009-5-21 14:42:55 | 显示全部楼层
好帖,学习了 谢谢!!!!!
回复

使用道具 举报

发表于 2009-5-21 22:48:47 | 显示全部楼层

好贴

感谢分享!真的很有用,以前我也遇到这个问题,还以为是OS的问题呢!真的好贴啊!* q  p" j# D3 B. k) X! g
我看了您的分析代码,好像不是EC的代码吧!我现在就是OS-BIOS-EC三者的关系有点迷糊,版主能否指点一下!谢谢
回复

使用道具 举报

 楼主| 发表于 2009-5-22 07:53:35 | 显示全部楼层
hehe...
& W9 a" v- x5 g很高心这篇文章能够对你有帮助。, A1 [% e' X- a
上述代码是BIOS中的ASL code,理清OS-BIOS-EC之间的关系的最好途径就是
- W4 \& C! J- WACPI spec,没事翻翻ACPI spec会有不少收获的。
回复

使用道具 举报

发表于 2009-5-23 09:04:24 | 显示全部楼层

谢谢

感谢指导!谢谢!有时间经常关注你帖子。
回复

使用道具 举报

发表于 2009-5-23 09:18:01 | 显示全部楼层

请教一下,关于oemmain.c中的几毫秒中断问题

您好!我现在手上有一个小本项目!用的是华邦的代码!我发现在oemmain.c中的几毫秒中断中是不是不能添加太多的代码啊!打个比方我就在一毫秒中断里加的代码,而这些代码是执行时间加入超过了一毫秒,是不是会造成EC死掉啊!因为在我修改后的代码发现有时很不稳定!我想了想是不是问题出现在这!请指教一下
回复

使用道具 举报

 楼主| 发表于 2009-5-23 10:43:26 | 显示全部楼层
中断的处理通常分顶半部和底半部,很多driver都是这样处理的.  |' E+ S- P" i) X& ]
简单来讲就是在中断到来时置flag,后续再处理(DPC).
回复

使用道具 举报

发表于 2009-5-23 13:09:50 | 显示全部楼层

感谢回复

谢谢了!刚才我又仔细的查看了一下我的代码!终于找到了!EC死掉的原因了,就是我在上电时序那加了一个类似看门狗的小程序!来保证开机的效率。结果硬件始终有一个S电没有上来才导致我EC死在那里。; J) _4 m$ c* u- o9 W( a/ f
对于您的解释我还是有点迷糊!对winbond的EC他的oemmain.c中的1MS,10MS,100MS,500MS,1000MS。它用的是中断还是轮询!!中断和轮询是不是没有什么太大的区别啊!我现在就是担心我在比如1MS的函数里加的代码太多,会不会出现在这段代码执行一半的时候,1MS的中断又来了。那代码不就不能完全执行了吗?
回复

使用道具 举报

发表于 2009-5-23 13:59:00 | 显示全部楼层

回复 10# zhanghmjm 的帖子

oemmain.c的是service,是具体的执行处理过程,而实际的中断呢,是由Timer 来触发的(有定时1ms),只要不在中断的Routine 里加太多东西,在 service 里加,应该没事。个人看法,呵呵
回复

使用道具 举报

发表于 2009-5-24 10:02:18 | 显示全部楼层
谢谢了!明天有时间我做个小的实验!我想就应该清楚了,到时与您分享!呵呵
回复

使用道具 举报

发表于 2009-5-26 18:20:08 | 显示全部楼层
为啥你们的是C,我的是汇编啊,
回复

使用道具 举报

发表于 2009-5-27 13:48:06 | 显示全部楼层

回复 13# amty.wang 的帖子

用汇编写才牛呢,呵呵
回复

使用道具 举报

发表于 2009-6-5 10:35:35 | 显示全部楼层
文章很精采,分析很透彻!
9 Q$ K1 M/ @9 B1 u1 d9 y! _
回复

使用道具 举报

 楼主| 发表于 2009-6-5 11:17:59 | 显示全部楼层
conol你也來這里了/ m4 p. x' S! {
呵呵...
回复

使用道具 举报

发表于 2009-6-9 22:12:26 | 显示全部楼层

请教一个关于重启的问题

您好!& X. c3 z& R9 u& D- C) ]: t" }
     不好意思又打扰你了,我现在遇到一个问题就是在重启电脑时EC为什么会几率性的死掉!在重启的时候我们EC都做什么啊!现在真的有点头痛了!!!
回复

使用道具 举报

 楼主| 发表于 2009-6-10 07:53:53 | 显示全部楼层
之前有追过reboot它的大致过程是这样的:
& z: ^1 Y. Y( ~2 i1.BIOS发FE给KBC,KBC pull low KBRST#一段时间,然后sb会将init# pin pull low 16个pci clock3 {; ]+ @8 b1 }2 x; C) H$ i
chipset reset pci reset系统重启。% O) T) N$ ?1 V% s6 c+ U
2.一旦重启后面的动作看上去正常开机没多少差别,对ec来讲无非是keyboard init、进出idle(update escd)
7 i( Z; U5 H# q5 J$ N等等一些琐碎的动作。
3 B" Z: P) J; s4 s; e3 T之前碰到问题比较多的地方就在idle这部分了。
, p; q5 J( p7 B5 G8 y0 [% J你所说的EC死掉指的是所有的function 都失效吗?keyboard能不能用,hot key能用吗,四秒关机呢...8 U! B7 r( @7 z( D# g; M) U# x
还有如果单台fail几率比较高,建议你接串口debug去看EC死在哪里。
$ }$ A( ]' T4 a以上希望对你有所帮助。
回复

使用道具 举报

发表于 2009-6-10 21:45:30 | 显示全部楼层

重启死机

谢谢您的答复!
2 k) A+ K4 R8 [    我在做重启的时候EC是死掉的,四秒不能关机。键盘和热键无效!至于死机的原因真的很难找的。因为串口debug调试的功能我还没有弄呢!
+ f3 x7 X6 [, c% z     对了您说的BIOS发FE给我们EC应该是通过SCI吧!请指教一下!
回复

使用道具 举报

 楼主| 发表于 2009-6-11 08:15:47 | 显示全部楼层
to zhanghmjm:7 o. {' j. f% z* b0 ^
BIOS发FE不是通过SCI,而是透过60h,64h port。
; u1 q) W4 l  s! L' G. ?BIOS应该没有办法发SCI给EC,而EC是可以发SCI给BIOS的。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 加入计匠网

本版积分规则

Archiver|手机版|小黑屋|计匠网

GMT+8, 2024-5-20 08:07 , Processed in 0.043201 second(s), 18 queries .

Powered by Discuz! X3.5

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表