November 22, 2006
Another example that VORP sucks
PA | OBP | SLG | |
| DH | 669 | 0.380 | 0.603 |
| LF | 663 | 0.397 | 0.613 |
上面的數據是 2004 某隊兩個球員的打擊表現。
兩個人的 PA 幾乎相同。
第二個球員的上壘率跟長打率都較佳。
第二個球員是野手,不可取代性應該比第一個擔任指定打擊的選手來得高。
你會猜第二個選手的 VORP 較高嗎?
事實上:
PA | OBP | SLG | MLV | PMLV | VORP | |
| David Ortiz | 669 | 0.380 | 0.603 | 45.6 | 40.2 | 60.8 |
| Manny Ramirez | 663 | 0.397 | 0.613 | 52.3 | 39.5 | 57.7 |
VORP 或 PMLV 在計算時,都只跟 "相同守備位置" 來比。就這樣,有著 DH 的 replacement 比 LF 的 replacement 要差的奇怪現象。DH 的 replacement 難道不能拿 LF 的來用嗎?
VORP 紅歸紅,要拿來用,還請三思。
April 18, 2006
Some Comments on WPA
WPA(Win Probability Added)這個概念,是目前我看到,最接近衡量貢獻度的方法。它的概念是,每個球員上場時,依當時的狀況(比分差,出局數,壘上跑者)有個球隊獲勝的機率,等這球員做完一次攻擊(或投手投一個人次),依之後的狀況,也有個球隊獲勝的機率。兩個機率的差,就是球員對於增加球隊獲勝的貢獻。
就概念來說,我覺得非常好,但實用上卻有點麻煩。一個麻煩是,每個 play 所造成的機率改變,投手,打者,防守員,甚至跑者都會有影響,這機率差,如何正確地分出去,是一件難事。目前的算法,只分成攻守兩方各一份,攻方由打者(盜壘時跑者)得到,守方由投手(失誤應該要由失誤的人)承擔。這樣做,雖然不精確,但勉強可以接受。真正麻煩的是,最基本的各種情況下,勝率估計的問題。
目前勝率的算法,是根據以往的記錄,看某段期間內的數據,有多少次發生這種狀況,勝率就是這些狀況下,後來球隊真的贏球的機率是多少。簡單說,是一種 empirical 的估計。empirical 的估計要準確,一個要件是樣本數夠大。要夠大的樣本數,就必須用很多年的資料。但這裡有一個問題,這勝率可能隨年代改變,比如現代的比賽得分較多,逆轉自然較常發生。若把不同年代的數據一起作 empirical 估計,是否合理?也是必須進一步檢查的問題。
我較常去看的一個表是 Christopher Shea 的 Win Expectancy Finder。他原本的數值是由 1979-1990 中所有比賽估計出來的。最近又加了 2000-2004 的資料。之前就曾在想,因為根據的是 empirical 的結果,不知會不會有打者有好表現,反而降低球隊勝率的狀況。昨天看比賽時,偶爾會去按按當時的勝率,結果就發現了一個有趣的情況。五局下,兩出局後,Manny 原本在二壘,因為捕逸上到三壘。當時只是想,像這對於守方勝率的減少,應該要計在捕手身上,於是去查查機率的變化。結果歷史告訴我們,五局下,兩出局,一分領先,二壘有人,主隊的勝率,1979-1990 是 0.742,2000-2004 則是 0.737。二壘跑者上到三壘後,前者變成 0.719,後者變成 0.701。也就是根據歷史,不管是 1979-1990 或是 2000-2004,跑者從二壘到了三壘,反而讓球隊贏球的機會變小了。當然,這絕對不該是真的,只是因為剛好歷史發生的事,造成這樣的結果。類似的事,今天水手在三局上,一出局,平手的狀況,1979-1990 的勝率估計是 0.446,2000-2004 則是 0.437。一支一壘安打,打者上到一壘後,1979-1990 的值變成 0.473,2000-2004 的值則是 0.429。也就是根據 2000-2004 的資料,打了安打,球隊的勝率變低了。
要解決這個問題,一個方法是取更多年的樣本,但這仍牽涉到我之前所提到,如此相加是否合理的問題。另一個方法是,訂出一些限制後,再做估計。比如,令 P(a,b,c,d) 是 a 局下,勝分差 b,出局數 c,壘上情況 d 之下的勝率。那在 a, b, c 不變時,P 在 d 增加時,不能夠減少。在 a, b, d 不變時,P 在 c 增加時,不能夠增加。另外像一些比較不直觀的,b=c=d=0,P 隨著 a 增加而增加。總之,就是訂出一些合理的限制,也就等於是在訂一個模型,然後再來估計這 P 值。在有這些限制下,估計自然不再是那麼單純,卻是可行的。
April 5, 2006
Win Share
之前討論 MVP 時,有人提到 Win Share 及其它類似的數據。把為球隊增添多少場勝利當作價值的標準,比起創造多少得分,這是個更“現實”的看法。可惜,目前的相關數據,其實只是把創造多少得分轉換成勝場,再去視各隊球員 W.S. 和及實際勝場差,做一些調整。其實,若要“現實”來看,那不如直接把勝場分給該場有好表現的球員?在 Wakefield 首局就慘爆的比賽夜晚,我就來創造個易於計算的現實版 Win Share。
首先,一場比賽要去衡量打者或投手比較有功勞,不是件容易的事,為了方便起見,我就各分一個 W.S. 給打者和投手。打者方面,有貢獻的,最直接的就是得分和打點。於是,某個打者的得分加打點除上整隊的總得分加打點,就是他所分到的 W.S.。比如說,昨天紅襪得了七分,都是打點,而 David Ortiz 得了兩分,有三個打點,於是他分到 5/14。依此算法,紅襪打者昨天對勝場的貢獻如下:
W.S. | |
| David Ortiz | 0.357 |
| Jason Varitek | 0.143 |
| Coco Crisp | 0.143 |
| Mark Lorreta | 0.143 |
| Mike Lowell | 0.143 |
| Trot Nixon | 0.071 |
打者以增加得分為標準,投手自然是以減少得分為標準。以昨天的比賽來說,紅襪得了七分,如果投手群丟超過七分,那球隊就贏不了球。於是,以這七分為標準,看投手們幫忙少丟了幾分。以 Curt Schilling 為例,他昨天七局丟兩分。九局以七分為標準,每局是 7/9,因此 Schilling 在七局可以丟 7/9*7,但他只丟兩分,於是他少丟了 29/7。同理,Jonathan Papelbon 少丟了 7/9,而 Keith Foulke 多丟了 2/9。為了不讓有選手一場比賽分到超過 1 W.S.,所以也就不去計較那些負的貢獻。於是,分給 Curt Schilling 29/36,Jonathan Papelbon 7/9。順帶一提,算法以失分為準,而非責失,隊友失誤就算你倒霉。於是,昨天投手對勝場的表現為:
W.S. | |
| Curt Schilling | 0.806 |
| Jonathan Papelbon | 0.194 |
之後紅襪每次獲勝,我會更新這排行榜(今天也想再更新啊,眾球員可願賞臉?),看看根據這標準,誰是紅襪在 2006 球季的 MVP。有人要猜誰會得到最多的 W.S.?
March 31, 2006
Overuse of VORP
VORP 這玩意在目前的棒球統計可以說是個寵兒,在討論 MVP 時,VORP 會被提及,在球季前,各隊的 preview 上也常可以看得見 VORP。VORP 真的那麼好用嗎?
VORP (Value Over Replacement Player) ,它是為了衡量一個球員比一個替補球員 (replacement player) 能為一個普通隊 (球員成績為聯盟平均)多製造幾分。VORP 是用球員打擊上的一些表現去推估他為球隊多製造幾分,它用的是一些被認為跟球員本身能力有關的統計量(比如用長打率而非壘上有人時的長打率),但在討論 MVP 這種實際貢獻度上,自然不如實際的打點與得分。當棒球統計界在揶揄其它作家討論 MVP 時,只懂打點不懂 VORP,這真是一個極大的諷刺。這類的批評,在去年末討論 MVP 時已經很多,這兒就不再重複。
在討論 MVP 時不適合採用 VORP,那在球季開賽前,分析展望球隊這季的表現時,我們常可以看到作分析的作者把各球員的 VORP 放上去,最後把全隊的 VORP 加起來,以總共的 VORP 來看各隊的強弱。這是不是個好的作法,或者是不是必要的?
比起用在 MVP 的討論,用 VORP 在季前作分析預測,的確比較沒問題,因為打點這數據被認為是跟運氣有關,不是種能力,因此較沒有預測性。於是,用比較有預測性的數據來推估表現,可能是較保險的方法(當然,前提是 VORP 這樣的推估方法是好的)。但是,VORP 是假設其它隊友都是聯盟平均水準的情況下,計算出來的值。實際的狀況下,隊友當然並非都剛好是聯盟平均水準,分別計算 VORP,再加總,那還不如直接去計算團隊的整體各項打擊數據,然後用 RC 公式去計算整隊的總得分(前提是 RC 公式好,不過,VORP 的計算也是要用這公式,所以是站在同樣的基準上)。
有人或許會說,看個人 VORP 的好處是,可以看出這球隊的強弱在哪裡。就這觀點來說,的確是沒錯。但仍有一個問題,為什麼要在意 value over "replacement player"?而不是只看 value 就好?VORP 之所以要引入 replacement player 的觀念,主要是用來看單一球員所“增加”的價值,也就是單一球員比 replacement player 多出多少價值。這是個不錯的概念,但是,若在意的是某隊在各位置上的優劣,比較的對象應該是聯盟的平均,而不是替補球員。跟平均比,至少知道這位置是加分還是扣分,雖然因為不知標準差,仍然看不出差多少。
VORP 是要跟 replacement player 比,那結果能解釋的應該是某球員對該隊的重要性(若失去了,得用 replacement,會少得幾分)。但是在實用上,每隊在每個位置可替補的球員情況不一樣。若是像目前這樣,在各個位置上,使用相同的 replacement player 成績,某隊雖然在某個位置上的球員 VORP 很高,並不代表若這球員意外受傷的話,該隊將損失慘重。因此,我們無法從現行的 VORP 中,看出該球隊是否倚賴這個球員。事實上,直接並列每個球團下,每個球員的平均每場價值(不必是 over replacement)及考慮健康下平均能出賽的場數,那就可以從相關球員間的數據,知道球隊對於每個球員的依賴程度。
看來看去,還真不知道 VORP 在哪方面上有真正實用的價值。那 VORP 為什麼會這麼紅,這麼受到廣泛使用?在這個人云亦云,趕流行,追風潮的時代,這算奇怪嗎?多少人真的知道自己在用的東西究竟有什麼功用?突然想到這次回台灣找工作,一個長輩給的意見是,演講不是要讓聽眾聽懂,反而是要把聽眾弄糊塗,才會讓人覺得你的東西玄妙高深。雖然對他的話不以為然,但不可否認,在現今的社會,這種方法很容易吃香。
March 27, 2006
Is Weibull distribution a good fit for RS&RA?
在我前一篇中提到,A Derivation of the Pythagorean Won-Loss Formula in Baseball 中用到了 Weibull distribution,在檢定實際資料時,結果顯示可能並不是 fit 得那麼好。這裡,我想再仔細討論一下,到底 fit 得好不好?
首先,看看文章第八頁的那個表。對於 RS 跟 RA 是不是 Weibull distribution 作了 chi-square 的 test,degrees of freedom 是 20,critical value at 0.05 level 是 31.41,0.01 level 是 37.57。白話一點,就是我們有 5% 的機會看到檢定值大於 31.41,有 1% 的機會看到它大於 37.57。而在僅有十四隊中,我們就看到有一隊的值是 41.18,也就是我們看到了一百次平均都出現不到一次的東西。另外,我們也看到好幾個值接近 31.41。如果我們放寬一點,看 0.1 level of error,critical value 是 28.41,總共有三隊大於這個數字,還有另一隊是很接近的 28.18。也就是說,這種十次發生一次的事,這十四隊中卻發生了三次。
另外作者用到 Bonferroni adjustment,他下的結論有點誤導。之所以用到 Bonferroni adjustment,是因為作了不止一個實驗。若一樣用 0.05 level of error,則在作了十四個實驗後,原本看一次,發生的機率是 0.05,但看了十四次,發生的機率變成 1-(1-0.05)^14=0.51。於是看到發生了一次,並不足為奇。於是,一開始得看 0.05/14 level of error,則看了十四次,會看到的機會仍能控制在 1-(1-0.05/14)^14,差不多仍然是 0.05。因此,作者說 all but the Toronto Blue Jays' barely miss at the 95% confidence level,有點誤導。本來就是看最差的。在作十四次實驗,我們看到其中有一次超過 critical value 41.14 的機會是 5%。而今天我們的確看到有一組數據超過這個值,因此,用 Weibull distribution fit RS&RA 並不是那麼好,在 0.05 level of error 下,我們是可以 reject 的。
(同樣的問題,發生在檢定得分和失分是獨立這個假設的檢定下。)
再來,在第九頁的表格中,作者列出用這個分佈估計得失分的平均值,算是相當準。下表是我用同樣的資料,同樣係數的 Weibull distribution,看標準差的估計:
Obs RS Var | Pred RS Var | Obs RA Var | Pred RA Var | |
| Boston Red Sox | 10.64 | 9.49 | 10.70 | 5.96 |
| New York Yankees | 12.06 | 8.64 | 12.40 | 6.86 |
| Baltimore Orioles | 12.09 | 8.76 | 12.53 | 8.46 |
| Tampa Bay Devil Rays | 8.92 | 5.02 | 10.45 | 7.25 |
| Toronto Blue Jays | 9.99 | 4.26 | 11.21 | 5.76 |
| Minnesota Twins | 8.08 | 6.15 | 9.91 | 5.06 |
| Chicago White Sox | 13.85 | 8.50 | 10.15 | 7.77 |
| Cleveland Indians | 13.02 | 7.53 | 12.65 | 7.51 |
| Detroit Tigers | 11.27 | 7.30 | 13.04 | 7.64 |
| Kansas City Royals | 13.44 | 5.14 | 11.00 | 8.55 |
| Los Angeles Angels | 11.58 | 8.14 | 10.14 | 6.09 |
| Oakland Athletics | 10.74 | 6.45 | 9.06 | 5.56 |
| Texas Rangers | 11.44 | 7.06 | 9.23 | 5.92 |
| Seattle Mariners | 8.61 | 4.99 | 10.56 | 7.22 |
大家應該不難感覺到,估計地相當不準。不準到我根本不想去做任何檢定。從這表顯示,用 Weibull distribution 去 fit RS&RA,的確大有問題。fit 出來的 distributions,變異數比實際資料小太多了。
從該篇文章作者的推導,RS&RA 是 Weibull distribution,勝率會 follow Bill James' Pythagorean Formula。既然實際資料顯示,得失分並不像 Weibull distribution,勝率要剛好 follow 那公式的機會也就不大。事實上,一個平均得八分失六分的球隊,跟一個平均得四分失三分的球隊,我想多數人會認為前者勝率會較高,但那公式卻說是一樣的。
雖然在 goodness of fit 上有問題,也就是基本假設與實際數據不符,使得這文章所得到的結果,無法有說服力。但我仍然非常欣賞這篇文章,這是少數我看到真的是在作統計的棒球統計文章,也希望以後能有更多這樣的文章出現。
March 26, 2006
A Derivation of the Pythagorean Won-Loss Formula in Baseball
由於時差,一清早睡不著時,逛到 ptt 的 sabermeterics 板,看到這篇 A Derivation of the Pythagorean Won-Loss Formula in Baseball 的文章,讀了後,非常感動,這才叫做統計。
為了推導 Bill James 所用的 Pythagorean Formula,作者 Steven J. Miller 在得分或失分是 Weibull distribution 的假設下,可以推導出 Bill James 的 Pythagorean Formula。其中 Weibull distribution 的參數 r 正好是 Pythagorean Formula 的 power 項。他用 2004 各隊每場得分的資料,用 Weibull distribution 去 fit,得到幾個參數值應該為多少。其中 r 為 1.74。之前有人在 Pythagorean Formula 中試用不同的 power,發現跟勝率最接近的是 1.82。已經非常接近。
要作個像樣的統計,要有假設,有模型。在合理的假設下,推導出的模型,公式,才容易讓人接受。像是去試不同的 power,看怎麼樣可以使 Pythagorean Formula 預測地更準,都無法解釋 Pythagorean Formula 本身的任何意義。而這篇文章,在假設得失分是獨立的條件下,先去驗證這個事實。假設得失分分別都是 Weibull distribution,也都經過測定,看實際資料合不合。再從這些假設推出 Pythagorean Formula,這才能給這公式一個解釋。
我對 Weibull distribution 的背後意義不清楚。查書的結果,這分佈取自物理學家 W. Weibull,在 fatigue and breaking strength of matrerial 上有很多的應用。若作者能進一步說明,為什麼得失分適合用這樣的分佈?那我們可以對這整套理論有更好的了解。另外,我對於作者檢驗實際資料時,十四隊中,就有一隊的結果落在 95% 信賴區間外,這分佈是否 fit 得夠好,我仍存質疑,我會在去看看。剛好他用的是 2004 的資料,而我之前在作這篇時,已經整理了這些資料。
不過,質疑歸質疑,看到這樣一篇文章,十分感動了。若棒球統計能多一些這樣的文章,那可讀性就大增了。當然,基於要給一般大眾看,寫的時候或許要多些概念性的文字描述。但是,背後思考邏輯,應該是要有條有理,而不是馬虎行事。
March 14, 2006
Another example that current baseball statistics sucks
在 ptt 的紅襪板,看到有人提到用統計的方法,在討論如何排棒次。這方法起源於 Value of OBP and SLG by Lineup Position 對 OBP 和 SLG 跟得分關係的分析。它將 OBP 跟 SLG 拿去跟得分作線性迴歸,得到 OBP 跟 SLG 要怎麼加權後相加,會對得分有較好的預測。它又將第一到第九棒的 OBP 和 SLG 分開去跑線性迴歸,因此得到每一棒的 OBP 和 SLG 分別對總得分有如何的影響。相關的係數,可以在連結中看到,我就不去做一個表格。
接下來有不少人利用這個線性迴歸的結果,開始討論起怎樣排棒能得最多分。這是其中一篇,在那文章中,還可以看到它引更多之前的討論,甚至有人寫好程式,你若輸入九個人的資料,它可以告訴你,根據那迴歸結果,怎樣排棒次,可以讓總得分最多?
若你對棒球統計有興趣,或是你學過統計學最基本的線性迴歸,你對這些討論有何看法?贊成嗎?
今天我先不想討論原本那篇線性迴歸分析作得好不好的問題。假設用那十八個變數,去作線性迴歸是個很好的模型,fit 地相當好,當你將例年任一隊某年的各棒成績代入,得到的該隊總成績都蠻接近實際的得分。即使在這樣的假設下,我們是否可以用這模型去評估,如何排棒能得到最多的分數?
因為要用那模型去得到最多的分數,因此各棒的重要性決定在於 OBP 跟 SLG 前面的那個係數。從 OBP 上來看,第三棒的重要性排在九棒中的第五名,從 SLG 來看,更只有第六名。第三棒要排球隊中第五好的打者,你相信嗎?看來,美國職棒的教練都是一群白痴,居然大部份人把最好的打者放第三棒。
統計不是這樣解讀的。線性迴歸的係數只告訴我們,這個變數在你用的數據下,跟要看的結果,有多大的關係。今天你用了過去的數據作分析,而過去的數據,是在從以前到現在,教練們的排棒下,各棒次跟得分間的關係。當你用自己的喜好去排棒,你的樣本就變成跟原樣本大不相同,而你卻套用相同的公式,那就大大有問題。
今天你要說第九棒比第八棒重要,你必須做的事是,找出兩大類的資料,他們的前七棒成績相當,而一類是第九棒比第八棒好,另一類是第八棒比第九棒好。在這樣的情況下,若前者的得分的確在統計上明顯比後者高,你才能說第九棒比第八棒重要。若只是在所有資料上作迴歸,得到第九棒的係數較高,你得到的資訊只是:在以往教練的排棒下,我們要猜這隊得分多不多,看第九棒比看八棒有效。
對於這些迴歸出來的數字,我們可以這樣解釋(只是一種解釋,而不是任何的統計推論),球隊的強弱,不一定在於它的最好打者有多好,而可能是它有多少不錯的打者。因此,從第三棒打者,你看不出該隊得分能多高。反而第九棒都還能排出上壘率高的,比較有可能是個很會得分的球隊。
我說過很多次,統計不會騙人,騙人的是解讀統計的人,這又一個很好的例子。這是為什麼我應該要很高興統計能用在棒球上,但我總是無法高興起來。當現在的棒球統計,經常會出現類似這樣荒謬的推論,對於目前棒球統計分析的文章,還是暫時把它當作茶餘飯後的娛興節目就好。
December 16, 2005
On leadoff and batting order
前些時候,Johnny Damon 的經紀人 Scott Boras 送給洋基一篇 "New York Yankees Leadoff Analysis" 的三頁統計分析,企圖說明,Johnny Damon 來打第一棒,讓 Derek Jeter 打第二棒,可能讓 Jeter 表現回到 1998-2001 時期的表現,讓整個洋基打線更具威力。
當然,經紀人自然會想找對球員有利的數據來推銷,才能賣得好。如果洋基真的簽下 Johnny Damon,把 Johnny Damon 擺在第一棒,其他球員往後擺,是否會對整體打擊戰力最有利?而順帶被討論的另一個問題,Damon 跟 Jeter 誰是較好的第一棒打者?
後面這個問題簡單很多。雖然我向來對 Jeter 沒有好感,雖然 Jeter 的防守向來被 overrated,但若今天的問題是,在其他八人都定了的情況下,誰打第一棒較佳?我當然選 Jeter。首棒打者的任務最重要的就是上壘,再來才是在壘間推進的能力。除了 2004,Damon 打出近幾年來的高峰,而 Jeter 那年剛好是 OBP 的最低點,其它各年,Jeter 的上壘能力都比 Damon 好很多,生涯的成績差距有 0.033 之多。以 700 個打席數來看,若 OBP 差 0.02,則製造的出局數差了 14,等於 4 2/3 局,而這多出來的局數,一個隊大概可以多得個 3 分。即使 Damon 多盜個十次壘,也難以多製造這樣的分數。我向來不主張跟 Damon 續約,主要的就是,他雖然有不錯的上壘率,卻不是最頂尖的。加上他的年齡,以及逐漸退化的防守,30M/3Year 已經是很多了。聽說紅襪已經加碼到 40M/4Year,而據傳道奇開出 49M/5Year。若道奇真的簽下 Damon,連同今天剛簽下的 Bill Mueller,紅襪從道奇那兒得到的選秀補償分別是第二跟第四輪,真是太虧了。
回到另一個問題,洋基若簽下 Damon,是否該將他放在第一棒?首先討論一下 Scott Boras 的那個論點:Jeter 1998-2001 有比較好的成績,是因為他打第二棒,而第一棒有具速度的 Chuck Knoblauch。我常說,統計不會騙人,騙人的是解讀統計的人。這又一個很好的例子。Jeter 在那四年較佳的表現是因為打第二棒嗎?統計能看的是兩者的相關係,但卻通常無知道因果關係。Jeter 那四年打得較好,也可能只是因為那是他的高峰期。在之前一篇文章,曾列出 Jeter 的打點能力,在 1998-2001 正好是他的顛峰,之後逐年下降。而打點能力越強,對手就越可能投得閃躲,而使得 OBP 也跟著上升(如果選球不差,不會亂揮)。另外,一個打者後面保護的人,也會影響這打者的 OBP。Jeter 在那四年有較佳的打點能力,而他後面的是 Paul O'Neill,Bernie Williams 等人,比起之後的 Jason Giambi,Gary Sheffield,A-Rod,自然比較不讓人畏懼,而會對 Jeter 投得閃躲,讓他的 OBP 上升。
說到這個,剛好可以再解釋一下 OBP 被過份重視的情況。今年,在 Manny Ramirez 沒上場的那幾場,我們看到 David Ortiz 被狂保送。如果今年紅襪是一整季沒有 Manny,或是說 Manny 被交易走,而 Ortiz 明年維持跟今年一樣的表現。在沒有 Manny 保護下,如果 Ortiz 能維持他的選球,而不亂揮,則 Ortiz 的成績可能是全壘打少了十支,打點少了廿分,但長打率不變,上壘率增加,可能到 0.420,甚至 0.450 (七月底八月初那陣子,Manny 沒上場時,Ortiz 大概有一半是被保送的)。若照棒球統計界的算法,這樣的 Ortiz 將是個比現在他更好的球員。相同的,若 Manny 在 Barry Bonds 後面,Bonds 的保送數可能會減少一些,而打出多點全壘打,多些打點,然後變成一個較差的球員。This is just ridiculous!
再回到原來的問題,若洋基真的簽下了 Johnny Damon,是否該將他擺到第一棒,還是放在第二棒,或是後面的棒次?Johnny Damon 加入後,Damon 或是 Jeter 該打第一棒?先假設他們倆個放一二棒好了。若是照今年洋基的記錄,第一棒有 788 個打席數,第二棒有 761 個打席數,相差了 27,若以今年 Jeter 的上壘率多 0.023,不同人打第一棒,製造的總出局數差別是 0.621。以洋基今年每局得 0.6 分為標準,Jeter 或 Damon 打第一棒對整季整個隊總得分的影響平均值是 0.12 分。Tell me that you care this difference, would you? 上不上場,OBP matters,打第一棒或第二棒,it doesnt。在平均只有影響 0.12 分的情況下,盜壘,跑壘能力可能可以影響個一分以上,相較下就重要很多。Jeter 或 Damon 同隊時,誰擺第一棒,並沒有那麼大的差別。若真的要我排,我會排 Damon 為第一棒,關鍵在 Damon 較佳的跑壘,及 Jeter 較好的長打能力。在爭論誰是較好的第一棒時,要先弄清前題是什麼。若是兩人選一個在某個隊,Jeter 明顯地是較佳的第一棒人選。但若是兩人在同一隊,Damon 可能是較佳的第一棒人選。一樣是機會成本的問題,就第一棒來說,Jeter 比 Damon 要好,但拿 Jeter 排第一棒,就喪失他排在其它棒次的機會,而 Damon Jeter 的順序可能比 Jeter Damon 略好那麼一點點。
以 OBP 製造出局數的觀點來排棒,真的沒那麼重要。洋基今年第九棒的打席數是 648,跟第一棒差 140。即使是拿一個四成上壘率跟三成上壘率的打者在一,九棒上對調,總出局數的差別也才 14。而四成上壘率打第九棒,根本不大可能出現。若是拿三成的打第一棒,其它棒次順延,那總出局數的差別又會更小。但這並不代表高上壘率的球員不該排在前面,只不過主要原因不在於製造出局數。重要的原因在,前幾棒有高上壘率,中心棒次就有更多的機會把跑者送回本壘。若前面棒次的上壘率從三成變到四成,那壘上出現跑者的機會就約增加了 33%,也就是中心打者非全壘打的打點,可能可以增加個 33%。扣掉三成上壘率打者放在後面棒次所減少的 33%,差別是中心打者跟非中心打者打點差的 33%。這可是不小的數字,而不是三成上壘率打者打第一棒,多製造 14 出局數,14/3*0.6=2.8 分,可以相比的。這也說明了,低上壘率的打者安插在第二棒所造成的傷害,要比把他排在第一棒,其他人順延所造成的傷害要大。
November 24, 2005
再談 Runs Created(修正)
昨天,突然想到我在衡量貢獻度時,忽略了一件很重要的事,決定先作修正。
首先還是再一次說明一下,得分跟打點,不是因為我喜歡它們,所以用它們。而是因為得分就是要靠上壘跟之後推進,因此,一個球員的貢獻度約為
(上壘數 x 隊友推壘效率 + 隊友上壘數 x 打點率)/2
前者差不多是得分,後者差不多是打點。新問題是:得分,打點相同的球員,他們的貢獻度是否就是一樣?
上壘率所以在近年來備受重視,一個很重要的觀念是:一場比賽,至少要廿七個出局才會輸,如果能不出局,就能多得分。上壘率被重視,但目前使用的棒球統計中,卻沒有把不出局為球隊多得分的想法明確地在公式中顯示出來(或許有,是我自己不知道,至少略為被用到的棒球統計量中沒有)。這篇文章,我將試著把這觀念放進公式內。
減少出局數,可以延續進攻,所以,我們先要計算的是,一個球員讓球隊增加或減少了多少出局數。這個數目,當然和跟誰比有關,一個常用的對象是 replacement。這裡,我打算用隊上其他人的平均來比,原因是要把對球隊的貢獻分出去,所以跟隊友比,才能有些人要多分,有些人少分。舉 A-Rod 為例,他的打席數是 715,他製造了多少出局?我目前,把失誤上壘也算成出局,則:
出局數=打席數-安打-四壞-觸身+雙殺+盜壘失敗
根據這樣的計算,A-Rod 製造了 428 個出局。相同的算法,洋基所有其他人有 5691 打席數,製造了 3868 個出局。若是 A-Rod 製造出局的比例和他的隊友相同,那他 715 個打席數,應該要製造 486.0 個出局數。也就是說,A-Rod 讓洋基少了 58.0 個出局數。洋基的總得分是 886,若不是 A-Rod 幫忙省了 58.0 個出局數,洋基的總得分可能是 886*4296/(4296+58)=874.2。換句話說,A-Rod 的少出局,讓洋基多得了 11.2 分。不過,在他原本的得分跟打點,也得同時乘上 4296/(4296+58),因為已經包括在那 11.2 分內了。
相同的算法,用在 David Ortiz,Manny Ramirez,Mark Teixiera 身上,得到下表:
| Ortiz | Manny | Teixiera | A-Rod | |
| Team TPA | 6403 | 6403 | 6301 | 6406 |
| Team Out | 4271 | 4271 | 4368 | 4296 |
| TPA | 713 | 650 | 730 | 715 |
| Out | 443 | 418 | 471 | 428 |
| Out Save | 36.7 | 16.2 | 39.6 | 58.0 |
| Team Run | 910 | 910 | 865 | 886 |
| Run | 119 | 112 | 112 | 124 |
| RBI | 148 | 144 | 144 | 130 |
| Team RC | 7.7 | 3.7 | 7.8 | 11.8 |
| Adjusted Run | 118.0 | 111.5 | 111.0 | 122.3 |
| Adjusted RBI | 146.7 | 143.4 | 142.7 | 128.2 |
| Total Contribution | 140.1 | 131.2 | 134.6 | 137.1 |
A-Rod 在原本算法排名第四,加入出局數的考量,貢獻度增加很多,一舉跳上第二名。雖然沒趕過 Ortiz,但已經十分接近。Manny 出場較少,上壘率又不高,所以幫球隊減少的出局數就少,因此一下子掉到第四名。
之前本來想過幾天寫完這些後,再寫個準備被大家批評的,Barry Bonds 前幾年不該得 MVP。還好還沒寫,就自己發現把出局數這重要數據遺忘了。2004 Albert Pujols 以 133 得分 123 打點,勝過 Barry Bonds 的 129 得分 101 打點不少。但是,加入出局數的考量:
| 2004 | Bonds | Pujols |
| Team TPA | 6466 | 6297 |
| Team Out | 4354 | 4322 |
| TPA | 617 | 692 |
| Out | 247 | 431 |
| Out Save | 186.2 | 49.4 |
| Team Run | 850 | 855 |
| Run | 129 | 133 |
| RBI | 101 | 123 |
| Team RC | 34.9 | 9.7 |
| Adjusted Run | 123.7 | 131.5 |
| Adjusted RBI | 96.9 | 121.6 |
| Total Contribution | 145.1 | 136.2 |
Bonds 的確就像大家心目中的神一樣,讓球隊少了 186.2 個出局數。光光因為他的不常出局,球隊多得了 34.9 分。經過整個計算, Bonds 在整體貢獻,狂勝 Pujols,MVP 拿得一點兒都不假。
November 21, 2005
再談 Runs Created
Runs Created 這數據,顧名思義指的是創造出來的分數。它是目前棒球統計上很重要的關鍵數據,不管是用來衡量球員的貢獻,或是評估未來的表現,在像是 VORP,Win Share,WARP 等等,都是 RC 的衍生。球季中,我曾經稍微寫過一篇關於 Runs Created 的短文。趁季後,再來將這個數據做較多的討論。
首先,對於 RC 及其附產品目前的多功用,既衡量貢獻,又預估表現,我是深表不贊同。一樣叫“創造了多少分數”,但意思上可以很不一樣。它可以是指:
A:一個球員,在某個球季,為某個隊創造了多少分數。
B:一個球員,若維持某個球季的表現,他在某種設定下的球隊,他能創造出多少分數。
C:根據一個球員某季表現展現出的能力,估算他每季平均能創造出多少分數。
當考慮的是球員某季的貢獻度,MVP,Win Share 等,用到的 RC 該是 A。當考慮的是球員某季的表現,VORP 等,用到的 RC 該是 B。當考慮的是球員未來的表現,用到的 RC 該是 C。三個情況的 RC,大部份人的直覺應該是三個值大概不一樣,但目前棒球統計界卻是用同一個公式得到同一個 RC 值,再去各自發展。這不是很不合理的事嗎?我這篇的用意在,根據三個不同的狀況,尋找最適合的 RC 公式。
首先,從最簡單的 A 談起。看過我之前對 MVP 討論的人,一定不會懷疑我打算採用什麼來當 RC,簡單卻又有意義的 (R+RBI)/2。對於已經發生的球季,用這個方法可以簡單又相當準確地把隊上的總得分分給隊上的每個打擊者。當然,因為失誤,雙殺等關係,會讓 RBI 小於 R,使得 (R+RBI)/2 的總和小於 R。但這沒什麼要緊的,那個差距,有大部份是對手創造的。之後的 Win Share 相關產物,都應該在這樣的 RC 意思下去發展。至於在計算 Win Share 用到那個沒什麼道理的 Pythagorean Formula,就不在這裡討論。
接下來看 B 的情況。在在排除隊友表現的情況下,考慮某球員在某季的表現時,單單打點跟得分,就無法把這球員的價值給描述出來。假設我們要看的是,把這個球員放在一個其他八人為聯盟平均水準的隊。這個球員的平均得分應該是:
上壘數(H-HR+BB+HB) x S1 + HR
其中 S1 表示每次上壘被送回來得分的比例:
S1=(總得分 - 總全壘打數)/不包括全壘打的總上壘數
這個球員的平均打點應該是:
打席數 x S2 x 打點率 + HR
其中打點率指的是將壘上跑者送回來的比例,S2 則是聯盟平均每打席,壘上有多少跑者。由上面兩個公式算出來的平均打點和平均得分,加起來除以二,則是這球員放在一個其他八人剛好是聯盟平均水準時,他能做出的貢獻。我在 NL MVP 中,額外比較最佳球員,用的就是這樣的觀念,只不過,當時 S1,S2 用的是 Pujols 隊友的數字。
以上的算法,是就目前可以得到的統計數據來計算。若有人願意去整理上一壘,上二壘,上三壘,最後被送回來的比例,那我們可以稍加修改公式,而讓公式更合理。並且可以藉此把盜壘成功,盜壘失敗加進去。
最後,狀況 C 是最麻煩的事。首先面對的是,clutch 是不是種能力。若是種能力,則 C 跟 B 沒什麼兩樣,也就不必再討論。現在棒球統計界多數人認為這不是能力,或是這能力僅在少數人身上。鑑於這篇的篇幅已長,而最後這狀況卻是最麻煩的,我看,把這狀況分篇再寫。



![Syndicate RSS feed [Syndicate this site]](http://pics.yamedia.tw/images/rss2.gif)
![Syndicate ATOM feed [Syndicate this site]](http://pics.yamedia.tw/images/atom.gif)
