July 13, 2007
鼓勵此網誌:0

本文是對投手 WHIP 值的簡單介紹和一些想法,原沒有要來消費王建民的念頭。只是,王建民是大家最熟悉的投手,他的特質又很切合文中要談的內容,所以就把他扯進來了。另一方面,WHIP 值在台灣的被重視和被小小的忽略,也和王建民有關係,所以乾脆從王建民談起。
興衰皆因王建民
在建民元年(2005)之前,WHIP 值不算是一般球迷會看的數據,也不在國內棒球場的傳統之中。直到該年大家首度盯著螢幕欣賞王建民,不少人開始注意到轉播單位經常提供的這個數據:WHIP。也終於知道,什麼是 WHIP。
有趣的是,王建民在第一年始終擁有不錯的 WHIP 值(最低到 1.09,直到受傷前有很長時間在 1.20 左右),這個數值自然被大加吹捧,成了王建民控制比賽能力的最佳印證,並且因此而深入到球迷基層。
但到了 2006 年球季,王建民的 WHIP 值始終徘徊在 1.30 左右,只能算是中上( 整季下來在美聯投球局數前 50名的投手中,排名 20 )。這對大家正嗨的亞洲第一強投形象來說,未免有點掃興。相對的,王建民的滾飛比、雙殺數則是拔尖的水準,非一即二,媒體與論者因而見風轉舵,改來倡言這幾個數字的好處。於是乎這些數字就成了新顯學,而 WHIP 值便與三振數、防禦率被悄悄的擱到一旁去了。
我們可以回想,近一年多年來大聯盟滾地球排行出現在媒體的機率,比起大聯盟投手三振榜、防禦率榜都高得多,這恐怕要讓老球迷苦笑了,尤其與國外或中職相比的話。而媒體總是拿個放大鏡,長期聚焦在王建民身上,這視野不免扭曲了。我得說在真實的棒球世界裡,這些數據的比重不是這樣子的。
WHIP值的意義
所謂的 WHIP,就是英文 Walks and Hits per Inning Pitched 的縮寫,顧名思義,指的是投手平均每一局被安打加上投出保送的次數。現在我們比較常用的中文稱呼,是「投手被上壘率」。
寫成公式是這樣子的:WHIP = ( 安打 + 四壞球保送 ) ÷ 投球局數
WHIP 可看作投手被打者攻上壘包的每局平均人數,換個角度想,則可以視為投手阻止對手上壘的能力,數值愈低,代表這樣的能力愈好。
更進一步來看,當 WHIP 值愈高,代表打者愈容易打中投手的投球而上壘,或是投手比較會保送打者上壘,同時 WHIP 值愈高,也意味著愈容易累積跑者在壘上,形成大局,對投手造成重大傷害。所以 WHIP 值也可以看成投手壓不壓得住對手,守不守得住比賽。
舉個06年的數字來看。去年賽揚投手山塔那( Johan Santana )的 WHIP 值恰為 1.00,換句話說,山塔那平均每局會讓 1 個人上壘,投 3 局,可能會有3個人上壘。就算集中在其中一局好了,也可能剛好只站滿壘包不失分。而王建民去年 WHIP 值是 1.31,一樣是3 局,可能會有將近 4 個人上壘,萬一集中在同 1 局,很容易就擠人回來,不失分的機率顯見是低了很多…。這就是 WHIP 值 1.00 與 1.31 的差別。
看到這裡,可能有朋友眼睛一亮,有話要說了。別急,王建民和山塔那的差別是不是真的像 WHIP 值表現的這麼大?我們後面再來討論。
與傳統投手評量數據的比較
傳統也最基本的先發投手成績評量數據,是勝場數和防禦率( ERA ),但就如我先前提過,「勝場數是個人實力、所處球隊、對戰敵手,加上一整季的運氣交互作用下的產物」,投手的表現僅佔其中一部份而已。
而防禦率(ERA,earned run average)則是投手每9局的失分率,公式:
ERA = 自責分 ÷ 所投局數 × 9
看到這個數字,我們很容易用來想像投手如果投 9 局大概會丟多少分,這是它的優點。例如王建民現在的防禦率是 3.36,而大聯盟的比賽每場攻下5、6分是稀鬆平常,所以王建民今年在勝場數上依然頗有斬獲,大概是可想而知。
但它也有三個常見的不足之處:只看得到結果、結果有時不由自己做主、結果還會被打折。說明如下:
「只看得到結果」:這「結果」指的是失分。舉個例子:假如有個投手叫「王建民」,一局三上三下,防禦率是零。有個投手叫「帕瓦諾」,第一棒安打上壘,盜壘被狙殺,接著二支安打加一個保送滿壘,然後強襲游擊美技雙殺結束本局,一樣不失分,防禦率也是零。兩個防禦率都是零,這是結果。但兩個投手的表現,可是天壤之別。
「結果有時不由自己做主」:最簡單的例子是留了人在壘包,被換下場時。當後面的投手強悍,可能留個滿壘的爛攤子都不會增加防禦率。當後面的牛是田單派來的,可能不過是一個保送就要加1分進到防禦率裡。難道一個弄到滿壘的投手會比一個只投了個保送的表現好嗎?
「結果還會被打折」:防禦率只計算責失,因失誤產生的非自責失分就不列入計算了,故有些表現會被打了折扣。再來個例子,一樣是兩出局後,打者打了個很難守備,可判失誤可判安打的球,接著投手狂丟五分。那一球若判失誤,投手是1分責失都沒有,防禦率不動。那一球若判安打,投手防禦率可能就爆炸了…。
以上都是極端的例子。當局數多到一、二百局,除非運氣太差,否則防禦率還是可以大概的和投手的表現相對應。但每年都有人運氣太差,所以勝投和防禦率實在不是理想的投手表現評量指標,尤其要仔細比較一些實力相近的投手時。相形之下,WHIP值要好一點。
光看 WHIP 值會低估的部份
但是,WHIP 值畢竟只是投手眾多表現數據其中的三項去相加相除,縱使簡單有效且聰明,但仍有照料不到的部份,比方說,長打。
我們可以從公式來看。保送和安打被視作相等,這個已經有待商榷(我們不妨想像單局三保送和單局三安打的差別)。而一壘安打和全壘打被當成一樣,更讓我們心中感到不安。
很明顯的,WHIP 看不到長打的影響。被長打率低的投手,使用 WHIP 來評量,有被低估的可能。(這不就是王建民嗎?)
另一個問題是,WHIP 是以「局」來衡量。一局至少會有三個打者,他們的打擊,是可能會互相影響的,甚至會有負面的影響,故這「投手的被上壘率」,比打者的上壘率要複雜許多。最簡單的一種影響,就是雙殺。當投手創造雙殺的能力高強時,對手上壘的影響相形之下會較輕微,也就是光看 WHIP 值可能會低估這樣的投手。(這不又是王建民嗎?)
長打是 WHIP 值未被列入的加項,雙殺則是 WHIP 值未被列入的減項。王建民的兩大優點,在 WHIP 值裡是比較看不見的。用 WHIP 值來觀察王建民,本來就容易低估了他,所以我們也別太計較王建民的 WHIP 值似乎不太出色了。
一些有趣數字的進一步探討
真要這樣來討論 WHIP 值,我們可以把所有投球數據都丟進來看看,但一來有些狀況出現的機率並不高,二來這樣數據涵義就會過於龐雜,變成像綜合性指標的東西,並且失去 WHIP 可以由直觀產生其意義的魅力了。所以像這種計算,我們就留由棒球統計學家們去做吧。
以下只討論幾個比較有趣的數據。
WHIP 值是「上壘就不管了」,然而除了雙殺,投手被盜壘的次數考慮進來也會很有趣。盜壘通常捕手要多擔待些責任,不過有些投手實在離譜,比如這兩年教士隊的投手克里斯楊( Chris Young ),他06年的紀錄是被盜41個壘包僅4個沒有成功,07年到今天為止則是26次盜壘對手全部達陣。雖然他目前 WHIP 值是 1.06,你不覺得就個案而言,這個 WHIP 對他表現的描述要打個折嗎?
此外像老蝴蝶魏克菲爾( Tim Wakefield ),因為球路的關係也很容易被盜壘。但如前文提到的,每個案例能歸諸到投手責任的比例都不一樣,所以這個數據並不適合全面地加進來。在此討論是純屬趣味。
另一個有趣的相關數字是投球局數。WHIP 值是以局為單位,但能提供多少這樣的局數,也可以思考。一樣擁有優秀 WHIP 值的人,每場能投7局的人自然比每場能投6局的好些,這雖然無關投手的壓制力,但要用 WHIP 值衡量先發投手的表現時,不妨考慮一下這一點。
最後,三振常是一個比較優異的出局型態,但它的價值在 WHIP 中也看不出來。不但看不出來,連想量化進去都很難…。所以,在衡量投手的壓制力,尤其是後援投手時,最好同時多看看三振能力。
「王HIP」?
這一段將把長打和雙殺這兩個數字加進 WHIP 的概念中,來試著補上王建民被低估的部份,並比較一下06年他與其他投手的表現差別。
為了考慮進長打的部份,我們可以把 WHIP公 式中的「安打」換成「壘打數」(附:壘打數公式 = 一壘安打 × 1 + 二壘安打 × 2 + 三壘安打 × 3 + 全壘打 × 4),做為一個新的數值,我們且戲稱為「王HIP」。王HIP = ( 壘打數 + 四壞球保送 ) ÷ 投球局數。答案是:
王建民的「王HIP」= 1.68 ( 2006球季 )
我們再試算出2006年美聯投球局數前50名投手的「王HIP」。第一名仍然是最後拿到賽揚的雙城山塔那的1.53,而王建民,排名第六。比起王排名美聯20名的 WHIP 值,是不是好看許多?
接著我們再把雙殺加進「王HIP」中。由於雙殺會吃掉一個原已上壘的打者,暫定新的公式為:
( 壘打數 + 四壞球保送 – 雙殺次數 ) ÷ 投球局數
我們且再戲稱以上數值為「王HIP2」。王建民的「王HIP2」=1.53,在美聯僅次於1.46的藍鳥哈勒岱( Roy Halladay )、1.49的雙城山塔那、和也是1.53的穆西納( Mike Mussina ),可以排到第四名。
跳脫出 WHIP 值對王建民的低估,他在06年的表現確實有頂尖投手的水準(我在去年八月講王未必是美聯前十名的好投手…現在我覺得他當時在十名之內的可能又高了點),再考慮到他的勝場數和投球局數,在賽揚票選拿到第二名是實至名歸。只是也絕對幹不掉山大王就是了。
附圖:三種算法美聯的排行。

只管進不管出的WHIP
不過,這樣的算法計入了王建民的優點,卻未反映三振的價值,不免有點高估了王建民。只是,高估了多少,也無法斷語。
若要再往下思索,個人目前的想法是,WHIP 只看到上壘,看不到出局方式,我們可以試著把這個部份加進去。或許可以把三振當成是一種「完全出局」,不計算,而滾地球出局或飛球出局則給它們一個權數,丟進數值裡。只是,此時這個數值就變成了類似投手「被推進值」的東西了。
結論
本文並非要提出一個新的 WHIP 計算法,或是創造一個新的數值來取代 WHIP,更不是要護衛王建民。 WHIP 值有其特殊的魅力,包括它的簡單有效、容易理解,這篇文章只是來介紹它優於「勝投」或「防禦率」的地方,並提醒一下它的意涵與侷限,做為運用時的參考。
另一方面,單用 WHIP 來看王建民,恐怕低估王建民的機會將比高估多一點。但我們也不必因此就把 WHIP 束諸高閣(今年應該不會了),較好的方式,可能是多看幾個數據,如滾飛比、K9值、好壞球比、防禦率、被長打率,再加上 WHIP,去想一想這些彼此的影響,可以產出怎麼樣的投球內容,比較能看出投手真正的能力。尤其是在做投手間的比較時。
而不是看看滾飛比,就覺得天下無敵,或轉到三振率,又覺得不過爾爾。
這幾天剛好在CCLu的部落格上看到關於王建民的一段:「他應該是個統計上的例外,用數據分析很有可能低估他的實力。」我想正是如此,我們得更細心的去揣想那無形的樣貌才行。只是這內斂的孩子,連數值都這麼內斂,實在是有點吃虧啊,尤其是要談合約鬥仲裁的時候。
後記:
很少專寫數字,一向想說還是留給眾家高手寫吧,何況棒球在我心中,始終是情感、文化和企管的成份比數字統計多。只是前一陣子開始,WHIP 這東西就在我腦海轉,故這兩天得空還是把它寫出來了,目的不外把它清出腦袋XD
很粗淺的東西,讓大家見笑了。分享在這裡也是邀請朋友幫忙檢查自己的想法,有什麼想錯的地方還請多多指教。
附帶一提,曾在 J-Train 兄的部落格看過一篇「棒球...不是只有數據而已 」,看完頗多感觸。大聯盟比賽多到看不完,一個球迷能看到幾場?所以懂得看數據的人自然掌握得更多些。又大聯盟數據這麼完備,不懂得運用的球隊真該打屁股。但是,數據終究只是數據,離真正的球員,還有段距離。
延伸閱讀:
◎Free Baseball Prospectus for a Week @The Pinstriped Morningside Heights
◎OPS的中文該怎麼說? @癈人的野球二三事
◎"團隊推進效率"的思考與量化 (一) @我心悠悠 (還有二、三就不連了 :P )
◎王建民欲拿賽揚獎,先爭勝投王! @法洛猛的天空球場
◎棒球...不是只有數據而已 @The J-Train Blog
◎Being God @Morikawa Blue
◎淺談關於投手表現的數據分析 @我愛賽伯計量學



![[Embarrassed] 尷尬網誌寫作者互助協會](http://farm1.static.flickr.com/125/413530539_c24411c4c8_o.gif)




















































