零和遊戲
零和博弈又稱零和遊戲,與非零和博弈相對,是博弈論的一個概念,屬非合作博弈,指參與博弈的各方,在嚴格競爭下,一方的收益必然意味着另一方的損失,博弈各方的收益和損失相加總和永遠為「零」。雙方不存在合作的可能。
也可以說:自己的幸福是建立在他人的痛苦之上的,二者的大小完全相等,因而雙方都想盡一切辦法以實現「損人利己」。
零和博弈的例子有:賭博、期貨、股票投機等。
定義
在零和屬性(如果一方得益,另一方必然損失)下,是指結果是零和的情況下會出現帕累托最優的現象。
反過來說,全體參加者可得益或受損的情況被稱為非零和博弈。如果一個國家利用其過剩的香蕉與另一國家剩餘的蘋果進行貿易,因為兩方都從交易中受惠,這是一個非零和的例子。
這個概念最早是在博弈論(英語:Game Theory)上發展,因此零和情況通常被稱為零和遊戲(英語:Zero-Sum Game)。
解決方案
在一個有限零和遊戲之中,不同的博弈理論如納什均衡和極小化極大算法都給予同樣的解決辦法。玩家需使用一個混合策略。
一個零和遊戲例子
正則形式的博弈是解釋零和博弈的其中一個方式。
下方是一個兩人零和遊戲例子。
.............A...........B..........C............
1 ........30, -30 /-10, 10 /20, -20
2 ........10, -10 /20, -20 /-20, 20
遊戲流程如下:第一個玩家(紅方)選擇動作1或動作2,第二個玩家(藍方),在不知道第一個玩家的選擇狀況下,選擇動作A、動作B或動作C其中的一個。然後,玩家的選擇被顯示和每個玩家的分數受根據這些選擇的結果而上升或下降。
例如:紅方選擇行動2,而藍方選擇行動B。結果,紅方獲得20分和藍方失去20分。
現在,在這個例子中,兩位玩家都試圖提高他們的分數。他們應該怎樣做?
紅方的可能舉動如下:「選擇行動2的話,我最多失去20分,卻只能贏得20分。若選擇行動1的話,我只會輸最多10分,但有機會贏得30分,所以行動1看上去比較有利。」藍方使用類似的推理,他會選擇行動C。如果這兩名玩家採取同一策略,紅方將贏得20分。但是,如果藍方預計到紅方選擇行動1的策略,而選擇行動B,以贏得10分。又或者,如果紅方又預計到此技倆和選擇行動2,以獲得20分。到底結果會是怎樣?
數學家約翰•馮•諾伊曼認為機率可以解決這一困境。這兩名玩家應對其可選的行動計算其勝出機率,然後根據這些機率,使用一個隨機邏輯元件,選擇他們的行動。每個玩家計算機率。這極小化極大算法可以計算所有二人零和遊戲的最佳戰略。
對應上面的例子,紅方選擇動作1的機率為4/7和行動2的機率為3/7,而藍方選擇動作的機率為0、4/7和3/7,對應A、B和C三個行動。及後紅方平均每場比賽將會贏得20/7分。
非零和博弈
經濟學
許多經濟形勢並不是零和博弈,由於有價值的商品和服務可以創建、銷毀或分配,以上任何一種狀況將創造一個淨損失或得益。假設對手的行為是合理的,任何商業交易都是非零和博弈,因為每一方必須考慮它接受的貨物是被它交付的商品更有價值。經濟交流必須對交易雙方有利,而且不能是零和博弈,這樣每一方都可以克服各自的交易成本。
參見:絕對利益、比較優勢、自由貿易、貿易中獲得的利益
心理學
最常見的例子,就是社會心理學中的"社會陷阱"在某些情況下,我們可以追求個人的利益,從而加強我們的集體幸福。
在幽默範疇裏,零和博弈被引申為「快樂守恆定律」(Conservation of Happiness),意思是「有人快樂,就必定有人失落」,也就是「快樂必須要建築於別人的痛苦身上」。跟墨菲定律相似,快樂守恆定律的主要用途也就是逗樂。
也可以說:自己的幸福是建立在他人的痛苦之上的,二者的大小完全相等,因而雙方都想盡一切辦法以實現「損人利己」。
零和博弈的例子有:賭博、期貨、股票投機等。
定義
在零和屬性(如果一方得益,另一方必然損失)下,是指結果是零和的情況下會出現帕累托最優的現象。
反過來說,全體參加者可得益或受損的情況被稱為非零和博弈。如果一個國家利用其過剩的香蕉與另一國家剩餘的蘋果進行貿易,因為兩方都從交易中受惠,這是一個非零和的例子。
這個概念最早是在博弈論(英語:Game Theory)上發展,因此零和情況通常被稱為零和遊戲(英語:Zero-Sum Game)。
解決方案
在一個有限零和遊戲之中,不同的博弈理論如納什均衡和極小化極大算法都給予同樣的解決辦法。玩家需使用一個混合策略。
一個零和遊戲例子
正則形式的博弈是解釋零和博弈的其中一個方式。
下方是一個兩人零和遊戲例子。
.............A...........B..........C............
1 ........30, -30 /-10, 10 /20, -20
2 ........10, -10 /20, -20 /-20, 20
遊戲流程如下:第一個玩家(紅方)選擇動作1或動作2,第二個玩家(藍方),在不知道第一個玩家的選擇狀況下,選擇動作A、動作B或動作C其中的一個。然後,玩家的選擇被顯示和每個玩家的分數受根據這些選擇的結果而上升或下降。
例如:紅方選擇行動2,而藍方選擇行動B。結果,紅方獲得20分和藍方失去20分。
現在,在這個例子中,兩位玩家都試圖提高他們的分數。他們應該怎樣做?
紅方的可能舉動如下:「選擇行動2的話,我最多失去20分,卻只能贏得20分。若選擇行動1的話,我只會輸最多10分,但有機會贏得30分,所以行動1看上去比較有利。」藍方使用類似的推理,他會選擇行動C。如果這兩名玩家採取同一策略,紅方將贏得20分。但是,如果藍方預計到紅方選擇行動1的策略,而選擇行動B,以贏得10分。又或者,如果紅方又預計到此技倆和選擇行動2,以獲得20分。到底結果會是怎樣?
數學家約翰•馮•諾伊曼認為機率可以解決這一困境。這兩名玩家應對其可選的行動計算其勝出機率,然後根據這些機率,使用一個隨機邏輯元件,選擇他們的行動。每個玩家計算機率。這極小化極大算法可以計算所有二人零和遊戲的最佳戰略。
對應上面的例子,紅方選擇動作1的機率為4/7和行動2的機率為3/7,而藍方選擇動作的機率為0、4/7和3/7,對應A、B和C三個行動。及後紅方平均每場比賽將會贏得20/7分。
非零和博弈
經濟學
許多經濟形勢並不是零和博弈,由於有價值的商品和服務可以創建、銷毀或分配,以上任何一種狀況將創造一個淨損失或得益。假設對手的行為是合理的,任何商業交易都是非零和博弈,因為每一方必須考慮它接受的貨物是被它交付的商品更有價值。經濟交流必須對交易雙方有利,而且不能是零和博弈,這樣每一方都可以克服各自的交易成本。
參見:絕對利益、比較優勢、自由貿易、貿易中獲得的利益
心理學
最常見的例子,就是社會心理學中的"社會陷阱"在某些情況下,我們可以追求個人的利益,從而加強我們的集體幸福。
在幽默範疇裏,零和博弈被引申為「快樂守恆定律」(Conservation of Happiness),意思是「有人快樂,就必定有人失落」,也就是「快樂必須要建築於別人的痛苦身上」。跟墨菲定律相似,快樂守恆定律的主要用途也就是逗樂。
留言