Nowe koncepcje równowagi w grach dynamicznych z niepełną informacją i ich ekonomiczne zastosowania

(2013/11/B/HS4/00857)

projekt finansowany przez NCN w latach 2014-2016


Uczestnicy

dr hab. Agnieszka Wiszniewska-Matyszkiel, kierownik projektu

mgr Oskar Górniewicz

mgr Katarzyna Kańska

mgr Katarzyna Kraszewska

mgr Rajani Singh


Wyniki

  1. Pojęcia potencjalnej równowagi ze zniekształconą informacją (pre-BDNE), samo-weryfikacji oczekiwań i równowagi ze zniekształconą informacją (BDNE):

    a) dla oczekiwań w postaci zbiorów możliwych wyników;

    b) dla oczekiwań probabilistycznych;

    c) dla oczekiwań uwzględniających niepewność modelową.

  2. Pre-BDNE i BDNE w zastosowaniach

    a) modele eksploatacji ekosystemów;

    b) modele rynków oligopolistycznych i konkurencyjnych;

    c) gry mniejszości;

    d) wymuszanie kooperacji w powtarzanym dylemacie więźnia;

    e) model giełdy.

  3. Istnienie i własności.

  4. Eksploatacja wspólnych zasobów odnawialnych ze sprzedażą na wspólnym rynku – gra liniowo-kwadratowa z wieloma graczami i wiążącymi ograniczeniami. Optymalność, równowagi, wymuszanie optymalności przy pomocy podatku Pigou.

  5. Analityczne metody rozwiązywania gier dynamicznych stosowane w literaturze – kontrprzykłady na poprawność stosowanych często metod.

  6. Metody numeryczne szukania optimów i równowag w grze dynamicznej.

  7. Punkt stały i losowa równowaga Nasha.

  8. Wojny rybne – weryfikacja i modyfikacja modelu Fischera i Mirmana.

  9. Duopol Stackelberga z lepkimi cenami i krótkowzrocznym naśladowcą.

  10. Wymuszenie na lokalnym rynku – gra pomiędzy mafią i policją.


Opis wyników


W projekcie zajmowaliśmy się zagadnieniem podejmowania decyzji w sytuacjach o charakterze teoriogrowym z niepełną, niesymetryczną lub zniekształconą informacją zarówno w ujęciu teoretycznym, jak i w zastosowaniach w ekonomii i ekologii.


W naszych pracach teoretycznych wprowadziliśmy pojęcie potencjalnej równowagi ze zniekształconą informacją (pre-belief distorted Nash equilibrium, pre-BDNE), samo-weryfikacji oczekiwań (self-verification of beliefs) i równowagi ze zniekształconą informacją (belief distorted Nash equilibrium, BDNE).

W naszym podejściu zakładamy, że przy niekompletności informacji o grze dotyczącej tego, jak obecna decyzja gracza wpłynie na przyszły przebieg gry (zmienną stanu np. ilość ryb w morzu i pewne zmienne globalne w grze np. łączny połów), gracze formułują oczekiwania, optymalizują przy tych oczekiwaniach, tak aby w każdym etapie każdy z nich znajdował najlepszą odpowiedź na obecne decyzje pozostałych i swoje oczekiwania co do przyszłości (pre-BDNE). Dla takiego profilu badamy, czy potwierdza on oczekiwania graczy (BDNE). Badamy też samą własność samo-weryfikacji oczekiwań, nie zakładając z góry konkretnego profilu.


W rzeczywistości, powstały trzy różne koncepcje tych trzech pojęć, w zależności od postaci oczekiwań co wpływu obecnej decyzji gracza na przyszły przebieg gry: w postaci zbiorów, określających możliwe przyszłe trajektorie, w postaci rozkładów prawdopodobieństwa na zbiorze przyszłych trajektorii i najbardziej ogólne, zawierające niepewność modelową (ambiguity) zawierające w sobie dwa poprzednie jako szczególne, skrajne przypadki. Postać i interpretacja oczekiwań narzucała w dwóch pierwszych przypadkach bardzo różne definicje zarówno oczekiwanej wypłaty (wypłata dla najgorszej realizacji versus wartość oczekiwana), a więc definicję pre-BDNE, jak i definicję samo-weryfikacji oczekiwań i finalną koncepcję BDNE.


We wszystkich trzech przypadkach udało nam się udowodnić twierdzenia o istnieniu pre-BDNE w grze z continuum graczy, równoważność pomiędzy pre-BDNE i BDNE a równowagą Nasha (z czego, pośrednio, wynika istnienie BDNE) dla continuum graczy i oczekiwań doskonale przewidujących (perfect foresigh), jak również przy pewnych założeniach co do oczekiwań dla gier powtarzanych. Ponadto pre-równowagi ze zniekształconą informacją są znacznie prostsze obliczeniowo niż zwykłe równowagi Nasha w grach dynamicznych.


Jeśli chodzi o twierdzenie o istnieniu pre-BDNE czy też BDNE w szerszej klasie gier niż te, dla których udało nam się takie twierdzenie udowodnić, wydaje się to niewykonalne przy pomocy znanych w literaturze twierdzeń o punkcie stałym. Dlatego też w ramach prac nad projektem znalazły się prace teoretyczne dotyczące punktu stałego.


Wyniki teoretyczne zostały zilustrowane na modelach eksploatacji wspólnych zasobów odnawialnych (typu Wojen Rybnych – Fish Wars), rynków oligopolistycznych i konkurencyjnych, gier minimum (lub lokalnych dóbr publicznych), giełdy i wymuszania kooperacji w dylemacie więźnia. Otrzymaliśmy m.in. ciekawe wnioski dotyczące właściwej formy upubliczniania wiedzy, tak aby uniknąć tragedii wspólnego zasobu, kiedy w naturalny sposób występuje, jak również nadmiernej eksploatacji czy krachu spowodowanego jedynie informacją.


Ponadto prace w ramach projektu zaowocowały znacznie szerszym niż oczekiwane spektrum wyników, w tym wyników o spodziewanym przełomowym wpływie na dziedzinę gier dynamicznych. Dogłębna analiza modeli eksploatacji wspólnych zasobów i rynków, w których chcieliśmy porównywać równowagi ze zniekształconą informacją z równowagami Nasha, wykazała, że niektóre z obecnie stosowanych metod są błędne – udało się znaleźć kontrprzykłady do dwóch szeroko stosowanych technik stosowanych przy wyliczaniu równowag Nasha w grach dynamicznych z czasem dyskretnym, w tym jednego uproszczenia pojawiającego się również w kontekście optymalizacji dynamicznej. W związku z tym wyprowadzenia w wielu pracach dotyczących zastosowań gier dynamicznych w tych dziedzinach są w najlepszym razie niepełne. Zaowocowało to m.in. pracą dotyczącą poprawionego modelu wojen rybnych Fischera i Mirmana, opisującej eksploatację dwóch współzależnych gatunków ryb przez dwa kraje – dla oryginalnego modelu Fischera i Mirmana można dowieść poprawności wyników jedynie dla symbiozy pomiędzy gatunkami.


Z kolei analiza metod numerycznych na prostszym modelu wojen rybnych Levhariego i Mirmana, którego postać wydawałaby się nie być odpowiednia dla stosowania metod numerycznych, a w którym udało się uzyskać dużą dokładność wyliczenia ścieżki konsumpcji w równowadze mimo niedokładnego szacowania funkcji wartości na niektórych przedziałach, doprowadziła do znalezienia ogólnej zasady pozwalającej na stwierdzenie, jakiego rodzaju błędy w liczeniu funkcji wartości nie wpływają na dokładność wyliczenia równowagi Nasha w grach dynamicznych.


Stworzyliśmy także model eksploatacji wspólnych zasobów odnawialnych sprzedawanych na wspólnym oligopolistycznym rynku. Użyliśmy do tego gry liniowo-kwadratowej (chyba najlepiej zbadana klasa gier dynamicznych), jednakże dodaliśmy do niej wiążące ograniczenia w oczywistej postaci „nie możesz eksploatować więcej niż przypadająca ci część zasobów” i realną możliwość wyginięcia poławianego gatunku. Te dwa ograniczenia, dotychczas nie stosowane w teoriogrowym modelowaniu eksploatacji wspólnych zasobów odnawialnych przy pomocy gier liniowo-kwadratowych, doprowadziły do diametralnej zmiany funkcji wartości, dotychczas nie znanej w grach liniowo-kwadratowych. W grach z wieloma graczami dla szerokiego przedziału wartości początkowej wielkości poławianej populacji, pokazaliśmy zagrożenie wyginięciem gatunku. W tym kontekście badaliśmy również optimum społeczne i znaleźliśmy liniowy, aczkolwiek na pewnych przedziałach zależny od aktualnego stanu zasobu, system opodatkowania wymuszający to optimum społeczne.


Jeśli chodzi o modele rynków, to analizowaliśmy dodatkowo asymetryczną informację w modelu oligopolu z lepkimi cenami, zniekształconą dla jednego z graczy – grę o strukturze podobnej do duopolu Stackelberga, ale z krótkowzrocznym naśladowcą, który nie bierze pod uwagę, że jego obecna decyzja wpływa na przyszłe ceny; jak również grę pomiędzy mafią a policją, opisującą wymuszenia na lokalnym rynku i ich wpływ na rozwój (lub stagnację). W pierwszym przypadku wyliczyliśmy równowagę, w której przy niskiej cenie początkowej na pewnym początkowym odcinku czasu lider wstrzymuje się od produkcji, co wykorzystuje naśladowca, który w tym czasie ma największą produkcję i zyski. W odróżnieniu od równowag Nasha w analogicznym modelu, ta równowaga okazała się niezależna od tego, czy w grze rozważana jest informacja w postaci otwartej pętli (strategie zależne jedynie od czasu), czy w postaci sprzężenia zwrotnego (zależne jedynie od aktualnej ceny). W modelu wymuszeń, pochodzącym od Dawida, Feichtingera i Novaka, rozważyliśmy strategie otwartej pętli, i oprócz równowag, które są równoważne znanym, stałym równowagom w postaci sprzężenia zwrotnego (w tym modelu zależny jedynie od kapitału; taka równoważność to bardzo rzadka sytuacja w teorii gier) otrzymaliśmy punkty spełniające warunki konieczne na równowagę Nasha, w których stopa groźby zbiegała do zera, co oznacza niezagrożony wzrost gospodarczy, mimo równoczesnego funkcjonowania i niezerowych dochodów mafii.


Projekt zapoczątkował badania na skalę znacznie szerszą, niż można było tego oczekiwać na etapie tworzenia projektu – spodziewamy się jeszcze wielu ciekawych wyników przy kontynuacji rozpoczętej pracy.



Spełnienie założeń


Założenia grantu zostały w całości zrealizowane (w punktach 1, 2 i 3 osiągnięte zostały wszystkie cele grantu). Pozostałe wyniki są przynajmniej w części rozszerzeniem. W znacznej części zostały one zapoczątkowane albo poszukiwaniem skutecznych metod obliczeniowych, albo ciekawych zastosowań dla naszych koncepcji.

Natomiast zupełnie nieoczekiwanymi wynikami analizy teoriogrowych modeli wspólnych ekosystemów i rynków pod kątem porównania równowag Nasha czy profili społecznie optymalnych (czy to znanych z literatury wyników dla modeli Levhariego i Mirmana oraz Fischera i Mirmana, czy też własnego modelu 4.) z równowagami ze zniekształconą informacją, są kontrprzykłady na uznawane za standardowe dwa aspekty metod liczenia równowag Nasha (a także, czasem, społecznego optimum) w grach dynamicznych z czasem dyskretnym (5.). Wynik ten jest całkowitym przełomem w dziedzinie, zwłaszcza że kontrprzykłady udało się znaleźć dla, będących obecnie gorącym tematem, gier liniowo-kwadratowych.


Wpływ na dziedzinę i inne dziedziny


Przełomowy.

Po pierwsze, w wyniku prac powstała nowa koncepcja równowagi w swojej finalnej postaci – a nawet w trzech postaciach zależnych od formy informacji. Choć badania nad zniekształconą informacją trwają już od pewnego czasu, w pierwszych przymiarkach do koncepcji równowagi ze zniekształconą informacją, pojęcie to nie zawierało w sobie samo-weryfikacji oczekiwań, które ponadto nie pojawiały się nigdzie explicite, a jedynie przez mającą odzwierciedlać je w nie do końca sprecyzowany sposób gotową funkcję oczekiwanej wypłaty, co powodowało dużą uznaniowość i problemy ze stosowalnością.

Po drugie, jeśli chodzi o zastosowania, otrzymaliśmy wyniki sugerujące ostrożność w formułowaniu informacji i monitorowania co i w jakiej formie jest propagowane, co może mieć zastosowanie w polityce informacyjnej, zwłaszcza w kluczowych kwestiach globalnych problemów ekologicznych.

Po trzecie, otrzymaliśmy kontrprzykłady do poprawności metodologii używanej w wielu pracach, w tym szeroko cytowanego i często stanowiącego wzorzec postępowania przy liczeniu równowag Nasha w zagadnieniach eksploatacji wspólnych zasobów cyklu prac „Wojen Rybnych”. Wstępne badania pokazują, że niektóre ze znajdujących się w naukowym obiegu wyników są poprawne mimo stosowania generalnie błędnej metodologii (wymaga to szczególnej struktury modelu – określenie klasy modeli, dla których mimo jednego z zauważonych przez nas błędów, wyniki są poprawne, wydaje się być nowym ciekawym tematem badawczym, i to nie tylko zanim pojawi się metoda poprawiona, nad którą również rozpoczęliśmy prace, ponieważ będzie bardziej złożona i w związku z tym zapewne o mniejszej stosowalności), poprawności niektórych nijak nie da się udowodnić istniejącymi metodami, a jeszcze w przypadku innych można udowodnić fałszywość wyników.


Streszczenie popularno-naukowe


W projekcie badaliśmy podejmowanie decyzji w sytuacjach o charakterze gry dynamicznej (czyli dla przynajmniej dwóch powiązanych ze sobą decydentów podejmujących decyzje wielokrotnie w czasie) przy założeniu, ze informacja graczy jest niekompletna, a nawet zniekształcona. Wówczas mają zastosowanie zdefiniowane przez nas pojęcia potencjalnej równowagi Nasha ze zniekształconą informacją, samo-weryfikacji oczekiwań i równowagi ze zniekształconą informacją, które badaliśmy w tym projekcie. Pojęcia te porównywaliśmy również z innymi znanymi koncepcjami z teorii gier, m.in. równowagą Nasha.


Oprócz ogólnej teoretycznej analizy zagadnienia przy trzech różnych postaciach informacji, analizowaliśmy implikacje dla różnych zagadnień, w tym eksploatacji wspólnych ekosystemów, rynków i problemu wymuszania kooperacji w zagadnieniach typu dylemat więźnia.


W szczególności udało nam się pokazać, że w zagadnieniach ekologicznych niewłaściwie sformułowana informacja może doprowadzić do nadmiernej eksploatacji ekosystemu, do wyginięcia gatunków włącznie. Uświadomienie współgraczowi możliwości retorsji i równoczesnej chęci do kooperacji może z kolei wymusić kooperację, nawet jeśli w rzeczywistości stosujemy inną strategię.


Ponadto poszerzyliśmy bazę narzędzi matematycznych rozwiązywania gier dynamicznych i zweryfikowaliśmy niektóre z powszechnie używanych metod i niektóre z istniejących modeli, głównie eksploatacji wspólnych ekosystemów – w wyniku naszych prac wykazaliśmy konieczność przedefiniowania tych metod i ponownej analizy modeli.


Abstract for general public


In the project, we have analysed decision making in situations constituting dynamic game problems (with at least two agents, interdependent, making decisions many times) with additional assumption that information of players is incomplete or even distorted. In such problems, our definitions of pre-belief distorted Nash equilibrium, self-verification of beliefs and belief distorted Nash equilibrium, examined in this project, can be applied. We have also compared those concepts to other known concepts in game theory, among other things with the Nash equilibrium.


Besides a general theoretical analysis of the phenomenon using three different forms of information, we have analysed implications for various problems, including exploitation of common ecosystems, markets and enforcing cooperation in prisoner's dilemma kind of problems.


In particular, we have proved that in ecological problems improperly formulated information can result in overexploitation of the ecosystem, which may even imply dying out of whole species. Analysis of another application resulted in showing that in the context of distorted information, informing the other player of possibility of retorsions with simultanous will to cooperate, may enforce cooperation even if we use some other strategy – and proper formulation of this revelation results in both the fact that the other player is neither eager to check, nor our revelation will be falsified.


Besides, we we have enlarged the base of mathematical tools for solving dynamic games and we verified some of commonly used methods and some existing models, mainly of exploitation of common ecosystems – as a result of our research, we have shown necessity of redefining those methods and repeating analysis of those models.


Prace

Opublikowane:

1. A. Wiszniewska-Matyszkiel, Belief distorted Nash equilibria: introduction of a new kind of equilibrium in dynamic games with distorted information, DOI 10.1007/s10479-015-1920-7, http://link.springer.com/article/10.1007/s10479-015-1920-7.

Przyjęte do druku:

1. O. Górniewicz, Note on the fixed point property.



Złożone:

1. A. Wiszniewska-Matyszkiel, Redefinition of belief distorted Nash equilibria for the environment of dynamic games with probabilistic beliefs.



2. A. Wiszniewska-Matyszkiel, R. Singh, Numerical versus analytic calculation of optima and equilibria in Fish Wars model with finite time horizon



Preprinty: