{"id":"https://openalex.org/W7129410043","doi":"https://doi.org/10.48550/arxiv.2602.13353","title":"Robust Mean-Field Games with Risk Aversion and Bounded Rationality","display_name":"Robust Mean-Field Games with Risk Aversion and Bounded Rationality","publication_year":2026,"publication_date":"2026-02-13","ids":{"openalex":"https://openalex.org/W7129410043","doi":"https://doi.org/10.48550/arxiv.2602.13353"},"language":null,"primary_location":{"id":"pmh:doi:10.48550/arxiv.2602.13353","is_oa":true,"landing_page_url":null,"pdf_url":null,"source":{"id":"https://openalex.org/S4406922384","display_name":"Open MIND","issn_l":null,"issn":null,"is_oa":false,"is_in_doaj":false,"is_core":false,"host_organization":null,"host_organization_name":null,"host_organization_lineage":[],"host_organization_lineage_names":[],"type":"repository"},"license":"cc-by","license_id":"https://openalex.org/licenses/cc-by","version":"submittedVersion","is_accepted":false,"is_published":false,"raw_source_name":null,"raw_type":"Article"},"type":"preprint","indexed_in":["datacite"],"open_access":{"is_oa":true,"oa_status":"green","oa_url":null,"any_repository_has_fulltext":true},"authorships":[{"author_position":"first","author":{"id":"https://openalex.org/A5126182372","display_name":"Bhavini Jeloka","orcid":null},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Jeloka, Bhavini","raw_affiliation_strings":[],"raw_orcid":null,"affiliations":[]},{"author_position":"middle","author":{"id":"https://openalex.org/A5126176856","display_name":"Yue Guan","orcid":null},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Guan, Yue","raw_affiliation_strings":[],"raw_orcid":null,"affiliations":[]},{"author_position":"last","author":{"id":"https://openalex.org/A5077667229","display_name":"Panagiotis Tsiotras","orcid":"https://orcid.org/0000-0001-7563-4129"},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Tsiotras, Panagiotis","raw_affiliation_strings":[],"raw_orcid":null,"affiliations":[]}],"institutions":[],"countries_distinct_count":0,"institutions_distinct_count":3,"corresponding_author_ids":[],"corresponding_institution_ids":[],"apc_list":null,"apc_paid":null,"fwci":null,"has_fulltext":false,"cited_by_count":0,"citation_normalized_percentile":null,"cited_by_percentile_year":null,"biblio":{"volume":null,"issue":null,"first_page":null,"last_page":null},"is_retracted":false,"is_paratext":false,"is_xpac":false,"primary_topic":{"id":"https://openalex.org/T10462","display_name":"Reinforcement Learning in Robotics","score":0.4408000111579895,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},"topics":[{"id":"https://openalex.org/T10462","display_name":"Reinforcement Learning in Robotics","score":0.4408000111579895,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T11031","display_name":"Game Theory and Applications","score":0.28380000591278076,"subfield":{"id":"https://openalex.org/subfields/1803","display_name":"Management Science and Operations Research"},"field":{"id":"https://openalex.org/fields/18","display_name":"Decision Sciences"},"domain":{"id":"https://openalex.org/domains/2","display_name":"Social Sciences"}},{"id":"https://openalex.org/T12794","display_name":"Adaptive Dynamic Programming Control","score":0.05920000001788139,"subfield":{"id":"https://openalex.org/subfields/1703","display_name":"Computational Theory and Mathematics"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}}],"keywords":[{"id":"https://openalex.org/keywords/bounded-rationality","display_name":"Bounded rationality","score":0.7347000241279602},{"id":"https://openalex.org/keywords/robustness","display_name":"Robustness (evolution)","score":0.7069000005722046},{"id":"https://openalex.org/keywords/bounded-function","display_name":"Bounded function","score":0.5472000241279602},{"id":"https://openalex.org/keywords/population","display_name":"Population","score":0.5231000185012817},{"id":"https://openalex.org/keywords/reinforcement-learning","display_name":"Reinforcement learning","score":0.39730000495910645},{"id":"https://openalex.org/keywords/rationality","display_name":"Rationality","score":0.38199999928474426},{"id":"https://openalex.org/keywords/rational-agent","display_name":"Rational agent","score":0.37049999833106995},{"id":"https://openalex.org/keywords/limiting","display_name":"Limiting","score":0.3617999851703644}],"concepts":[{"id":"https://openalex.org/C58694771","wikidata":"https://www.wikidata.org/wiki/Q814385","display_name":"Bounded rationality","level":2,"score":0.7347000241279602},{"id":"https://openalex.org/C63479239","wikidata":"https://www.wikidata.org/wiki/Q7353546","display_name":"Robustness (evolution)","level":3,"score":0.7069000005722046},{"id":"https://openalex.org/C34388435","wikidata":"https://www.wikidata.org/wiki/Q2267362","display_name":"Bounded function","level":2,"score":0.5472000241279602},{"id":"https://openalex.org/C2908647359","wikidata":"https://www.wikidata.org/wiki/Q2625603","display_name":"Population","level":2,"score":0.5231000185012817},{"id":"https://openalex.org/C126255220","wikidata":"https://www.wikidata.org/wiki/Q141495","display_name":"Mathematical optimization","level":1,"score":0.47600001096725464},{"id":"https://openalex.org/C144237770","wikidata":"https://www.wikidata.org/wiki/Q747534","display_name":"Mathematical economics","level":1,"score":0.4562999904155731},{"id":"https://openalex.org/C33923547","wikidata":"https://www.wikidata.org/wiki/Q395","display_name":"Mathematics","level":0,"score":0.4268999993801117},{"id":"https://openalex.org/C97541855","wikidata":"https://www.wikidata.org/wiki/Q830687","display_name":"Reinforcement learning","level":2,"score":0.39730000495910645},{"id":"https://openalex.org/C201717286","wikidata":"https://www.wikidata.org/wiki/Q938185","display_name":"Rationality","level":2,"score":0.38199999928474426},{"id":"https://openalex.org/C41008148","wikidata":"https://www.wikidata.org/wiki/Q21198","display_name":"Computer science","level":0,"score":0.37959998846054077},{"id":"https://openalex.org/C31772880","wikidata":"https://www.wikidata.org/wiki/Q2666479","display_name":"Rational agent","level":2,"score":0.37049999833106995},{"id":"https://openalex.org/C188198153","wikidata":"https://www.wikidata.org/wiki/Q1613840","display_name":"Limiting","level":2,"score":0.3617999851703644},{"id":"https://openalex.org/C2777303404","wikidata":"https://www.wikidata.org/wiki/Q759757","display_name":"Convergence (economics)","level":2,"score":0.3488999903202057},{"id":"https://openalex.org/C205706631","wikidata":"https://www.wikidata.org/wiki/Q2319304","display_name":"Expected utility hypothesis","level":2,"score":0.3391000032424927},{"id":"https://openalex.org/C149441793","wikidata":"https://www.wikidata.org/wiki/Q200726","display_name":"Probability distribution","level":2,"score":0.3346000015735626},{"id":"https://openalex.org/C149782125","wikidata":"https://www.wikidata.org/wiki/Q160039","display_name":"Econometrics","level":1,"score":0.3327000141143799},{"id":"https://openalex.org/C96016098","wikidata":"https://www.wikidata.org/wiki/Q853949","display_name":"Rational expectations","level":2,"score":0.3292999863624573},{"id":"https://openalex.org/C129915516","wikidata":"https://www.wikidata.org/wiki/Q17083550","display_name":"Risk aversion (psychology)","level":3,"score":0.3077000081539154},{"id":"https://openalex.org/C61797465","wikidata":"https://www.wikidata.org/wiki/Q1188986","display_name":"Term (time)","level":2,"score":0.3000999987125397},{"id":"https://openalex.org/C22171661","wikidata":"https://www.wikidata.org/wiki/Q1074380","display_name":"Stochastic game","level":2,"score":0.2996000051498413},{"id":"https://openalex.org/C177142836","wikidata":"https://www.wikidata.org/wiki/Q44455","display_name":"Game theory","level":2,"score":0.28439998626708984},{"id":"https://openalex.org/C202556891","wikidata":"https://www.wikidata.org/wiki/Q1584646","display_name":"Repeated game","level":3,"score":0.2614000141620636},{"id":"https://openalex.org/C94822996","wikidata":"https://www.wikidata.org/wiki/Q1777902","display_name":"Satisficing","level":2,"score":0.25119999051094055}],"mesh":[],"locations_count":2,"locations":[{"id":"pmh:doi:10.48550/arxiv.2602.13353","is_oa":true,"landing_page_url":null,"pdf_url":null,"source":{"id":"https://openalex.org/S4406922384","display_name":"Open MIND","issn_l":null,"issn":null,"is_oa":false,"is_in_doaj":false,"is_core":false,"host_organization":null,"host_organization_name":null,"host_organization_lineage":[],"host_organization_lineage_names":[],"type":"repository"},"license":"cc-by","license_id":"https://openalex.org/licenses/cc-by","version":"submittedVersion","is_accepted":false,"is_published":false,"raw_source_name":null,"raw_type":"Article"},{"id":"doi:10.48550/arxiv.2602.13353","is_oa":true,"landing_page_url":"https://doi.org/10.48550/arxiv.2602.13353","pdf_url":null,"source":{"id":"https://openalex.org/S4306400194","display_name":"arXiv (Cornell University)","issn_l":null,"issn":null,"is_oa":true,"is_in_doaj":false,"is_core":false,"host_organization":"https://openalex.org/I205783295","host_organization_name":"Cornell University","host_organization_lineage":["https://openalex.org/I205783295"],"host_organization_lineage_names":[],"type":"repository"},"license":"cc-by","license_id":"https://openalex.org/licenses/cc-by","version":null,"is_accepted":false,"is_published":null,"raw_source_name":null,"raw_type":"article"}],"best_oa_location":{"id":"pmh:doi:10.48550/arxiv.2602.13353","is_oa":true,"landing_page_url":null,"pdf_url":null,"source":{"id":"https://openalex.org/S4406922384","display_name":"Open MIND","issn_l":null,"issn":null,"is_oa":false,"is_in_doaj":false,"is_core":false,"host_organization":null,"host_organization_name":null,"host_organization_lineage":[],"host_organization_lineage_names":[],"type":"repository"},"license":"cc-by","license_id":"https://openalex.org/licenses/cc-by","version":"submittedVersion","is_accepted":false,"is_published":false,"raw_source_name":null,"raw_type":"Article"},"sustainable_development_goals":[{"score":0.7686994075775146,"display_name":"Peace, Justice and strong institutions","id":"https://metadata.un.org/sdg/16"}],"awards":[],"funders":[],"has_content":{"grobid_xml":false,"pdf":false},"content_urls":null,"referenced_works_count":0,"referenced_works":[],"related_works":[],"abstract_inverted_index":{"Recent":[0],"advances":[1],"in":[2],"mean-field":[3,92,142],"game":[4],"literature":[5],"enable":[6],"the":[7,57,91],"reduction":[8],"of":[9,76,105],"large-scale":[10],"multi-agent":[11],"problems":[12],"to":[13,56,66,111,140,157],"tractable":[14],"interactions":[15],"between":[16],"a":[17,21,29,81,119,150],"representative":[18],"agent":[19],"and":[20,34,43,61,83,102,108,154],"population":[22,32,59],"distribution.":[23],"However,":[24],"existing":[25],"approaches":[26,143],"typically":[27],"assume":[28],"fixed":[30,151],"initial":[31,58,152],"distribution":[33,60,153],"fully":[35,70],"rational":[36,71],"agents,":[37],"limiting":[38],"robustness":[39,138],"under":[40,149],"distributional":[41],"uncertainty":[42],"cognitive":[44],"constraints.":[45],"We":[46,98],"address":[47],"these":[48,77,115],"limitations":[49],"by":[50,62],"introducing":[51],"risk":[52],"aversion":[53],"with":[54,126],"respect":[55],"incorporating":[63],"bounded":[64],"rationality":[65],"model":[67],"deviations":[68],"from":[69],"decision-making":[72],"agents.":[73],"The":[74],"combination":[75],"two":[78],"elements":[79],"yields":[80],"new":[82],"more":[84],"general":[85],"equilibrium":[86,96],"concept,":[87],"which":[88],"we":[89,117],"term":[90],"risk-averse":[93],"quantal":[94],"response":[95],"(MF-RQE).":[97],"establish":[99],"existence":[100],"results":[101],"prove":[103],"convergence":[104],"fixed-point":[106],"iteration":[107],"fictitious":[109],"play":[110],"MF-RQE.":[112],"Building":[113],"on":[114],"insights,":[116],"develop":[118],"scalable":[120],"reinforcement":[121],"learning":[122],"algorithm":[123],"for":[124],"scenarios":[125],"large":[127],"state-action":[128],"spaces.":[129],"Numerical":[130],"experiments":[131],"demonstrate":[132],"that":[133,144],"MF-RQE":[134],"policies":[135],"achieve":[136],"improved":[137],"relative":[139],"classical":[141],"optimize":[145],"expected":[146],"cumulative":[147],"rewards":[148],"are":[155],"restricted":[156],"entropy-based":[158],"regularizers.":[159]},"counts_by_year":[],"updated_date":"2026-06-11T09:08:48.828518","created_date":"2026-02-18T00:00:00"}