{"id":"https://openalex.org/W7160840745","doi":"https://doi.org/10.48550/arxiv.2605.08019","title":"Reason to Play: Behavioral and Brain Alignment Between Frontier LRMs and Human Game Learners","display_name":"Reason to Play: Behavioral and Brain Alignment Between Frontier LRMs and Human Game Learners","publication_year":2026,"publication_date":"2026-05-08","ids":{"openalex":"https://openalex.org/W7160840745","doi":"https://doi.org/10.48550/arxiv.2605.08019"},"language":null,"primary_location":{"id":"doi:10.48550/arxiv.2605.08019","is_oa":true,"landing_page_url":"https://doi.org/10.48550/arxiv.2605.08019","pdf_url":null,"source":{"id":"https://openalex.org/S4306400194","display_name":"arXiv (Cornell University)","issn_l":null,"issn":null,"is_oa":true,"is_in_doaj":false,"is_core":false,"host_organization":"https://openalex.org/I205783295","host_organization_name":"Cornell University","host_organization_lineage":["https://openalex.org/I205783295"],"host_organization_lineage_names":[],"type":"repository"},"license":"cc-by","license_id":"https://openalex.org/licenses/cc-by","version":null,"is_accepted":false,"is_published":false,"raw_source_name":null,"raw_type":"article"},"type":"preprint","indexed_in":["datacite"],"open_access":{"is_oa":true,"oa_status":"green","oa_url":"https://doi.org/10.48550/arxiv.2605.08019","any_repository_has_fulltext":true},"authorships":[{"author_position":"first","author":{"id":"https://openalex.org/A5080635838","display_name":"Botos Csaba","orcid":"https://orcid.org/0000-0002-4228-8909"},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Csaba, Botos","raw_affiliation_strings":[],"raw_orcid":null,"affiliations":[]},{"author_position":"middle","author":{"id":"https://openalex.org/A5078519295","display_name":"Sreejan Kumar","orcid":"https://orcid.org/0000-0003-1769-5147"},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Kumar, Sreejan","raw_affiliation_strings":[],"raw_orcid":null,"affiliations":[]},{"author_position":"middle","author":{"id":"https://openalex.org/A5135861523","display_name":"Austin Tudor David Andrews","orcid":null},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Andrews, Austin Tudor David","raw_affiliation_strings":[],"raw_orcid":null,"affiliations":[]},{"author_position":"middle","author":{"id":"https://openalex.org/A5135888665","display_name":"Laurence Hunt","orcid":null},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Hunt, Laurence","raw_affiliation_strings":[],"raw_orcid":null,"affiliations":[]},{"author_position":"middle","author":{"id":"https://openalex.org/A5026285077","display_name":"Chris Summerfield","orcid":null},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Summerfield, Chris","raw_affiliation_strings":[],"raw_orcid":null,"affiliations":[]},{"author_position":"middle","author":{"id":"https://openalex.org/A5135877712","display_name":"Joshua B. Tenenbaum","orcid":null},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Tenenbaum, Joshua B.","raw_affiliation_strings":[],"raw_orcid":null,"affiliations":[]},{"author_position":"middle","author":{"id":"https://openalex.org/A5039460327","display_name":"Rui Ponte Costa","orcid":"https://orcid.org/0000-0003-2595-2027"},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Costa, Rui Ponte","raw_affiliation_strings":[],"raw_orcid":null,"affiliations":[]},{"author_position":"middle","author":{"id":"https://openalex.org/A5135879877","display_name":"Marcelo G. Mattar","orcid":null},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Mattar, Marcelo G.","raw_affiliation_strings":[],"raw_orcid":null,"affiliations":[]},{"author_position":"last","author":{"id":"https://openalex.org/A5135867611","display_name":"Momchil Tomov","orcid":null},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Tomov, Momchil","raw_affiliation_strings":[],"raw_orcid":null,"affiliations":[]}],"institutions":[],"countries_distinct_count":0,"institutions_distinct_count":9,"corresponding_author_ids":[],"corresponding_institution_ids":[],"apc_list":null,"apc_paid":null,"fwci":null,"has_fulltext":false,"cited_by_count":0,"citation_normalized_percentile":null,"cited_by_percentile_year":null,"biblio":{"volume":null,"issue":null,"first_page":null,"last_page":null},"is_retracted":false,"is_paratext":false,"is_xpac":false,"primary_topic":{"id":"https://openalex.org/T10462","display_name":"Reinforcement Learning in Robotics","score":0.32409998774528503,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},"topics":[{"id":"https://openalex.org/T10462","display_name":"Reinforcement Learning in Robotics","score":0.32409998774528503,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T11574","display_name":"Artificial Intelligence in Games","score":0.2459000051021576,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T12026","display_name":"Explainable Artificial Intelligence (XAI)","score":0.07119999825954437,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}}],"keywords":[{"id":"https://openalex.org/keywords/reinforcement-learning","display_name":"Reinforcement learning","score":0.7050999999046326},{"id":"https://openalex.org/keywords/suite","display_name":"Suite","score":0.4909000098705292},{"id":"https://openalex.org/keywords/representation","display_name":"Representation (politics)","score":0.4388999938964844},{"id":"https://openalex.org/keywords/video-game","display_name":"Video game","score":0.38690000772476196},{"id":"https://openalex.org/keywords/bayesian-probability","display_name":"Bayesian probability","score":0.35850000381469727},{"id":"https://openalex.org/keywords/permutation","display_name":"Permutation (music)","score":0.352400004863739},{"id":"https://openalex.org/keywords/feature","display_name":"Feature (linguistics)","score":0.34929999709129333},{"id":"https://openalex.org/keywords/frontier","display_name":"Frontier","score":0.3467999994754791}],"concepts":[{"id":"https://openalex.org/C97541855","wikidata":"https://www.wikidata.org/wiki/Q830687","display_name":"Reinforcement learning","level":2,"score":0.7050999999046326},{"id":"https://openalex.org/C41008148","wikidata":"https://www.wikidata.org/wiki/Q21198","display_name":"Computer science","level":0,"score":0.6402000188827515},{"id":"https://openalex.org/C154945302","wikidata":"https://www.wikidata.org/wiki/Q11660","display_name":"Artificial intelligence","level":1,"score":0.5809000134468079},{"id":"https://openalex.org/C79581498","wikidata":"https://www.wikidata.org/wiki/Q1367530","display_name":"Suite","level":2,"score":0.4909000098705292},{"id":"https://openalex.org/C2776359362","wikidata":"https://www.wikidata.org/wiki/Q2145286","display_name":"Representation (politics)","level":3,"score":0.4388999938964844},{"id":"https://openalex.org/C3018412434","wikidata":"https://www.wikidata.org/wiki/Q7889","display_name":"Video game","level":2,"score":0.38690000772476196},{"id":"https://openalex.org/C107673813","wikidata":"https://www.wikidata.org/wiki/Q812534","display_name":"Bayesian probability","level":2,"score":0.35850000381469727},{"id":"https://openalex.org/C21308566","wikidata":"https://www.wikidata.org/wiki/Q7169365","display_name":"Permutation (music)","level":2,"score":0.352400004863739},{"id":"https://openalex.org/C2776401178","wikidata":"https://www.wikidata.org/wiki/Q12050496","display_name":"Feature (linguistics)","level":2,"score":0.34929999709129333},{"id":"https://openalex.org/C2778571376","wikidata":"https://www.wikidata.org/wiki/Q1355821","display_name":"Frontier","level":2,"score":0.3467999994754791},{"id":"https://openalex.org/C119857082","wikidata":"https://www.wikidata.org/wiki/Q2539","display_name":"Machine learning","level":1,"score":0.3465000092983246},{"id":"https://openalex.org/C2780186347","wikidata":"https://www.wikidata.org/wiki/Q11414","display_name":"Subnetwork","level":2,"score":0.33559998869895935},{"id":"https://openalex.org/C188147891","wikidata":"https://www.wikidata.org/wiki/Q147638","display_name":"Cognitive science","level":1,"score":0.32089999318122864},{"id":"https://openalex.org/C160234255","wikidata":"https://www.wikidata.org/wiki/Q812535","display_name":"Bayesian inference","level":3,"score":0.3021000027656555},{"id":"https://openalex.org/C2776505523","wikidata":"https://www.wikidata.org/wiki/Q4785468","display_name":"Plan (archaeology)","level":2,"score":0.30160000920295715},{"id":"https://openalex.org/C185798385","wikidata":"https://www.wikidata.org/wiki/Q1161707","display_name":"Benchmark (surveying)","level":2,"score":0.30070000886917114},{"id":"https://openalex.org/C165064840","wikidata":"https://www.wikidata.org/wiki/Q1321061","display_name":"Matching (statistics)","level":2,"score":0.29269999265670776},{"id":"https://openalex.org/C33724603","wikidata":"https://www.wikidata.org/wiki/Q812540","display_name":"Bayesian network","level":2,"score":0.27709999680519104},{"id":"https://openalex.org/C66024118","wikidata":"https://www.wikidata.org/wiki/Q1122506","display_name":"Computational model","level":2,"score":0.27090001106262207},{"id":"https://openalex.org/C108583219","wikidata":"https://www.wikidata.org/wiki/Q197536","display_name":"Deep learning","level":2,"score":0.26910001039505005},{"id":"https://openalex.org/C107457646","wikidata":"https://www.wikidata.org/wiki/Q207434","display_name":"Human\u2013computer interaction","level":1,"score":0.26750001311302185},{"id":"https://openalex.org/C48103436","wikidata":"https://www.wikidata.org/wiki/Q599031","display_name":"State (computer science)","level":2,"score":0.257999986410141},{"id":"https://openalex.org/C59404180","wikidata":"https://www.wikidata.org/wiki/Q17013334","display_name":"Feature learning","level":2,"score":0.2554999887943268}],"mesh":[],"locations_count":1,"locations":[{"id":"doi:10.48550/arxiv.2605.08019","is_oa":true,"landing_page_url":"https://doi.org/10.48550/arxiv.2605.08019","pdf_url":null,"source":{"id":"https://openalex.org/S4306400194","display_name":"arXiv (Cornell University)","issn_l":null,"issn":null,"is_oa":true,"is_in_doaj":false,"is_core":false,"host_organization":"https://openalex.org/I205783295","host_organization_name":"Cornell University","host_organization_lineage":["https://openalex.org/I205783295"],"host_organization_lineage_names":[],"type":"repository"},"license":"cc-by","license_id":"https://openalex.org/licenses/cc-by","version":null,"is_accepted":false,"is_published":null,"raw_source_name":null,"raw_type":"article"}],"best_oa_location":{"id":"doi:10.48550/arxiv.2605.08019","is_oa":true,"landing_page_url":"https://doi.org/10.48550/arxiv.2605.08019","pdf_url":null,"source":{"id":"https://openalex.org/S4306400194","display_name":"arXiv (Cornell University)","issn_l":null,"issn":null,"is_oa":true,"is_in_doaj":false,"is_core":false,"host_organization":"https://openalex.org/I205783295","host_organization_name":"Cornell University","host_organization_lineage":["https://openalex.org/I205783295"],"host_organization_lineage_names":[],"type":"repository"},"license":"cc-by","license_id":"https://openalex.org/licenses/cc-by","version":null,"is_accepted":false,"is_published":false,"raw_source_name":null,"raw_type":"article"},"sustainable_development_goals":[{"id":"https://metadata.un.org/sdg/16","score":0.7101317644119263,"display_name":"Peace, Justice and strong institutions"}],"awards":[],"funders":[],"has_content":{"pdf":false,"grobid_xml":false},"content_urls":null,"referenced_works_count":0,"referenced_works":[],"related_works":[],"abstract_inverted_index":{"Humans":[0],"rapidly":[1],"learn":[2,24,49],"abstract":[3],"knowledge":[4,13],"when":[5],"encountering":[6],"novel":[7,50],"environments":[8],"and":[9,17,25,59,77,96,102,121,137,182],"flexibly":[10],"deploy":[11],"this":[12,33],"to":[14,69,143],"guide":[15],"efficient":[16],"intelligent":[18],"action.":[19],"Can":[20],"modern":[21],"AI":[22],"systems":[23],"plan":[26],"in":[27,46,185],"a":[28,36,86,103],"similar":[29],"way?":[30],"We":[31,62,107],"study":[32],"question":[34],"using":[35],"dataset":[37],"of":[38,88,127,160,179],"complex":[39],"human":[40,74,115,180],"gameplay":[41],"with":[42,140,191],"concurrent":[43],"fMRI":[44],"recordings,":[45],"which":[47],"participants":[48],"video":[51],"games":[52],"that":[53,109,152],"require":[54],"rule":[55],"discovery,":[56],"hypothesis":[57],"revision,":[58],"multi-step":[60],"planning.":[61],"jointly":[63],"evaluate":[64],"models":[65],"by":[66],"their":[67],"ability":[68],"play":[70],"the":[71,82,156,161],"games,":[72],"match":[73,114],"learning":[75,100,133,181],"behavior,":[76],"predict":[78,122],"brain":[79,123,153],"activity":[80,124],"during":[81,118],"same":[83],"task,":[84],"comparing":[85],"suite":[87],"frontier":[89,110],"Large":[90],"Reasoning":[91],"Models":[92],"(LRMs)":[93],"against":[94],"model-free":[95],"model-based":[97],"deep":[98],"reinforcement":[99,132],"agents":[101],"Bayesian":[104],"theory-based":[105],"agent.":[106],"find":[108],"LRMs":[111,174],"most":[112],"closely":[113],"behavioral":[116],"patterns":[117],"game":[119,162],"discovery":[120],"an":[125],"order":[126],"magnitude":[128],"better":[129],"than":[130,165],"both":[131],"alternatives":[134],"across":[135],"cortical":[136],"subcortical":[138],"regions,":[139],"effects":[141],"robust":[142],"permutation":[144],"controls.":[145],"Through":[146],"targeted":[147],"manipulations,":[148],"we":[149],"further":[150],"show":[151],"alignment":[154],"reflects":[155],"model's":[157],"in-context":[158],"representation":[159],"state":[163],"rather":[164],"its":[166],"downstream":[167],"planning":[168],"or":[169],"reasoning.":[170],"Our":[171],"results":[172],"establish":[173],"as":[175],"compelling":[176],"computational":[177],"accounts":[178],"decision":[183],"making":[184],"complex,":[186],"naturalistic":[187],"environments.":[188],"Project":[189],"page":[190],"interactive":[192],"replays:":[193],"https://botcs.github.io/reason-to-play/":[194]},"counts_by_year":[],"updated_date":"2026-06-11T09:08:48.828518","created_date":"2026-05-12T00:00:00"}