{"id":"https://openalex.org/W7130374203","doi":"https://doi.org/10.48550/arxiv.2602.15252","title":"Decision Making under Imperfect Recall: Algorithms and Benchmarks","display_name":"Decision Making under Imperfect Recall: Algorithms and Benchmarks","publication_year":2026,"publication_date":"2026-02-16","ids":{"openalex":"https://openalex.org/W7130374203","doi":"https://doi.org/10.48550/arxiv.2602.15252"},"language":null,"primary_location":{"id":"doi:10.48550/arxiv.2602.15252","is_oa":true,"landing_page_url":"https://doi.org/10.48550/arxiv.2602.15252","pdf_url":null,"source":{"id":"https://openalex.org/S4306400194","display_name":"arXiv (Cornell University)","issn_l":null,"issn":null,"is_oa":true,"is_in_doaj":false,"is_core":false,"host_organization":"https://openalex.org/I205783295","host_organization_name":"Cornell University","host_organization_lineage":["https://openalex.org/I205783295"],"host_organization_lineage_names":[],"type":"repository"},"license":null,"license_id":null,"version":null,"is_accepted":false,"is_published":false,"raw_source_name":null,"raw_type":"article"},"type":"preprint","indexed_in":["datacite"],"open_access":{"is_oa":true,"oa_status":"green","oa_url":"https://doi.org/10.48550/arxiv.2602.15252","any_repository_has_fulltext":true},"authorships":[{"author_position":"first","author":{"id":"https://openalex.org/A5009847680","display_name":"Emanuel Tewolde","orcid":"https://orcid.org/0000-0003-4128-7872"},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Tewolde, Emanuel","raw_affiliation_strings":[],"raw_orcid":null,"affiliations":[]},{"author_position":"middle","author":{"id":"https://openalex.org/A5126350325","display_name":"Brian Hu Zhang","orcid":null},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Zhang, Brian Hu","raw_affiliation_strings":[],"raw_orcid":null,"affiliations":[]},{"author_position":"middle","author":{"id":"https://openalex.org/A5057299811","display_name":"Ioannis Anagnostides","orcid":"https://orcid.org/0000-0002-8037-6360"},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Anagnostides, Ioannis","raw_affiliation_strings":[],"raw_orcid":null,"affiliations":[]},{"author_position":"middle","author":{"id":"https://openalex.org/A5126291253","display_name":"Tuomas Sandholm","orcid":null},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Sandholm, Tuomas","raw_affiliation_strings":[],"raw_orcid":null,"affiliations":[]},{"author_position":"last","author":{"id":"https://openalex.org/A5126292354","display_name":"Vincent Conitzer","orcid":null},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Conitzer, Vincent","raw_affiliation_strings":[],"raw_orcid":null,"affiliations":[]}],"institutions":[],"countries_distinct_count":0,"institutions_distinct_count":5,"corresponding_author_ids":[],"corresponding_institution_ids":[],"apc_list":null,"apc_paid":null,"fwci":null,"has_fulltext":false,"cited_by_count":0,"citation_normalized_percentile":null,"cited_by_percentile_year":null,"biblio":{"volume":null,"issue":null,"first_page":null,"last_page":null},"is_retracted":false,"is_paratext":false,"is_xpac":false,"primary_topic":{"id":"https://openalex.org/T12101","display_name":"Advanced Bandit Algorithms Research","score":0.875,"subfield":{"id":"https://openalex.org/subfields/1803","display_name":"Management Science and Operations Research"},"field":{"id":"https://openalex.org/fields/18","display_name":"Decision Sciences"},"domain":{"id":"https://openalex.org/domains/2","display_name":"Social Sciences"}},"topics":[{"id":"https://openalex.org/T12101","display_name":"Advanced Bandit Algorithms Research","score":0.875,"subfield":{"id":"https://openalex.org/subfields/1803","display_name":"Management Science and Operations Research"},"field":{"id":"https://openalex.org/fields/18","display_name":"Decision Sciences"},"domain":{"id":"https://openalex.org/domains/2","display_name":"Social Sciences"}},{"id":"https://openalex.org/T10462","display_name":"Reinforcement Learning in Robotics","score":0.02419999986886978,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T11031","display_name":"Game Theory and Applications","score":0.019200000911951065,"subfield":{"id":"https://openalex.org/subfields/1803","display_name":"Management Science and Operations Research"},"field":{"id":"https://openalex.org/fields/18","display_name":"Decision Sciences"},"domain":{"id":"https://openalex.org/domains/2","display_name":"Social Sciences"}}],"keywords":[{"id":"https://openalex.org/keywords/regret","display_name":"Regret","score":0.6234999895095825},{"id":"https://openalex.org/keywords/benchmark","display_name":"Benchmark (surveying)","score":0.5843999981880188},{"id":"https://openalex.org/keywords/variety","display_name":"Variety (cybernetics)","score":0.5722000002861023},{"id":"https://openalex.org/keywords/suite","display_name":"Suite","score":0.5579000115394592},{"id":"https://openalex.org/keywords/key","display_name":"Key (lock)","score":0.5539000034332275},{"id":"https://openalex.org/keywords/matching","display_name":"Matching (statistics)","score":0.4927000105381012},{"id":"https://openalex.org/keywords/class","display_name":"Class (philosophy)","score":0.44600000977516174},{"id":"https://openalex.org/keywords/perfect-information","display_name":"Perfect information","score":0.40880000591278076}],"concepts":[{"id":"https://openalex.org/C41008148","wikidata":"https://www.wikidata.org/wiki/Q21198","display_name":"Computer science","level":0,"score":0.6942999958992004},{"id":"https://openalex.org/C50817715","wikidata":"https://www.wikidata.org/wiki/Q79895177","display_name":"Regret","level":2,"score":0.6234999895095825},{"id":"https://openalex.org/C185798385","wikidata":"https://www.wikidata.org/wiki/Q1161707","display_name":"Benchmark (surveying)","level":2,"score":0.5843999981880188},{"id":"https://openalex.org/C136197465","wikidata":"https://www.wikidata.org/wiki/Q1729295","display_name":"Variety (cybernetics)","level":2,"score":0.5722000002861023},{"id":"https://openalex.org/C79581498","wikidata":"https://www.wikidata.org/wiki/Q1367530","display_name":"Suite","level":2,"score":0.5579000115394592},{"id":"https://openalex.org/C26517878","wikidata":"https://www.wikidata.org/wiki/Q228039","display_name":"Key (lock)","level":2,"score":0.5539000034332275},{"id":"https://openalex.org/C165064840","wikidata":"https://www.wikidata.org/wiki/Q1321061","display_name":"Matching (statistics)","level":2,"score":0.4927000105381012},{"id":"https://openalex.org/C2777212361","wikidata":"https://www.wikidata.org/wiki/Q5127848","display_name":"Class (philosophy)","level":2,"score":0.44600000977516174},{"id":"https://openalex.org/C119857082","wikidata":"https://www.wikidata.org/wiki/Q2539","display_name":"Machine learning","level":1,"score":0.41269999742507935},{"id":"https://openalex.org/C123676819","wikidata":"https://www.wikidata.org/wiki/Q1074338","display_name":"Perfect information","level":2,"score":0.40880000591278076},{"id":"https://openalex.org/C123676819","wikidata":"https://www.wikidata.org/wiki/Q1074338","display_name":"Perfect information","level":2,"score":0.40869998931884766},{"id":"https://openalex.org/C2780310539","wikidata":"https://www.wikidata.org/wiki/Q12547192","display_name":"Imperfect","level":2,"score":0.3903000056743622},{"id":"https://openalex.org/C11413529","wikidata":"https://www.wikidata.org/wiki/Q8366","display_name":"Algorithm","level":1,"score":0.3865000009536743},{"id":"https://openalex.org/C154945302","wikidata":"https://www.wikidata.org/wiki/Q11660","display_name":"Artificial intelligence","level":1,"score":0.38580000400543213},{"id":"https://openalex.org/C126255220","wikidata":"https://www.wikidata.org/wiki/Q141495","display_name":"Mathematical optimization","level":1,"score":0.3458000123500824},{"id":"https://openalex.org/C137836250","wikidata":"https://www.wikidata.org/wiki/Q984063","display_name":"Optimization problem","level":2,"score":0.33559998869895935},{"id":"https://openalex.org/C115988155","wikidata":"https://www.wikidata.org/wiki/Q3262192","display_name":"Decision problem","level":2,"score":0.31769999861717224},{"id":"https://openalex.org/C158622935","wikidata":"https://www.wikidata.org/wiki/Q660848","display_name":"Nonlinear system","level":2,"score":0.31310001015663147},{"id":"https://openalex.org/C204323151","wikidata":"https://www.wikidata.org/wiki/Q905424","display_name":"Range (aeronautics)","level":2,"score":0.28780001401901245},{"id":"https://openalex.org/C80444323","wikidata":"https://www.wikidata.org/wiki/Q2878974","display_name":"Theoretical computer science","level":1,"score":0.2775000035762787},{"id":"https://openalex.org/C2777303404","wikidata":"https://www.wikidata.org/wiki/Q759757","display_name":"Convergence (economics)","level":2,"score":0.2662999927997589},{"id":"https://openalex.org/C177142836","wikidata":"https://www.wikidata.org/wiki/Q44455","display_name":"Game theory","level":2,"score":0.2644999921321869},{"id":"https://openalex.org/C28901747","wikidata":"https://www.wikidata.org/wiki/Q177571","display_name":"Decision theory","level":2,"score":0.26409998536109924},{"id":"https://openalex.org/C150325174","wikidata":"https://www.wikidata.org/wiki/Q4335500","display_name":"Optimal decision","level":3,"score":0.2623000144958496},{"id":"https://openalex.org/C107327155","wikidata":"https://www.wikidata.org/wiki/Q330268","display_name":"Decision support system","level":2,"score":0.2615000009536743}],"mesh":[],"locations_count":1,"locations":[{"id":"doi:10.48550/arxiv.2602.15252","is_oa":true,"landing_page_url":"https://doi.org/10.48550/arxiv.2602.15252","pdf_url":null,"source":{"id":"https://openalex.org/S4306400194","display_name":"arXiv (Cornell University)","issn_l":null,"issn":null,"is_oa":true,"is_in_doaj":false,"is_core":false,"host_organization":"https://openalex.org/I205783295","host_organization_name":"Cornell University","host_organization_lineage":["https://openalex.org/I205783295"],"host_organization_lineage_names":[],"type":"repository"},"license":null,"license_id":null,"version":null,"is_accepted":false,"is_published":null,"raw_source_name":null,"raw_type":"article"}],"best_oa_location":{"id":"doi:10.48550/arxiv.2602.15252","is_oa":true,"landing_page_url":"https://doi.org/10.48550/arxiv.2602.15252","pdf_url":null,"source":{"id":"https://openalex.org/S4306400194","display_name":"arXiv (Cornell University)","issn_l":null,"issn":null,"is_oa":true,"is_in_doaj":false,"is_core":false,"host_organization":"https://openalex.org/I205783295","host_organization_name":"Cornell University","host_organization_lineage":["https://openalex.org/I205783295"],"host_organization_lineage_names":[],"type":"repository"},"license":null,"license_id":null,"version":null,"is_accepted":false,"is_published":false,"raw_source_name":null,"raw_type":"article"},"sustainable_development_goals":[{"display_name":"Peace, Justice and strong institutions","id":"https://metadata.un.org/sdg/16","score":0.8344374299049377}],"awards":[],"funders":[],"has_content":{"pdf":false,"grobid_xml":false},"content_urls":null,"referenced_works_count":0,"referenced_works":[],"related_works":[],"abstract_inverted_index":{"In":[0,31,95],"game":[1],"theory,":[2],"imperfect-recall":[3,41],"decision":[4,42],"problems":[5],"model":[6],"situations":[7],"in":[8,56,70,92,119],"which":[9],"an":[10],"agent":[11],"forgets":[12],"information":[13],"it":[14],"held":[15],"before.":[16],"They":[17],"encompass":[18],"games":[19,27],"such":[20,93,148],"as":[21,149,167],"the":[22,36,82,99,161,164],"``absentminded":[23],"driver''":[24],"and":[25,63],"team":[26],"with":[28],"limited":[29],"communication.":[30],"this":[32,78],"paper,":[33],"we":[34,80,97],"introduce":[35,98],"first":[37,162],"benchmark":[38],"suite":[39],"for":[40,87,106,160],"problems.":[43,94,175],"Our":[44,135],"benchmarks":[45],"capture":[46],"a":[47,168],"variety":[48],"of":[49,68,84,101,112,156],"problem":[50,74],"types,":[51],"including":[52],"ones":[53],"concerning":[54],"privacy":[55],"AI":[57,64],"systems":[58],"that":[59,133,139],"elicit":[60],"sensitive":[61],"information,":[62],"safety":[65],"via":[66],"testing":[67],"agents":[69],"simulation.":[71],"Across":[72],"61":[73],"instances":[75],"generated":[76],"using":[77],"suite,":[79],"evaluate":[81],"performance":[83],"different":[85],"algorithms":[86,105,114,141],"finding":[88,137],"first-order":[89,146],"optimal":[90],"strategies":[91],"particular,":[96],"family":[100,166],"regret":[102],"matching":[103],"(RM)":[104],"nonlinear":[107],"constrained":[108,173],"optimization.":[109],"This":[110,158],"class":[111],"parameter-free":[113],"has":[115],"enjoyed":[116],"tremendous":[117],"success":[118],"solving":[120],"large":[121],"two-player":[122],"zero-sum":[123],"games,":[124],"but,":[125],"surprisingly,":[126],"they":[127],"were":[128],"hitherto":[129],"relatively":[130],"unexplored":[131],"beyond":[132],"setting.":[134],"key":[136],"is":[138],"RM":[140,165],"consistently":[142],"outperform":[143],"commonly":[144],"employed":[145],"optimizers":[147],"projected":[150],"gradient":[151],"descent,":[152],"often":[153],"by":[154],"orders":[155],"magnitude.":[157],"establishes,":[159],"time,":[163],"formidable":[169],"approach":[170],"to":[171],"large-scale":[172],"optimization":[174]},"counts_by_year":[],"updated_date":"2026-06-11T09:08:48.828518","created_date":"2026-02-19T00:00:00"}