{"id":"https://openalex.org/W3182669049","doi":"https://doi.org/10.1145/3465456.3467576","title":"Better Regularization for Sequential Decision Spaces","display_name":"Better Regularization for Sequential Decision Spaces","publication_year":2021,"publication_date":"2021-07-18","ids":{"openalex":"https://openalex.org/W3182669049","doi":"https://doi.org/10.1145/3465456.3467576","mag":"3182669049"},"language":"en","primary_location":{"id":"doi:10.1145/3465456.3467576","is_oa":true,"landing_page_url":"https://doi.org/10.1145/3465456.3467576","pdf_url":"https://dl.acm.org/doi/pdf/10.1145/3465456.3467576","source":null,"license":null,"license_id":null,"version":"publishedVersion","is_accepted":true,"is_published":true,"raw_source_name":"Proceedings of the 22nd ACM Conference on Economics and Computation","raw_type":"proceedings-article"},"type":"article","indexed_in":["crossref"],"open_access":{"is_oa":true,"oa_status":"gold","oa_url":"https://dl.acm.org/doi/pdf/10.1145/3465456.3467576","any_repository_has_fulltext":null},"authorships":[{"author_position":"first","author":{"id":"https://openalex.org/A5070571735","display_name":"Gabriele Farina","orcid":"https://orcid.org/0000-0002-3976-0061"},"institutions":[{"id":"https://openalex.org/I74973139","display_name":"Carnegie Mellon University","ror":"https://ror.org/05x2bcf33","country_code":"US","type":"education","lineage":["https://openalex.org/I74973139"]}],"countries":["US"],"is_corresponding":true,"raw_author_name":"Gabriele Farina","raw_affiliation_strings":["Carnegie Mellon University, Pittsburgh, PA, USA"],"affiliations":[{"raw_affiliation_string":"Carnegie Mellon University, Pittsburgh, PA, USA","institution_ids":["https://openalex.org/I74973139"]}]},{"author_position":"middle","author":{"id":"https://openalex.org/A5083207349","display_name":"Christian Kroer","orcid":"https://orcid.org/0000-0002-9009-8683"},"institutions":[{"id":"https://openalex.org/I78577930","display_name":"Columbia University","ror":"https://ror.org/00hj8s172","country_code":"US","type":"education","lineage":["https://openalex.org/I78577930"]}],"countries":["US"],"is_corresponding":false,"raw_author_name":"Christian Kroer","raw_affiliation_strings":["Columbia University, New York City, NY, USA"],"affiliations":[{"raw_affiliation_string":"Columbia University, New York City, NY, USA","institution_ids":["https://openalex.org/I78577930"]}]},{"author_position":"last","author":{"id":"https://openalex.org/A5023571961","display_name":"T\u00fcomas Sandholm","orcid":"https://orcid.org/0000-0001-8861-9366"},"institutions":[{"id":"https://openalex.org/I74973139","display_name":"Carnegie Mellon University","ror":"https://ror.org/05x2bcf33","country_code":"US","type":"education","lineage":["https://openalex.org/I74973139"]}],"countries":["US"],"is_corresponding":false,"raw_author_name":"Tuomas Sandholm","raw_affiliation_strings":["Carnegie Mellon University, Strategic Machine, Inc., Strategy Robot, Inc. &amp; Optimized Markets, Inc., Pittsburgh, PA, USA"],"affiliations":[{"raw_affiliation_string":"Carnegie Mellon University, Strategic Machine, Inc., Strategy Robot, Inc. &amp; Optimized Markets, Inc., Pittsburgh, PA, USA","institution_ids":["https://openalex.org/I74973139"]}]}],"institutions":[],"countries_distinct_count":1,"institutions_distinct_count":3,"corresponding_author_ids":["https://openalex.org/A5070571735"],"corresponding_institution_ids":["https://openalex.org/I74973139"],"apc_list":null,"apc_paid":null,"fwci":0.6059,"has_fulltext":false,"cited_by_count":4,"citation_normalized_percentile":{"value":0.72109696,"is_in_top_1_percent":false,"is_in_top_10_percent":false},"cited_by_percentile_year":{"min":89,"max":96},"biblio":{"volume":null,"issue":null,"first_page":"432","last_page":"432"},"is_retracted":false,"is_paratext":false,"is_xpac":false,"primary_topic":{"id":"https://openalex.org/T10545","display_name":"Optimization and Variational Analysis","score":0.9771000146865845,"subfield":{"id":"https://openalex.org/subfields/1703","display_name":"Computational Theory and Mathematics"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},"topics":[{"id":"https://openalex.org/T10545","display_name":"Optimization and Variational Analysis","score":0.9771000146865845,"subfield":{"id":"https://openalex.org/subfields/1703","display_name":"Computational Theory and Mathematics"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T10315","display_name":"Decision-Making and Behavioral Economics","score":0.9761000275611877,"subfield":{"id":"https://openalex.org/subfields/1800","display_name":"General Decision Sciences"},"field":{"id":"https://openalex.org/fields/18","display_name":"Decision Sciences"},"domain":{"id":"https://openalex.org/domains/2","display_name":"Social Sciences"}},{"id":"https://openalex.org/T12101","display_name":"Advanced Bandit Algorithms Research","score":0.9726999998092651,"subfield":{"id":"https://openalex.org/subfields/1803","display_name":"Management Science and Operations Research"},"field":{"id":"https://openalex.org/fields/18","display_name":"Decision Sciences"},"domain":{"id":"https://openalex.org/domains/2","display_name":"Social Sciences"}}],"keywords":[{"id":"https://openalex.org/keywords/computer-science","display_name":"Computer science","score":0.657831072807312},{"id":"https://openalex.org/keywords/convexity","display_name":"Convexity","score":0.6377572417259216},{"id":"https://openalex.org/keywords/mathematical-optimization","display_name":"Mathematical optimization","score":0.5652863383293152},{"id":"https://openalex.org/keywords/regularization","display_name":"Regularization (linguistics)","score":0.5365912914276123},{"id":"https://openalex.org/keywords/entropy","display_name":"Entropy (arrow of time)","score":0.519228994846344},{"id":"https://openalex.org/keywords/nash-equilibrium","display_name":"Nash equilibrium","score":0.5026154518127441},{"id":"https://openalex.org/keywords/convergence","display_name":"Convergence (economics)","score":0.46446743607521057},{"id":"https://openalex.org/keywords/binary-entropy-function","display_name":"Binary entropy function","score":0.440945029258728},{"id":"https://openalex.org/keywords/algorithm","display_name":"Algorithm","score":0.43382498621940613},{"id":"https://openalex.org/keywords/principle-of-maximum-entropy","display_name":"Principle of maximum entropy","score":0.37310394644737244},{"id":"https://openalex.org/keywords/mathematics","display_name":"Mathematics","score":0.3545849919319153},{"id":"https://openalex.org/keywords/applied-mathematics","display_name":"Applied mathematics","score":0.3239870071411133},{"id":"https://openalex.org/keywords/artificial-intelligence","display_name":"Artificial intelligence","score":0.2021065056324005}],"concepts":[{"id":"https://openalex.org/C41008148","wikidata":"https://www.wikidata.org/wiki/Q21198","display_name":"Computer science","level":0,"score":0.657831072807312},{"id":"https://openalex.org/C72134830","wikidata":"https://www.wikidata.org/wiki/Q5166524","display_name":"Convexity","level":2,"score":0.6377572417259216},{"id":"https://openalex.org/C126255220","wikidata":"https://www.wikidata.org/wiki/Q141495","display_name":"Mathematical optimization","level":1,"score":0.5652863383293152},{"id":"https://openalex.org/C2776135515","wikidata":"https://www.wikidata.org/wiki/Q17143721","display_name":"Regularization (linguistics)","level":2,"score":0.5365912914276123},{"id":"https://openalex.org/C106301342","wikidata":"https://www.wikidata.org/wiki/Q4117933","display_name":"Entropy (arrow of time)","level":2,"score":0.519228994846344},{"id":"https://openalex.org/C46814582","wikidata":"https://www.wikidata.org/wiki/Q23389","display_name":"Nash equilibrium","level":2,"score":0.5026154518127441},{"id":"https://openalex.org/C2777303404","wikidata":"https://www.wikidata.org/wiki/Q759757","display_name":"Convergence (economics)","level":2,"score":0.46446743607521057},{"id":"https://openalex.org/C44415725","wikidata":"https://www.wikidata.org/wiki/Q4913893","display_name":"Binary entropy function","level":3,"score":0.440945029258728},{"id":"https://openalex.org/C11413529","wikidata":"https://www.wikidata.org/wiki/Q8366","display_name":"Algorithm","level":1,"score":0.43382498621940613},{"id":"https://openalex.org/C9679016","wikidata":"https://www.wikidata.org/wiki/Q1417473","display_name":"Principle of maximum entropy","level":2,"score":0.37310394644737244},{"id":"https://openalex.org/C33923547","wikidata":"https://www.wikidata.org/wiki/Q395","display_name":"Mathematics","level":0,"score":0.3545849919319153},{"id":"https://openalex.org/C28826006","wikidata":"https://www.wikidata.org/wiki/Q33521","display_name":"Applied mathematics","level":1,"score":0.3239870071411133},{"id":"https://openalex.org/C154945302","wikidata":"https://www.wikidata.org/wiki/Q11660","display_name":"Artificial intelligence","level":1,"score":0.2021065056324005},{"id":"https://openalex.org/C162324750","wikidata":"https://www.wikidata.org/wiki/Q8134","display_name":"Economics","level":0,"score":0.0},{"id":"https://openalex.org/C50522688","wikidata":"https://www.wikidata.org/wiki/Q189833","display_name":"Economic growth","level":1,"score":0.0},{"id":"https://openalex.org/C62520636","wikidata":"https://www.wikidata.org/wiki/Q944","display_name":"Quantum mechanics","level":1,"score":0.0},{"id":"https://openalex.org/C106159729","wikidata":"https://www.wikidata.org/wiki/Q2294553","display_name":"Financial economics","level":1,"score":0.0},{"id":"https://openalex.org/C121332964","wikidata":"https://www.wikidata.org/wiki/Q413","display_name":"Physics","level":0,"score":0.0}],"mesh":[],"locations_count":1,"locations":[{"id":"doi:10.1145/3465456.3467576","is_oa":true,"landing_page_url":"https://doi.org/10.1145/3465456.3467576","pdf_url":"https://dl.acm.org/doi/pdf/10.1145/3465456.3467576","source":null,"license":null,"license_id":null,"version":"publishedVersion","is_accepted":true,"is_published":true,"raw_source_name":"Proceedings of the 22nd ACM Conference on Economics and Computation","raw_type":"proceedings-article"}],"best_oa_location":{"id":"doi:10.1145/3465456.3467576","is_oa":true,"landing_page_url":"https://doi.org/10.1145/3465456.3467576","pdf_url":"https://dl.acm.org/doi/pdf/10.1145/3465456.3467576","source":null,"license":null,"license_id":null,"version":"publishedVersion","is_accepted":true,"is_published":true,"raw_source_name":"Proceedings of the 22nd ACM Conference on Economics and Computation","raw_type":"proceedings-article"},"sustainable_development_goals":[{"display_name":"Peace, Justice and strong institutions","id":"https://metadata.un.org/sdg/16","score":0.7300000190734863}],"awards":[{"id":"https://openalex.org/G5211587205","display_name":"AitF: Algorithms and Mechanisms for Kidney Exchange","funder_award_id":"1733556","funder_id":"https://openalex.org/F4320306076","funder_display_name":"National Science Foundation"},{"id":"https://openalex.org/G5700204612","display_name":null,"funder_award_id":"IIS-190","funder_id":"https://openalex.org/F4320306076","funder_display_name":"National Science Foundation"},{"id":"https://openalex.org/G5726341513","display_name":"RI: Small: New Computational Techniques and Market Designs for Kidney Exchanges and Other Barter Markets","funder_award_id":"1718457","funder_id":"https://openalex.org/F4320306076","funder_display_name":"National Science Foundation"},{"id":"https://openalex.org/G5726871993","display_name":null,"funder_award_id":"IIS-1718457,IIS-1901403,CCF-1733556","funder_id":"https://openalex.org/F4320306076","funder_display_name":"National Science Foundation"},{"id":"https://openalex.org/G6869609206","display_name":null,"funder_award_id":"W911NF2010081","funder_id":"https://openalex.org/F4320338281","funder_display_name":"Army Research Office"},{"id":"https://openalex.org/G7452299184","display_name":null,"funder_award_id":"W911NF","funder_id":"https://openalex.org/F4320338281","funder_display_name":"Army Research Office"},{"id":"https://openalex.org/G848032724","display_name":null,"funder_award_id":"Science","funder_id":"https://openalex.org/F4320306076","funder_display_name":"National Science Foundation"},{"id":"https://openalex.org/G8998121839","display_name":null,"funder_award_id":"911NF","funder_id":"https://openalex.org/F4320338281","funder_display_name":"Army Research Office"}],"funders":[{"id":"https://openalex.org/F4320306076","display_name":"National Science Foundation","ror":"https://ror.org/021nxhr62"},{"id":"https://openalex.org/F4320338281","display_name":"Army Research Office","ror":"https://ror.org/05epdh915"}],"has_content":{"pdf":true,"grobid_xml":true},"content_urls":{"pdf":"https://content.openalex.org/works/W3182669049.pdf","grobid_xml":"https://content.openalex.org/works/W3182669049.grobid-xml"},"referenced_works_count":0,"referenced_works":[],"related_works":["https://openalex.org/W2575378359","https://openalex.org/W2963163002","https://openalex.org/W1672097335","https://openalex.org/W4297751392","https://openalex.org/W2172205801","https://openalex.org/W2064875109","https://openalex.org/W32935261","https://openalex.org/W2176894780","https://openalex.org/W2098475155","https://openalex.org/W2889261288"],"abstract_inverted_index":{"We":[0],"study":[1],"the":[2,9,35,39,42,48,60,90,95],"application":[3],"of":[4,11,14,38,44],"iterative":[5],"first-order":[6],"methods":[7,20],"to":[8],"problem":[10],"computing":[12],"equilibria":[13],"large-scale":[15],"two-player":[16,45,75],"extensive-form":[17],"games.":[18],"First-order":[19],"must":[21],"typically":[22],"be":[23],"instantiated":[24],"with":[25],"a":[26,31,69],"regularizer":[27],"that":[28,80,105],"serves":[29],"as":[30,115],"distance-generating":[32,72],"function":[33,73,82],"for":[34,53,74],"decision":[36],"sets":[37],"players.":[40],"For":[41],"case":[43],"zero-sum":[46,76],"games,":[47,77],"state-of-the-art":[49],"theoretical":[50,108],"convergence":[51],"rate":[52],"Nash":[54],"equilibrium":[55],"is":[56],"achieved":[57],"by":[58],"using":[59],"dilated":[61,91],"entropy":[62],"function.":[63],"In":[64],"this":[65,81],"paper,":[66],"we":[67],"introduce":[68],"new":[70],"entropy-based":[71],"and":[78],"show":[79,104],"achieves":[83],"significantly":[84],"better":[85,112],"strong":[86],"convexity":[87],"properties":[88,109],"than":[89],"entropy,":[92],"while":[93],"maintaining":[94],"same":[96],"easily-implemented":[97],"closed-form":[98],"proximal":[99],"mapping.":[100],"Extensive":[101],"numerical":[102,113],"simulations":[103],"these":[106],"superior":[107],"translate":[110],"into":[111],"performance":[114],"well.":[116]},"counts_by_year":[{"year":2024,"cited_by_count":2},{"year":2022,"cited_by_count":1},{"year":2021,"cited_by_count":1}],"updated_date":"2026-04-10T15:06:20.359241","created_date":"2025-10-10T00:00:00"}