{"id":"https://openalex.org/W7138200244","doi":"https://doi.org/10.1609/aaai.v40i21.38822","title":"Inferring Heterogeneous Private Valuations from Offline Market Data via Entropic Risk-Sensitive Utility Maximization","display_name":"Inferring Heterogeneous Private Valuations from Offline Market Data via Entropic Risk-Sensitive Utility Maximization","publication_year":2026,"publication_date":"2026-03-14","ids":{"openalex":"https://openalex.org/W7138200244","doi":"https://doi.org/10.1609/aaai.v40i21.38822"},"language":"en","primary_location":{"id":"doi:10.1609/aaai.v40i21.38822","is_oa":true,"landing_page_url":"https://doi.org/10.1609/aaai.v40i21.38822","pdf_url":null,"source":{"id":"https://openalex.org/S4210191458","display_name":"Proceedings of the AAAI Conference on Artificial Intelligence","issn_l":"2159-5399","issn":["2159-5399","2374-3468"],"is_oa":true,"is_in_doaj":false,"is_core":false,"host_organization":"https://openalex.org/P4310320058","host_organization_name":"Association for the Advancement of Artificial Intelligence","host_organization_lineage":["https://openalex.org/P4310320058"],"host_organization_lineage_names":["Association for the Advancement of Artificial Intelligence"],"type":"conference"},"license":null,"license_id":null,"version":"publishedVersion","is_accepted":true,"is_published":true,"raw_source_name":"Proceedings of the AAAI Conference on Artificial Intelligence","raw_type":"journal-article"},"type":"article","indexed_in":["crossref"],"open_access":{"is_oa":true,"oa_status":"diamond","oa_url":"https://doi.org/10.1609/aaai.v40i21.38822","any_repository_has_fulltext":null},"authorships":[{"author_position":"first","author":{"id":"https://openalex.org/A5129655355","display_name":"Xingyu Qian","orcid":null},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Xingyu Qian","raw_affiliation_strings":[],"raw_orcid":null,"affiliations":[]},{"author_position":"last","author":{"id":"https://openalex.org/A5129746443","display_name":"Haoran Yu","orcid":null},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Haoran Yu","raw_affiliation_strings":[],"raw_orcid":null,"affiliations":[]}],"institutions":[],"countries_distinct_count":0,"institutions_distinct_count":2,"corresponding_author_ids":[],"corresponding_institution_ids":[],"apc_list":null,"apc_paid":null,"fwci":0.0,"has_fulltext":true,"cited_by_count":0,"citation_normalized_percentile":{"value":0.30215827,"is_in_top_1_percent":false,"is_in_top_10_percent":false},"cited_by_percentile_year":null,"biblio":{"volume":"40","issue":"21","first_page":"17661","last_page":"17669"},"is_retracted":false,"is_paratext":false,"is_xpac":false,"primary_topic":{"id":"https://openalex.org/T11182","display_name":"Auction Theory and Applications","score":0.6032999753952026,"subfield":{"id":"https://openalex.org/subfields/1803","display_name":"Management Science and Operations Research"},"field":{"id":"https://openalex.org/fields/18","display_name":"Decision Sciences"},"domain":{"id":"https://openalex.org/domains/2","display_name":"Social Sciences"}},"topics":[{"id":"https://openalex.org/T11182","display_name":"Auction Theory and Applications","score":0.6032999753952026,"subfield":{"id":"https://openalex.org/subfields/1803","display_name":"Management Science and Operations Research"},"field":{"id":"https://openalex.org/fields/18","display_name":"Decision Sciences"},"domain":{"id":"https://openalex.org/domains/2","display_name":"Social Sciences"}},{"id":"https://openalex.org/T10991","display_name":"Game Theory and Voting Systems","score":0.03400000184774399,"subfield":{"id":"https://openalex.org/subfields/2002","display_name":"Economics and Econometrics"},"field":{"id":"https://openalex.org/fields/20","display_name":"Economics, Econometrics and Finance"},"domain":{"id":"https://openalex.org/domains/2","display_name":"Social Sciences"}},{"id":"https://openalex.org/T11704","display_name":"Mobile Crowdsensing and Crowdsourcing","score":0.03099999949336052,"subfield":{"id":"https://openalex.org/subfields/1706","display_name":"Computer Science Applications"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}}],"keywords":[{"id":"https://openalex.org/keywords/reinforcement-learning","display_name":"Reinforcement learning","score":0.5054000020027161},{"id":"https://openalex.org/keywords/function","display_name":"Function (biology)","score":0.4812999963760376},{"id":"https://openalex.org/keywords/flexibility","display_name":"Flexibility (engineering)","score":0.46140000224113464},{"id":"https://openalex.org/keywords/core","display_name":"Core (optical fiber)","score":0.447299987077713},{"id":"https://openalex.org/keywords/revealed-preference","display_name":"Revealed preference","score":0.4032999873161316},{"id":"https://openalex.org/keywords/preference","display_name":"Preference","score":0.38769999146461487},{"id":"https://openalex.org/keywords/generative-grammar","display_name":"Generative grammar","score":0.3671000003814697},{"id":"https://openalex.org/keywords/utility-maximization-problem","display_name":"Utility maximization problem","score":0.3424000144004822},{"id":"https://openalex.org/keywords/ask-price","display_name":"Ask price","score":0.3398999869823456}],"concepts":[{"id":"https://openalex.org/C41008148","wikidata":"https://www.wikidata.org/wiki/Q21198","display_name":"Computer science","level":0,"score":0.6373000144958496},{"id":"https://openalex.org/C97541855","wikidata":"https://www.wikidata.org/wiki/Q830687","display_name":"Reinforcement learning","level":2,"score":0.5054000020027161},{"id":"https://openalex.org/C154945302","wikidata":"https://www.wikidata.org/wiki/Q11660","display_name":"Artificial intelligence","level":1,"score":0.5015000104904175},{"id":"https://openalex.org/C14036430","wikidata":"https://www.wikidata.org/wiki/Q3736076","display_name":"Function (biology)","level":2,"score":0.4812999963760376},{"id":"https://openalex.org/C119857082","wikidata":"https://www.wikidata.org/wiki/Q2539","display_name":"Machine learning","level":1,"score":0.462799996137619},{"id":"https://openalex.org/C2780598303","wikidata":"https://www.wikidata.org/wiki/Q65921492","display_name":"Flexibility (engineering)","level":2,"score":0.46140000224113464},{"id":"https://openalex.org/C2164484","wikidata":"https://www.wikidata.org/wiki/Q5170150","display_name":"Core (optical fiber)","level":2,"score":0.447299987077713},{"id":"https://openalex.org/C2779110102","wikidata":"https://www.wikidata.org/wiki/Q1323737","display_name":"Revealed preference","level":2,"score":0.4032999873161316},{"id":"https://openalex.org/C2781249084","wikidata":"https://www.wikidata.org/wiki/Q908656","display_name":"Preference","level":2,"score":0.38769999146461487},{"id":"https://openalex.org/C39890363","wikidata":"https://www.wikidata.org/wiki/Q36108","display_name":"Generative grammar","level":2,"score":0.3671000003814697},{"id":"https://openalex.org/C2779044140","wikidata":"https://www.wikidata.org/wiki/Q3274096","display_name":"Utility maximization problem","level":3,"score":0.3424000144004822},{"id":"https://openalex.org/C90329073","wikidata":"https://www.wikidata.org/wiki/Q914232","display_name":"Ask price","level":2,"score":0.3398999869823456},{"id":"https://openalex.org/C167966045","wikidata":"https://www.wikidata.org/wiki/Q5532625","display_name":"Generative model","level":3,"score":0.32339999079704285},{"id":"https://openalex.org/C2539976","wikidata":"https://www.wikidata.org/wiki/Q12163285","display_name":"Double auction","level":3,"score":0.3197000026702881},{"id":"https://openalex.org/C2779721758","wikidata":"https://www.wikidata.org/wiki/Q400707","display_name":"Market manipulation","level":2,"score":0.31790000200271606},{"id":"https://openalex.org/C109354906","wikidata":"https://www.wikidata.org/wiki/Q6015174","display_name":"Incomplete markets","level":2,"score":0.29840001463890076},{"id":"https://openalex.org/C126255220","wikidata":"https://www.wikidata.org/wiki/Q141495","display_name":"Mathematical optimization","level":1,"score":0.29649999737739563},{"id":"https://openalex.org/C131562839","wikidata":"https://www.wikidata.org/wiki/Q1574928","display_name":"Trading strategy","level":2,"score":0.29409998655319214},{"id":"https://openalex.org/C50644808","wikidata":"https://www.wikidata.org/wiki/Q192776","display_name":"Artificial neural network","level":2,"score":0.28540000319480896},{"id":"https://openalex.org/C160920958","wikidata":"https://www.wikidata.org/wiki/Q7662746","display_name":"Synthetic data","level":2,"score":0.2816999852657318},{"id":"https://openalex.org/C114118609","wikidata":"https://www.wikidata.org/wiki/Q3036837","display_name":"Market data","level":2,"score":0.28040000796318054},{"id":"https://openalex.org/C2776330181","wikidata":"https://www.wikidata.org/wiki/Q18358244","display_name":"Maximization","level":2,"score":0.2727000117301941},{"id":"https://openalex.org/C2777780509","wikidata":"https://www.wikidata.org/wiki/Q1377422","display_name":"Profit maximization","level":3,"score":0.2709999978542328},{"id":"https://openalex.org/C22171661","wikidata":"https://www.wikidata.org/wiki/Q1074380","display_name":"Stochastic game","level":2,"score":0.2685000002384186},{"id":"https://openalex.org/C2780980858","wikidata":"https://www.wikidata.org/wiki/Q110022","display_name":"Dual (grammatical number)","level":2,"score":0.26669999957084656},{"id":"https://openalex.org/C84525736","wikidata":"https://www.wikidata.org/wiki/Q831366","display_name":"Decision tree","level":2,"score":0.26350000500679016},{"id":"https://openalex.org/C78508483","wikidata":"https://www.wikidata.org/wiki/Q139445","display_name":"Algorithmic trading","level":2,"score":0.2549999952316284},{"id":"https://openalex.org/C115988155","wikidata":"https://www.wikidata.org/wiki/Q3262192","display_name":"Decision problem","level":2,"score":0.251800000667572}],"mesh":[],"locations_count":2,"locations":[{"id":"doi:10.1609/aaai.v40i21.38822","is_oa":true,"landing_page_url":"https://doi.org/10.1609/aaai.v40i21.38822","pdf_url":null,"source":{"id":"https://openalex.org/S4210191458","display_name":"Proceedings of the AAAI Conference on Artificial Intelligence","issn_l":"2159-5399","issn":["2159-5399","2374-3468"],"is_oa":true,"is_in_doaj":false,"is_core":false,"host_organization":"https://openalex.org/P4310320058","host_organization_name":"Association for the Advancement of Artificial Intelligence","host_organization_lineage":["https://openalex.org/P4310320058"],"host_organization_lineage_names":["Association for the Advancement of Artificial Intelligence"],"type":"conference"},"license":null,"license_id":null,"version":"publishedVersion","is_accepted":true,"is_published":true,"raw_source_name":"Proceedings of the AAAI Conference on Artificial Intelligence","raw_type":"journal-article"},{"id":"pmh:oai:ojs.aaai.org:article/38822","is_oa":true,"landing_page_url":"https://ojs.aaai.org/index.php/AAAI/article/view/38822","pdf_url":"https://ojs.aaai.org/index.php/AAAI/article/download/38822/42784","source":null,"license":null,"license_id":null,"version":"submittedVersion","is_accepted":false,"is_published":false,"raw_source_name":"2159-5399","raw_type":"info:eu-repo/semantics/publishedVersion"}],"best_oa_location":{"id":"doi:10.1609/aaai.v40i21.38822","is_oa":true,"landing_page_url":"https://doi.org/10.1609/aaai.v40i21.38822","pdf_url":null,"source":{"id":"https://openalex.org/S4210191458","display_name":"Proceedings of the AAAI Conference on Artificial Intelligence","issn_l":"2159-5399","issn":["2159-5399","2374-3468"],"is_oa":true,"is_in_doaj":false,"is_core":false,"host_organization":"https://openalex.org/P4310320058","host_organization_name":"Association for the Advancement of Artificial Intelligence","host_organization_lineage":["https://openalex.org/P4310320058"],"host_organization_lineage_names":["Association for the Advancement of Artificial Intelligence"],"type":"conference"},"license":null,"license_id":null,"version":"publishedVersion","is_accepted":true,"is_published":true,"raw_source_name":"Proceedings of the AAAI Conference on Artificial Intelligence","raw_type":"journal-article"},"sustainable_development_goals":[{"score":0.4296766519546509,"display_name":"Peace, Justice and strong institutions","id":"https://metadata.un.org/sdg/16"}],"awards":[{"id":"https://openalex.org/G4551847579","display_name":null,"funder_award_id":"62202050","funder_id":"https://openalex.org/F4320321001","funder_display_name":"National Natural Science Foundation of China"}],"funders":[{"id":"https://openalex.org/F4320321001","display_name":"National Natural Science Foundation of China","ror":"https://ror.org/01h0zpd94"},{"id":"https://openalex.org/F4320323110","display_name":"Beijing Institute of Technology","ror":"https://ror.org/01skt4w74"},{"id":"https://openalex.org/F4320327514","display_name":"Beijing Institute of Technology Research Fund Program for Young Scholars","ror":null}],"has_content":{"grobid_xml":false,"pdf":false},"content_urls":null,"referenced_works_count":0,"referenced_works":[],"related_works":[],"abstract_inverted_index":{"Inferring":[0],"humans'":[1],"private":[2,34,70,171],"valuations":[3,35,71,88,172],"for":[4,13,159],"goods":[5],"from":[6,89],"their":[7],"observed":[8,37],"market":[9,15,38,44],"behavior":[10],"is":[11],"essential":[12],"evaluating":[14],"efficiency":[16],"and":[17,36,81,116,137,148,173],"improving":[18],"trading":[19,122],"mechanism":[20],"design.":[21],"A":[22],"core":[23],"challenge":[24,80],"lies":[25],"in":[26,51,93,194],"uncovering":[27],"the":[28,57,100,160],"human":[29,87,197],"decision":[30,62,91,101,157],"function":[31,102,158],"that":[32,188],"maps":[33],"states":[39],"to":[40,59,69,84,119,152,168],"actions.":[41],"In":[42],"complex":[43],"settings":[45],"where":[46],"humans":[47],"make":[48],"sequential":[49],"decisions":[50],"stochastic":[52],"environments,":[53],"neural":[54],"networks":[55],"offer":[56],"flexibility":[58],"model":[60,112],"this":[61,79,125],"function.":[63],"However,":[64],"training":[65],"them":[66],"without":[67],"access":[68],"or":[72],"environment":[73],"dynamics":[74],"remains":[75],"challenging.":[76],"We":[77,97],"tackle":[78],"study":[82],"how":[83],"infer":[85],"heterogeneous":[86],"offline":[90,114],"data":[92,118],"continuous":[94,183],"double":[95,184],"auctions.":[96],"propose":[98],"learning":[99,151],"via":[103],"risk\u2011sensitive":[104],"utility":[105],"maximization.":[106],"First,":[107],"we":[108,128,140,163],"train":[109],"a":[110,154,165,181],"generative":[111,126],"on":[113,180],"bid":[115],"ask":[117],"simulate":[120],"individual":[121],"behavior.":[123],"Using":[124],"model,":[127],"instantiate":[129],"simulated":[130,146],"markets":[131,147],"composed":[132],"of":[133],"randomly":[134],"generated":[135],"buyers":[136],"sellers.":[138],"Second,":[139],"introduce":[141],"an":[142],"agent":[143],"into":[144],"these":[145],"use":[149],"reinforcement":[150],"learn":[153],"risk-sensitive":[155],"utility-maximizing":[156],"agent.":[161],"Third,":[162],"formulate":[164],"bilevel":[166],"optimization":[167],"jointly":[169],"recover":[170],"risk":[174],"preference":[175],"parameters.":[176],"Our":[177],"extensive":[178],"experiments":[179],"large\u2011scale":[182],"auction":[185],"dataset":[186],"demonstrate":[187],"our":[189],"framework":[190],"significantly":[191],"reduces":[192],"errors":[193],"inferring":[195],"real":[196],"valuations.":[198]},"counts_by_year":[],"updated_date":"2026-06-11T09:08:48.828518","created_date":"2026-03-18T00:00:00"}