{"id":"https://openalex.org/W3126605566","doi":"https://doi.org/10.1137/19m1268410","title":"Distributionally Robust Partially Observable Markov Decision Process with Moment-Based Ambiguity","display_name":"Distributionally Robust Partially Observable Markov Decision Process with Moment-Based Ambiguity","publication_year":2021,"publication_date":"2021-01-01","ids":{"openalex":"https://openalex.org/W3126605566","doi":"https://doi.org/10.1137/19m1268410","mag":"3126605566"},"language":"en","primary_location":{"id":"doi:10.1137/19m1268410","is_oa":false,"landing_page_url":"https://doi.org/10.1137/19m1268410","pdf_url":null,"source":{"id":"https://openalex.org/S928796702","display_name":"SIAM Journal on Optimization","issn_l":"1052-6234","issn":["1052-6234","1095-7189"],"is_oa":false,"is_in_doaj":false,"is_core":true,"host_organization":"https://openalex.org/P4310320508","host_organization_name":"Society for Industrial and Applied Mathematics","host_organization_lineage":["https://openalex.org/P4310320508"],"host_organization_lineage_names":["Society for Industrial and Applied Mathematics"],"type":"journal"},"license":null,"license_id":null,"version":"publishedVersion","is_accepted":true,"is_published":true,"raw_source_name":"SIAM Journal on Optimization","raw_type":"journal-article"},"type":"article","indexed_in":["crossref"],"open_access":{"is_oa":true,"oa_status":"green","oa_url":"https://www.osti.gov/servlets/purl/1785682","any_repository_has_fulltext":true},"authorships":[{"author_position":"first","author":{"id":"https://openalex.org/A5022734530","display_name":"Hideaki Nakao","orcid":null},"institutions":[{"id":"https://openalex.org/I27837315","display_name":"University of Michigan","ror":"https://ror.org/00jmfr291","country_code":"US","type":"education","lineage":["https://openalex.org/I27837315"]}],"countries":["US"],"is_corresponding":false,"raw_author_name":"Hideaki Nakao","raw_affiliation_strings":["Univ. of Michigan, Ann Arbor, MI (United States)"],"raw_orcid":null,"affiliations":[{"raw_affiliation_string":"Univ. of Michigan, Ann Arbor, MI (United States)","institution_ids":["https://openalex.org/I27837315"]}]},{"author_position":"middle","author":{"id":"https://openalex.org/A5087268135","display_name":"Ruiwei Jiang","orcid":"https://orcid.org/0000-0002-3941-5057"},"institutions":[{"id":"https://openalex.org/I27837315","display_name":"University of Michigan","ror":"https://ror.org/00jmfr291","country_code":"US","type":"education","lineage":["https://openalex.org/I27837315"]}],"countries":["US"],"is_corresponding":false,"raw_author_name":"Ruiwei Jiang","raw_affiliation_strings":["Univ. of Michigan, Ann Arbor, MI (United States)"],"raw_orcid":"https://orcid.org/0000-0002-3941-5057","affiliations":[{"raw_affiliation_string":"Univ. of Michigan, Ann Arbor, MI (United States)","institution_ids":["https://openalex.org/I27837315"]}]},{"author_position":"last","author":{"id":"https://openalex.org/A5029271681","display_name":"Siqian Shen","orcid":"https://orcid.org/0000-0002-2854-163X"},"institutions":[{"id":"https://openalex.org/I27837315","display_name":"University of Michigan","ror":"https://ror.org/00jmfr291","country_code":"US","type":"education","lineage":["https://openalex.org/I27837315"]}],"countries":["US"],"is_corresponding":false,"raw_author_name":"Siqian Shen","raw_affiliation_strings":["Univ. of Michigan, Ann Arbor, MI (United States)"],"raw_orcid":"https://orcid.org/0000-0002-2854-163X","affiliations":[{"raw_affiliation_string":"Univ. of Michigan, Ann Arbor, MI (United States)","institution_ids":["https://openalex.org/I27837315"]}]}],"institutions":[],"countries_distinct_count":1,"institutions_distinct_count":3,"corresponding_author_ids":[],"corresponding_institution_ids":[],"apc_list":null,"apc_paid":null,"fwci":1.9717,"has_fulltext":true,"cited_by_count":16,"citation_normalized_percentile":{"value":0.85868843,"is_in_top_1_percent":false,"is_in_top_10_percent":false},"cited_by_percentile_year":{"min":94,"max":98},"biblio":{"volume":"31","issue":"1","first_page":"461","last_page":"488"},"is_retracted":false,"is_paratext":false,"is_xpac":false,"primary_topic":{"id":"https://openalex.org/T11413","display_name":"Risk and Portfolio Optimization","score":0.9972000122070312,"subfield":{"id":"https://openalex.org/subfields/1803","display_name":"Management Science and Operations Research"},"field":{"id":"https://openalex.org/fields/18","display_name":"Decision Sciences"},"domain":{"id":"https://openalex.org/domains/2","display_name":"Social Sciences"}},"topics":[{"id":"https://openalex.org/T11413","display_name":"Risk and Portfolio Optimization","score":0.9972000122070312,"subfield":{"id":"https://openalex.org/subfields/1803","display_name":"Management Science and Operations Research"},"field":{"id":"https://openalex.org/fields/18","display_name":"Decision Sciences"},"domain":{"id":"https://openalex.org/domains/2","display_name":"Social Sciences"}},{"id":"https://openalex.org/T10462","display_name":"Reinforcement Learning in Robotics","score":0.9811999797821045,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T11303","display_name":"Bayesian Modeling and Causal Inference","score":0.9781000018119812,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}}],"keywords":[{"id":"https://openalex.org/keywords/partially-observable-markov-decision-process","display_name":"Partially observable Markov decision process","score":0.9479986429214478},{"id":"https://openalex.org/keywords/mathematical-optimization","display_name":"Mathematical optimization","score":0.6559210419654846},{"id":"https://openalex.org/keywords/mathematics","display_name":"Mathematics","score":0.6535433530807495},{"id":"https://openalex.org/keywords/markov-decision-process","display_name":"Markov decision process","score":0.5930135250091553},{"id":"https://openalex.org/keywords/bounded-function","display_name":"Bounded function","score":0.5454592704772949},{"id":"https://openalex.org/keywords/ambiguity","display_name":"Ambiguity","score":0.47597092390060425},{"id":"https://openalex.org/keywords/observable","display_name":"Observable","score":0.46269258856773376},{"id":"https://openalex.org/keywords/heuristic","display_name":"Heuristic","score":0.4599456191062927},{"id":"https://openalex.org/keywords/probability-distribution","display_name":"Probability distribution","score":0.44389891624450684},{"id":"https://openalex.org/keywords/joint-probability-distribution","display_name":"Joint probability distribution","score":0.4183042347431183},{"id":"https://openalex.org/keywords/piecewise","display_name":"Piecewise","score":0.4133550524711609},{"id":"https://openalex.org/keywords/markov-process","display_name":"Markov process","score":0.41054415702819824},{"id":"https://openalex.org/keywords/computer-science","display_name":"Computer science","score":0.2556016445159912},{"id":"https://openalex.org/keywords/statistics","display_name":"Statistics","score":0.1359071135520935}],"concepts":[{"id":"https://openalex.org/C17098449","wikidata":"https://www.wikidata.org/wiki/Q176814","display_name":"Partially observable Markov decision process","level":4,"score":0.9479986429214478},{"id":"https://openalex.org/C126255220","wikidata":"https://www.wikidata.org/wiki/Q141495","display_name":"Mathematical optimization","level":1,"score":0.6559210419654846},{"id":"https://openalex.org/C33923547","wikidata":"https://www.wikidata.org/wiki/Q395","display_name":"Mathematics","level":0,"score":0.6535433530807495},{"id":"https://openalex.org/C106189395","wikidata":"https://www.wikidata.org/wiki/Q176789","display_name":"Markov decision process","level":3,"score":0.5930135250091553},{"id":"https://openalex.org/C34388435","wikidata":"https://www.wikidata.org/wiki/Q2267362","display_name":"Bounded function","level":2,"score":0.5454592704772949},{"id":"https://openalex.org/C2780522230","wikidata":"https://www.wikidata.org/wiki/Q1140419","display_name":"Ambiguity","level":2,"score":0.47597092390060425},{"id":"https://openalex.org/C32848918","wikidata":"https://www.wikidata.org/wiki/Q845789","display_name":"Observable","level":2,"score":0.46269258856773376},{"id":"https://openalex.org/C173801870","wikidata":"https://www.wikidata.org/wiki/Q201413","display_name":"Heuristic","level":2,"score":0.4599456191062927},{"id":"https://openalex.org/C149441793","wikidata":"https://www.wikidata.org/wiki/Q200726","display_name":"Probability distribution","level":2,"score":0.44389891624450684},{"id":"https://openalex.org/C18653775","wikidata":"https://www.wikidata.org/wiki/Q1333358","display_name":"Joint probability distribution","level":2,"score":0.4183042347431183},{"id":"https://openalex.org/C164660894","wikidata":"https://www.wikidata.org/wiki/Q2037833","display_name":"Piecewise","level":2,"score":0.4133550524711609},{"id":"https://openalex.org/C159886148","wikidata":"https://www.wikidata.org/wiki/Q176645","display_name":"Markov process","level":2,"score":0.41054415702819824},{"id":"https://openalex.org/C41008148","wikidata":"https://www.wikidata.org/wiki/Q21198","display_name":"Computer science","level":0,"score":0.2556016445159912},{"id":"https://openalex.org/C105795698","wikidata":"https://www.wikidata.org/wiki/Q12483","display_name":"Statistics","level":1,"score":0.1359071135520935},{"id":"https://openalex.org/C199360897","wikidata":"https://www.wikidata.org/wiki/Q9143","display_name":"Programming language","level":1,"score":0.0},{"id":"https://openalex.org/C134306372","wikidata":"https://www.wikidata.org/wiki/Q7754","display_name":"Mathematical analysis","level":1,"score":0.0},{"id":"https://openalex.org/C62520636","wikidata":"https://www.wikidata.org/wiki/Q944","display_name":"Quantum mechanics","level":1,"score":0.0},{"id":"https://openalex.org/C121332964","wikidata":"https://www.wikidata.org/wiki/Q413","display_name":"Physics","level":0,"score":0.0}],"mesh":[],"locations_count":2,"locations":[{"id":"doi:10.1137/19m1268410","is_oa":false,"landing_page_url":"https://doi.org/10.1137/19m1268410","pdf_url":null,"source":{"id":"https://openalex.org/S928796702","display_name":"SIAM Journal on Optimization","issn_l":"1052-6234","issn":["1052-6234","1095-7189"],"is_oa":false,"is_in_doaj":false,"is_core":true,"host_organization":"https://openalex.org/P4310320508","host_organization_name":"Society for Industrial and Applied Mathematics","host_organization_lineage":["https://openalex.org/P4310320508"],"host_organization_lineage_names":["Society for Industrial and Applied Mathematics"],"type":"journal"},"license":null,"license_id":null,"version":"publishedVersion","is_accepted":true,"is_published":true,"raw_source_name":"SIAM Journal on Optimization","raw_type":"journal-article"},{"id":"pmh:oai:osti.gov:1785682","is_oa":true,"landing_page_url":"https://www.osti.gov/biblio/1785682","pdf_url":"https://www.osti.gov/servlets/purl/1785682","source":{"id":"https://openalex.org/S4306402487","display_name":"OSTI OAI (U.S. Department of Energy Office of Scientific and Technical Information)","issn_l":null,"issn":null,"is_oa":false,"is_in_doaj":false,"is_core":false,"host_organization":"https://openalex.org/I139351228","host_organization_name":"Office of Scientific and Technical Information","host_organization_lineage":["https://openalex.org/I139351228"],"host_organization_lineage_names":[],"type":"repository"},"license":null,"license_id":null,"version":"submittedVersion","is_accepted":false,"is_published":false,"raw_source_name":null,"raw_type":null}],"best_oa_location":{"id":"pmh:oai:osti.gov:1785682","is_oa":true,"landing_page_url":"https://www.osti.gov/biblio/1785682","pdf_url":"https://www.osti.gov/servlets/purl/1785682","source":{"id":"https://openalex.org/S4306402487","display_name":"OSTI OAI (U.S. Department of Energy Office of Scientific and Technical Information)","issn_l":null,"issn":null,"is_oa":false,"is_in_doaj":false,"is_core":false,"host_organization":"https://openalex.org/I139351228","host_organization_name":"Office of Scientific and Technical Information","host_organization_lineage":["https://openalex.org/I139351228"],"host_organization_lineage_names":[],"type":"repository"},"license":null,"license_id":null,"version":"submittedVersion","is_accepted":false,"is_published":false,"raw_source_name":null,"raw_type":null},"sustainable_development_goals":[{"id":"https://metadata.un.org/sdg/3","display_name":"Good health and well-being","score":0.800000011920929}],"awards":[{"id":"https://openalex.org/G3086902720","display_name":null,"funder_award_id":"1727618","funder_id":"https://openalex.org/F4320337391","funder_display_name":"Division of Civil, Mechanical and Manufacturing Innovation"},{"id":"https://openalex.org/G5060431036","display_name":null,"funder_award_id":"-1727618","funder_id":"https://openalex.org/F4320306076","funder_display_name":"National Science Foundation"},{"id":"https://openalex.org/G5971914167","display_name":null,"funder_award_id":"CMMI-1727618","funder_id":"https://openalex.org/F4320306076","funder_display_name":"National Science Foundation"},{"id":"https://openalex.org/G6744698226","display_name":null,"funder_award_id":"DE-SC0018018","funder_id":"https://openalex.org/F4320306084","funder_display_name":"U.S. Department of Energy"},{"id":"https://openalex.org/G7959287641","display_name":null,"funder_award_id":"1727618","funder_id":"https://openalex.org/F4320306076","funder_display_name":"National Science Foundation"}],"funders":[{"id":"https://openalex.org/F4320306076","display_name":"National Science Foundation","ror":"https://ror.org/021nxhr62"},{"id":"https://openalex.org/F4320306084","display_name":"U.S. Department of Energy","ror":"https://ror.org/01bj3aw27"},{"id":"https://openalex.org/F4320337391","display_name":"Division of Civil, Mechanical and Manufacturing Innovation","ror":"https://ror.org/028yd4c30"}],"has_content":{"pdf":true,"grobid_xml":false},"content_urls":{"pdf":"https://content.openalex.org/works/W3126605566.pdf"},"referenced_works_count":23,"referenced_works":["https://openalex.org/W760153864","https://openalex.org/W1484551447","https://openalex.org/W1965878388","https://openalex.org/W1968355947","https://openalex.org/W1970375475","https://openalex.org/W2020165868","https://openalex.org/W2034221837","https://openalex.org/W2034725503","https://openalex.org/W2067695959","https://openalex.org/W2092660864","https://openalex.org/W2102773314","https://openalex.org/W2125417745","https://openalex.org/W2142326735","https://openalex.org/W2152790647","https://openalex.org/W2155153696","https://openalex.org/W2161728228","https://openalex.org/W2165428239","https://openalex.org/W2165622730","https://openalex.org/W2168565265","https://openalex.org/W2553297237","https://openalex.org/W2623414030","https://openalex.org/W2962850106","https://openalex.org/W2963450292"],"related_works":["https://openalex.org/W2096013579","https://openalex.org/W52153049","https://openalex.org/W1760611253","https://openalex.org/W1515117609","https://openalex.org/W1589140671","https://openalex.org/W4323315247","https://openalex.org/W2294884454","https://openalex.org/W3169161914","https://openalex.org/W4321379664","https://openalex.org/W2211790881"],"abstract_inverted_index":{"We":[0,47,79,115],"consider":[1],"a":[2,99,131],"distributionally":[3],"robust":[4,144,162],"partially":[5],"observable":[6],"Markov":[7],"decision":[8,25,193],"process":[9],"(DR-POMDP),":[10],"where":[11],"the":[12,15,21,37,53,69,77,82,94,112,121,174,182,189],"distribution":[13,55,75],"of":[14,23,39,52,85,111,124,130,149,191],"transition-observation":[16,150,184],"probabilities":[17,151],"is":[18,87],"unknown":[19],"at":[20,36,188],"beginning":[22],"each":[24,40,192],"period,":[26],"but":[27,156],"their":[28],"realizations":[29],"can":[30,141],"be":[31],"inferred":[32],"using":[33,56],"side":[34],"information":[35],"end":[38,190],"period":[41],"after":[42],"an":[43,49,64],"action":[44],"being":[45],"taken.":[46],"build":[48],"ambiguity":[50,175],"set":[51,176],"joint":[54],"bounded":[57],"moments":[58],"via":[59,127],"conic":[60],"constraints":[61],"and":[62,97,108,119,177],"seek":[63],"optimal":[65],"policy":[66],"to":[67,93,154,170,178,181],"maximize":[68],"worst-case":[70],"(minimum)":[71],"reward":[72],"for":[73,105],"any":[74],"in":[76,173],"set.":[78],"show":[80,138],"that":[81,139],"value":[83,102,113],"function":[84],"DR-POMDP":[86,140,165],"piecewise":[88],"linear":[89],"convex":[90],"with":[91],"respect":[92],"belief":[95],"state":[96],"propose":[98],"heuristic":[100],"search":[101],"iteration":[103],"method":[104],"obtaining":[106],"lower":[107],"upper":[109],"bounds":[110],"function.":[114],"conduct":[116],"numerical":[117],"studies":[118],"demonstrate":[120],"computational":[122],"performance":[123],"our":[125],"approach":[126],"testing":[128],"instances":[129],"dynamic":[132],"epidemic":[133],"control":[134],"problem.":[135],"Our":[136],"results":[137],"produce":[142],"more":[143],"policies":[145,166],"under":[146],"misspecified":[147],"distributions":[148],"as":[152],"compared":[153],"POMDP":[155],"has":[157],"less":[158],"costly":[159],"solutions":[160],"than":[161],"POMDP.":[163],"The":[164],"are":[167],"also":[168],"insensitive":[169],"varying":[171],"parameter":[172],"noise":[179],"added":[180],"true":[183],"probability":[185],"values":[186],"obtained":[187],"period.":[194]},"counts_by_year":[{"year":2026,"cited_by_count":1},{"year":2025,"cited_by_count":4},{"year":2024,"cited_by_count":5},{"year":2023,"cited_by_count":2},{"year":2022,"cited_by_count":4}],"updated_date":"2026-06-11T09:08:48.828518","created_date":"2025-10-10T00:00:00"}