{"id":"https://openalex.org/W2104764400","doi":"https://doi.org/10.1109/ijcnn.2011.6033362","title":"Belief function model for reliable optimal set estimation of transition matrices in discounted infinite-horizon Markov decision processes","display_name":"Belief function model for reliable optimal set estimation of transition matrices in discounted infinite-horizon Markov decision processes","publication_year":2011,"publication_date":"2011-07-01","ids":{"openalex":"https://openalex.org/W2104764400","doi":"https://doi.org/10.1109/ijcnn.2011.6033362","mag":"2104764400"},"language":"en","primary_location":{"id":"doi:10.1109/ijcnn.2011.6033362","is_oa":false,"landing_page_url":"https://doi.org/10.1109/ijcnn.2011.6033362","pdf_url":null,"source":null,"license":null,"license_id":null,"version":"publishedVersion","is_accepted":true,"is_published":true,"raw_source_name":"The 2011 International Joint Conference on Neural Networks","raw_type":"proceedings-article"},"type":"article","indexed_in":["crossref"],"open_access":{"is_oa":false,"oa_status":"closed","oa_url":null,"any_repository_has_fulltext":false},"authorships":[{"author_position":"first","author":{"id":"https://openalex.org/A5100705575","display_name":"Baohua Li","orcid":"https://orcid.org/0000-0002-4540-0441"},"institutions":[{"id":"https://openalex.org/I78715868","display_name":"University of Arkansas at Fayetteville","ror":"https://ror.org/05jbt9m15","country_code":"US","type":"education","lineage":["https://openalex.org/I78715868"]}],"countries":["US"],"is_corresponding":false,"raw_author_name":"Baohua Li","raw_affiliation_strings":["Arkansas Institute for Nanomaterial Science and Engineering and Department of Electrical Engineering, University of Arkansas, Fayetteville, AR, USA","Arkansas Institute for Nanomaterial Science and Engineering and Department of Electrical Engineering, University of Arkansas, Fayetteville, 72701, United States"],"raw_orcid":null,"affiliations":[{"raw_affiliation_string":"Arkansas Institute for Nanomaterial Science and Engineering and Department of Electrical Engineering, University of Arkansas, Fayetteville, AR, USA","institution_ids":["https://openalex.org/I78715868"]},{"raw_affiliation_string":"Arkansas Institute for Nanomaterial Science and Engineering and Department of Electrical Engineering, University of Arkansas, Fayetteville, 72701, United States","institution_ids":["https://openalex.org/I78715868"]}]},{"author_position":"last","author":{"id":"https://openalex.org/A5085653399","display_name":"Jennie Si","orcid":"https://orcid.org/0000-0002-0374-7404"},"institutions":[{"id":"https://openalex.org/I55732556","display_name":"Arizona State University","ror":"https://ror.org/03efmqc40","country_code":"US","type":"education","lineage":["https://openalex.org/I55732556"]}],"countries":["US"],"is_corresponding":false,"raw_author_name":"Jennie Si","raw_affiliation_strings":["Department of Electrical Engineering, Arizona State University, Tempe, AZ, USA","Department of Electrical Engineering, Arizona State University, Tempe, 85287, United States"],"raw_orcid":null,"affiliations":[{"raw_affiliation_string":"Department of Electrical Engineering, Arizona State University, Tempe, AZ, USA","institution_ids":["https://openalex.org/I55732556"]},{"raw_affiliation_string":"Department of Electrical Engineering, Arizona State University, Tempe, 85287, United States","institution_ids":["https://openalex.org/I55732556"]}]}],"institutions":[],"countries_distinct_count":1,"institutions_distinct_count":2,"corresponding_author_ids":[],"corresponding_institution_ids":[],"apc_list":null,"apc_paid":null,"fwci":0.0,"has_fulltext":false,"cited_by_count":0,"citation_normalized_percentile":{"value":0.12431611,"is_in_top_1_percent":false,"is_in_top_10_percent":false},"cited_by_percentile_year":null,"biblio":{"volume":null,"issue":null,"first_page":"1214","last_page":"1221"},"is_retracted":false,"is_paratext":false,"is_xpac":false,"primary_topic":{"id":"https://openalex.org/T10462","display_name":"Reinforcement Learning in Robotics","score":0.9952999949455261,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},"topics":[{"id":"https://openalex.org/T10462","display_name":"Reinforcement Learning in Robotics","score":0.9952999949455261,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T11303","display_name":"Bayesian Modeling and Causal Inference","score":0.9919000267982483,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T12072","display_name":"Machine Learning and Algorithms","score":0.9890999794006348,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}}],"keywords":[{"id":"https://openalex.org/keywords/cardinality","display_name":"Cardinality (data modeling)","score":0.6340451240539551},{"id":"https://openalex.org/keywords/state-space","display_name":"State space","score":0.6127822399139404},{"id":"https://openalex.org/keywords/mathematical-optimization","display_name":"Mathematical optimization","score":0.5729533433914185},{"id":"https://openalex.org/keywords/markov-decision-process","display_name":"Markov decision process","score":0.5681663751602173},{"id":"https://openalex.org/keywords/mathematics","display_name":"Mathematics","score":0.5018742084503174},{"id":"https://openalex.org/keywords/markov-process","display_name":"Markov process","score":0.4237111210823059},{"id":"https://openalex.org/keywords/stochastic-matrix","display_name":"Stochastic matrix","score":0.42024660110473633},{"id":"https://openalex.org/keywords/function","display_name":"Function (biology)","score":0.419899046421051},{"id":"https://openalex.org/keywords/computer-science","display_name":"Computer science","score":0.4039153754711151},{"id":"https://openalex.org/keywords/markov-chain","display_name":"Markov chain","score":0.3990868926048279},{"id":"https://openalex.org/keywords/data-mining","display_name":"Data mining","score":0.14819800853729248},{"id":"https://openalex.org/keywords/statistics","display_name":"Statistics","score":0.08644726872444153}],"concepts":[{"id":"https://openalex.org/C87117476","wikidata":"https://www.wikidata.org/wiki/Q362383","display_name":"Cardinality (data modeling)","level":2,"score":0.6340451240539551},{"id":"https://openalex.org/C72434380","wikidata":"https://www.wikidata.org/wiki/Q230930","display_name":"State space","level":2,"score":0.6127822399139404},{"id":"https://openalex.org/C126255220","wikidata":"https://www.wikidata.org/wiki/Q141495","display_name":"Mathematical optimization","level":1,"score":0.5729533433914185},{"id":"https://openalex.org/C106189395","wikidata":"https://www.wikidata.org/wiki/Q176789","display_name":"Markov decision process","level":3,"score":0.5681663751602173},{"id":"https://openalex.org/C33923547","wikidata":"https://www.wikidata.org/wiki/Q395","display_name":"Mathematics","level":0,"score":0.5018742084503174},{"id":"https://openalex.org/C159886148","wikidata":"https://www.wikidata.org/wiki/Q176645","display_name":"Markov process","level":2,"score":0.4237111210823059},{"id":"https://openalex.org/C49555168","wikidata":"https://www.wikidata.org/wiki/Q176583","display_name":"Stochastic matrix","level":3,"score":0.42024660110473633},{"id":"https://openalex.org/C14036430","wikidata":"https://www.wikidata.org/wiki/Q3736076","display_name":"Function (biology)","level":2,"score":0.419899046421051},{"id":"https://openalex.org/C41008148","wikidata":"https://www.wikidata.org/wiki/Q21198","display_name":"Computer science","level":0,"score":0.4039153754711151},{"id":"https://openalex.org/C98763669","wikidata":"https://www.wikidata.org/wiki/Q176645","display_name":"Markov chain","level":2,"score":0.3990868926048279},{"id":"https://openalex.org/C124101348","wikidata":"https://www.wikidata.org/wiki/Q172491","display_name":"Data mining","level":1,"score":0.14819800853729248},{"id":"https://openalex.org/C105795698","wikidata":"https://www.wikidata.org/wiki/Q12483","display_name":"Statistics","level":1,"score":0.08644726872444153},{"id":"https://openalex.org/C86803240","wikidata":"https://www.wikidata.org/wiki/Q420","display_name":"Biology","level":0,"score":0.0},{"id":"https://openalex.org/C78458016","wikidata":"https://www.wikidata.org/wiki/Q840400","display_name":"Evolutionary biology","level":1,"score":0.0}],"mesh":[],"locations_count":1,"locations":[{"id":"doi:10.1109/ijcnn.2011.6033362","is_oa":false,"landing_page_url":"https://doi.org/10.1109/ijcnn.2011.6033362","pdf_url":null,"source":null,"license":null,"license_id":null,"version":"publishedVersion","is_accepted":true,"is_published":true,"raw_source_name":"The 2011 International Joint Conference on Neural Networks","raw_type":"proceedings-article"}],"best_oa_location":null,"sustainable_development_goals":[{"display_name":"Peace, Justice and strong institutions","id":"https://metadata.un.org/sdg/16","score":0.7599999904632568}],"awards":[],"funders":[],"has_content":{"pdf":false,"grobid_xml":false},"content_urls":null,"referenced_works_count":18,"referenced_works":["https://openalex.org/W1497451517","https://openalex.org/W1497711688","https://openalex.org/W1515852644","https://openalex.org/W1965878388","https://openalex.org/W1984666348","https://openalex.org/W1988217924","https://openalex.org/W1988526405","https://openalex.org/W1992821128","https://openalex.org/W2019682202","https://openalex.org/W2036931518","https://openalex.org/W2058811924","https://openalex.org/W2069045459","https://openalex.org/W2119567691","https://openalex.org/W2164296059","https://openalex.org/W2334782222","https://openalex.org/W2408260168","https://openalex.org/W2903720301","https://openalex.org/W4301347335"],"related_works":["https://openalex.org/W2807018115","https://openalex.org/W4388236136","https://openalex.org/W2315999538","https://openalex.org/W4200250224","https://openalex.org/W2606546905","https://openalex.org/W2126560268","https://openalex.org/W2285658092","https://openalex.org/W187740018","https://openalex.org/W2482498454","https://openalex.org/W2162286586"],"abstract_inverted_index":{"We":[0],"study":[1],"finite-state,":[2],"finite-action,":[3],"discounted":[4],"infinite-horizon":[5],"Markov":[6],"decision":[7],"processes":[8],"with":[9],"uncertain":[10],"correlated":[11],"transition":[12,46],"matrices":[13],"in":[14,50,189],"deterministic":[15],"policy":[16,24],"spaces.":[17],"To":[18],"efficiently":[19],"implement":[20],"an":[21],"approximate":[22],"robust":[23,30],"iteration":[25],"algorithm":[26],"for":[27],"computing":[28],"a":[29,35,75,79,86,108,120,128,174],"optimal":[31,88,131],"or":[32,70,157],"near-optimal":[33],"policy,":[34],"reliable":[36,87,130,192],"and":[37,193],"tight":[38,194],"set":[39,89,121],"estimate":[40,90],"of":[41,44,91,100,103,119,176,199],"the":[42,45,64,92,98,117,135,139,145,152,190,200],"parameters":[43,137],"matrix":[47],"is":[48,112,155,160,203],"needed":[49],"advance.":[51],"However,":[52],"observation":[53,163,182],"samples":[54,164,183],"on":[55,63,115,151,165],"state":[56,166],"transitions":[57,167],"may":[58,67,83],"be":[59,68],"small.":[60],"Prior":[61],"information":[62,150,159],"parameter":[65,153],"space":[66,154],"incomplete":[69],"unavailable.":[71],"In":[72,94],"such":[73],"cases,":[74],"commonly":[76],"used":[77],"maximum":[78],"posterior":[80],"(MAP)":[81],"model":[82,111,125,147,202],"not":[84],"provide":[85],"parameters.":[93],"this":[95],"paper,":[96],"using":[97],"advantages":[99],"Dempster-Shafer":[101],"theory":[102],"evidence":[104],"over":[105],"Bayesian":[106],"theory,":[107],"belief":[109],"function":[110],"proposed":[113],"based":[114],"minimizing":[116],"cardinality":[118],"estimate.":[122],"This":[123],"new":[124,201],"can":[126],"give":[127],"more":[129],"solution":[132],"to":[133,144,179],"cover":[134],"true":[136],"than":[138],"MAP":[140,146],"model.":[141],"It":[142],"degenerates":[143],"when":[148],"prior":[149,158],"complete":[156],"unavailable":[161],"but":[162],"are":[168],"large":[169,181],"enough.":[170],"Moreover,":[171],"we":[172],"create":[173],"concept":[175],"principle":[177],"components":[178],"characterize":[180],"so":[184],"that":[185],"both":[186],"models":[187],"result":[188],"same":[191],"results.":[195],"The":[196],"computation":[197],"complexity":[198],"also":[204],"discussed.":[205]},"counts_by_year":[],"updated_date":"2026-06-11T09:08:48.828518","created_date":"2025-10-10T00:00:00"}