{"id":"https://openalex.org/W2158261610","doi":"https://doi.org/10.1109/robot.2005.1570795","title":"Robot Learning in Partially Observable, Noisy, Continuous Worlds","display_name":"Robot Learning in Partially Observable, Noisy, Continuous Worlds","publication_year":2006,"publication_date":"2006-01-18","ids":{"openalex":"https://openalex.org/W2158261610","doi":"https://doi.org/10.1109/robot.2005.1570795","mag":"2158261610"},"language":"en","primary_location":{"id":"doi:10.1109/robot.2005.1570795","is_oa":false,"landing_page_url":"https://doi.org/10.1109/robot.2005.1570795","pdf_url":null,"source":null,"license":null,"license_id":null,"version":"publishedVersion","is_accepted":true,"is_published":true,"raw_source_name":"Proceedings of the 2005 IEEE International Conference on Robotics and Automation","raw_type":"proceedings-article"},"type":"article","indexed_in":["crossref"],"open_access":{"is_oa":false,"oa_status":"closed","oa_url":null,"any_repository_has_fulltext":false},"authorships":[{"author_position":"first","author":{"id":"https://openalex.org/A5001384912","display_name":"Robert Emer Broadbent","orcid":null},"institutions":[{"id":"https://openalex.org/I100005738","display_name":"Brigham Young University","ror":"https://ror.org/047rhhm47","country_code":"US","type":"education","lineage":["https://openalex.org/I100005738"]}],"countries":["US"],"is_corresponding":true,"raw_author_name":"R. Broadbent","raw_affiliation_strings":["Computer Science Department, Brigham Young University, Provo, UT, USA"],"affiliations":[{"raw_affiliation_string":"Computer Science Department, Brigham Young University, Provo, UT, USA","institution_ids":["https://openalex.org/I100005738"]}]},{"author_position":"last","author":{"id":"https://openalex.org/A5007362442","display_name":"Todd Peterson","orcid":null},"institutions":[{"id":"https://openalex.org/I197572798","display_name":"Utah Valley University","ror":"https://ror.org/02rxpxc98","country_code":"US","type":"education","lineage":["https://openalex.org/I197572798"]}],"countries":["US"],"is_corresponding":false,"raw_author_name":"T. Peterson","raw_affiliation_strings":["Computer Science Department, Utah Valley State College, Provo, UT, USA"],"affiliations":[{"raw_affiliation_string":"Computer Science Department, Utah Valley State College, Provo, UT, USA","institution_ids":["https://openalex.org/I197572798"]}]}],"institutions":[],"countries_distinct_count":1,"institutions_distinct_count":2,"corresponding_author_ids":["https://openalex.org/A5001384912"],"corresponding_institution_ids":["https://openalex.org/I100005738"],"apc_list":null,"apc_paid":null,"fwci":0.9035,"has_fulltext":false,"cited_by_count":3,"citation_normalized_percentile":{"value":0.81539115,"is_in_top_1_percent":false,"is_in_top_10_percent":false},"cited_by_percentile_year":null,"biblio":{"volume":"4","issue":null,"first_page":"4386","last_page":"4393"},"is_retracted":false,"is_paratext":false,"is_xpac":false,"primary_topic":{"id":"https://openalex.org/T10462","display_name":"Reinforcement Learning in Robotics","score":0.9961000084877014,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},"topics":[{"id":"https://openalex.org/T10462","display_name":"Reinforcement Learning in Robotics","score":0.9961000084877014,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T12072","display_name":"Machine Learning and Algorithms","score":0.9959999918937683,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T11714","display_name":"Multimodal Machine Learning Applications","score":0.995199978351593,"subfield":{"id":"https://openalex.org/subfields/1707","display_name":"Computer Vision and Pattern Recognition"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}}],"keywords":[{"id":"https://openalex.org/keywords/computer-science","display_name":"Computer science","score":0.757441520690918},{"id":"https://openalex.org/keywords/extension","display_name":"Extension (predicate logic)","score":0.6628233194351196},{"id":"https://openalex.org/keywords/context","display_name":"Context (archaeology)","score":0.5978188514709473},{"id":"https://openalex.org/keywords/observable","display_name":"Observable","score":0.5769733190536499},{"id":"https://openalex.org/keywords/artificial-intelligence","display_name":"Artificial intelligence","score":0.5595217943191528},{"id":"https://openalex.org/keywords/discretization","display_name":"Discretization","score":0.5136680006980896},{"id":"https://openalex.org/keywords/markov-decision-process","display_name":"Markov decision process","score":0.5098751783370972},{"id":"https://openalex.org/keywords/robot","display_name":"Robot","score":0.49572885036468506},{"id":"https://openalex.org/keywords/partially-observable-markov-decision-process","display_name":"Partially observable Markov decision process","score":0.4630126953125},{"id":"https://openalex.org/keywords/variable","display_name":"Variable (mathematics)","score":0.45502007007598877},{"id":"https://openalex.org/keywords/percept","display_name":"Percept","score":0.43540093302726746},{"id":"https://openalex.org/keywords/markov-process","display_name":"Markov process","score":0.3297743797302246},{"id":"https://openalex.org/keywords/machine-learning","display_name":"Machine learning","score":0.3026820421218872},{"id":"https://openalex.org/keywords/markov-chain","display_name":"Markov chain","score":0.23286116123199463},{"id":"https://openalex.org/keywords/markov-model","display_name":"Markov model","score":0.15223804116249084},{"id":"https://openalex.org/keywords/programming-language","display_name":"Programming language","score":0.13303929567337036},{"id":"https://openalex.org/keywords/mathematics","display_name":"Mathematics","score":0.10948944091796875}],"concepts":[{"id":"https://openalex.org/C41008148","wikidata":"https://www.wikidata.org/wiki/Q21198","display_name":"Computer science","level":0,"score":0.757441520690918},{"id":"https://openalex.org/C2778029271","wikidata":"https://www.wikidata.org/wiki/Q5421931","display_name":"Extension (predicate logic)","level":2,"score":0.6628233194351196},{"id":"https://openalex.org/C2779343474","wikidata":"https://www.wikidata.org/wiki/Q3109175","display_name":"Context (archaeology)","level":2,"score":0.5978188514709473},{"id":"https://openalex.org/C32848918","wikidata":"https://www.wikidata.org/wiki/Q845789","display_name":"Observable","level":2,"score":0.5769733190536499},{"id":"https://openalex.org/C154945302","wikidata":"https://www.wikidata.org/wiki/Q11660","display_name":"Artificial intelligence","level":1,"score":0.5595217943191528},{"id":"https://openalex.org/C73000952","wikidata":"https://www.wikidata.org/wiki/Q17007827","display_name":"Discretization","level":2,"score":0.5136680006980896},{"id":"https://openalex.org/C106189395","wikidata":"https://www.wikidata.org/wiki/Q176789","display_name":"Markov decision process","level":3,"score":0.5098751783370972},{"id":"https://openalex.org/C90509273","wikidata":"https://www.wikidata.org/wiki/Q11012","display_name":"Robot","level":2,"score":0.49572885036468506},{"id":"https://openalex.org/C17098449","wikidata":"https://www.wikidata.org/wiki/Q176814","display_name":"Partially observable Markov decision process","level":4,"score":0.4630126953125},{"id":"https://openalex.org/C182365436","wikidata":"https://www.wikidata.org/wiki/Q50701","display_name":"Variable (mathematics)","level":2,"score":0.45502007007598877},{"id":"https://openalex.org/C2779687425","wikidata":"https://www.wikidata.org/wiki/Q7166998","display_name":"Percept","level":3,"score":0.43540093302726746},{"id":"https://openalex.org/C159886148","wikidata":"https://www.wikidata.org/wiki/Q176645","display_name":"Markov process","level":2,"score":0.3297743797302246},{"id":"https://openalex.org/C119857082","wikidata":"https://www.wikidata.org/wiki/Q2539","display_name":"Machine learning","level":1,"score":0.3026820421218872},{"id":"https://openalex.org/C98763669","wikidata":"https://www.wikidata.org/wiki/Q176645","display_name":"Markov chain","level":2,"score":0.23286116123199463},{"id":"https://openalex.org/C163836022","wikidata":"https://www.wikidata.org/wiki/Q6771326","display_name":"Markov model","level":3,"score":0.15223804116249084},{"id":"https://openalex.org/C199360897","wikidata":"https://www.wikidata.org/wiki/Q9143","display_name":"Programming language","level":1,"score":0.13303929567337036},{"id":"https://openalex.org/C33923547","wikidata":"https://www.wikidata.org/wiki/Q395","display_name":"Mathematics","level":0,"score":0.10948944091796875},{"id":"https://openalex.org/C26760741","wikidata":"https://www.wikidata.org/wiki/Q160402","display_name":"Perception","level":2,"score":0.0},{"id":"https://openalex.org/C151730666","wikidata":"https://www.wikidata.org/wiki/Q7205","display_name":"Paleontology","level":1,"score":0.0},{"id":"https://openalex.org/C169760540","wikidata":"https://www.wikidata.org/wiki/Q207011","display_name":"Neuroscience","level":1,"score":0.0},{"id":"https://openalex.org/C62520636","wikidata":"https://www.wikidata.org/wiki/Q944","display_name":"Quantum mechanics","level":1,"score":0.0},{"id":"https://openalex.org/C134306372","wikidata":"https://www.wikidata.org/wiki/Q7754","display_name":"Mathematical analysis","level":1,"score":0.0},{"id":"https://openalex.org/C86803240","wikidata":"https://www.wikidata.org/wiki/Q420","display_name":"Biology","level":0,"score":0.0},{"id":"https://openalex.org/C105795698","wikidata":"https://www.wikidata.org/wiki/Q12483","display_name":"Statistics","level":1,"score":0.0},{"id":"https://openalex.org/C121332964","wikidata":"https://www.wikidata.org/wiki/Q413","display_name":"Physics","level":0,"score":0.0}],"mesh":[],"locations_count":1,"locations":[{"id":"doi:10.1109/robot.2005.1570795","is_oa":false,"landing_page_url":"https://doi.org/10.1109/robot.2005.1570795","pdf_url":null,"source":null,"license":null,"license_id":null,"version":"publishedVersion","is_accepted":true,"is_published":true,"raw_source_name":"Proceedings of the 2005 IEEE International Conference on Robotics and Automation","raw_type":"proceedings-article"}],"best_oa_location":null,"sustainable_development_goals":[{"id":"https://metadata.un.org/sdg/16","score":0.800000011920929,"display_name":"Peace, Justice and strong institutions"}],"awards":[],"funders":[],"has_content":{"pdf":false,"grobid_xml":false},"content_urls":null,"referenced_works_count":16,"referenced_works":["https://openalex.org/W1492518272","https://openalex.org/W1552830313","https://openalex.org/W1570690983","https://openalex.org/W2107726111","https://openalex.org/W2121863487","https://openalex.org/W2122410182","https://openalex.org/W2126566174","https://openalex.org/W2153175335","https://openalex.org/W2312609093","https://openalex.org/W3008021358","https://openalex.org/W3011120880","https://openalex.org/W3183522126","https://openalex.org/W4214717370","https://openalex.org/W6629536611","https://openalex.org/W6798736220","https://openalex.org/W6884757192"],"related_works":["https://openalex.org/W2999848267","https://openalex.org/W2096013579","https://openalex.org/W1589140671","https://openalex.org/W1760611253","https://openalex.org/W52153049","https://openalex.org/W2951545791","https://openalex.org/W1515117609","https://openalex.org/W2294884454","https://openalex.org/W4323315247","https://openalex.org/W131709709"],"abstract_inverted_index":{"Partially-observable":[0],"Markov":[1],"decision":[2],"problems":[3],"(POMDPs)":[4],"pose":[5],"special":[6],"difficulties":[7],"for":[8,37],"the":[9,18,38,78,86,94],"task":[10],"of":[11,27,96],"learning":[12],"robot":[13,39],"control":[14],"policies,":[15],"due":[16],"to":[17,20,34,40,53,61,69,91],"need":[19],"disambiguate":[21],"perceptually":[22],"aliased":[23],"states.":[24],"Short-term":[25],"memories":[26],"recent":[28],"actions":[29],"and/or":[30],"percepts":[31],"are":[32],"required":[33],"provide":[35],"context":[36,95],"perform":[41],"such":[42],"disambiguation.":[43],"We":[44,76],"introduce":[45],"Variable-Resolution":[46],"Percept":[47],"Discretization":[48],"(VRPD)":[49],"as":[50],"an":[51,58],"extension":[52,66,79],"Utile":[54],"Suffix":[55],"Memory":[56],"(USM),":[57],"algorithm":[59],"designed":[60],"solve":[62],"discrete":[63],"POMDPs.":[64,98],"This":[65],"allows":[67],"USM":[68,92],"function":[70],"effectively":[71],"in":[72,80,93],"noisy,":[73],"continuous":[74,97],"worlds.":[75],"describe":[77],"detail,":[81],"then":[82],"we":[83],"demonstrate":[84],"experimentally":[85],"improvements":[87],"that":[88],"it":[89],"makes":[90]},"counts_by_year":[],"updated_date":"2025-11-06T03:46:38.306776","created_date":"2025-10-10T00:00:00"}