{"id":"https://openalex.org/W2129092248","doi":"https://doi.org/10.1109/fuzzy.2008.4630449","title":"Fuzzy Q-Learning with an adaptive representation","display_name":"Fuzzy Q-Learning with an adaptive representation","publication_year":2008,"publication_date":"2008-06-01","ids":{"openalex":"https://openalex.org/W2129092248","doi":"https://doi.org/10.1109/fuzzy.2008.4630449","mag":"2129092248"},"language":"en","primary_location":{"id":"doi:10.1109/fuzzy.2008.4630449","is_oa":false,"landing_page_url":"https://doi.org/10.1109/fuzzy.2008.4630449","pdf_url":null,"source":null,"license":null,"license_id":null,"version":"publishedVersion","is_accepted":true,"is_published":true,"raw_source_name":"2008 IEEE International Conference on Fuzzy Systems (IEEE World Congress on Computational Intelligence)","raw_type":"proceedings-article"},"type":"article","indexed_in":["crossref"],"open_access":{"is_oa":false,"oa_status":"closed","oa_url":null,"any_repository_has_fulltext":false},"authorships":[{"author_position":"first","author":{"id":"https://openalex.org/A5056659943","display_name":"Antony Waldock","orcid":null},"institutions":[{"id":"https://openalex.org/I4210143731","display_name":"BAE Systems (United Kingdom)","ror":"https://ror.org/04p8ejq70","country_code":"GB","type":"company","lineage":["https://openalex.org/I4210143731"]},{"id":"https://openalex.org/I201377164","display_name":"BAE Systems (Sweden)","ror":"https://ror.org/00yewjk07","country_code":"SE","type":"company","lineage":["https://openalex.org/I201377164","https://openalex.org/I4210143731"]}],"countries":["GB","SE"],"is_corresponding":true,"raw_author_name":"A. Waldock","raw_affiliation_strings":["Advanced Technology Centre, BAE SYSTEMS, Bristol, UK","Adv. Technol. Centre, BAE Syst., Bristol"],"affiliations":[{"raw_affiliation_string":"Advanced Technology Centre, BAE SYSTEMS, Bristol, UK","institution_ids":["https://openalex.org/I4210143731"]},{"raw_affiliation_string":"Adv. Technol. Centre, BAE Syst., Bristol","institution_ids":["https://openalex.org/I201377164"]}]},{"author_position":"last","author":{"id":"https://openalex.org/A5070447884","display_name":"Brian Carse","orcid":null},"institutions":[{"id":"https://openalex.org/I4210161128","display_name":"Bristol Robotics Laboratory","ror":"https://ror.org/056sbyc67","country_code":"GB","type":"facility","lineage":["https://openalex.org/I4210161128"]},{"id":"https://openalex.org/I178535277","display_name":"University of the West of England","ror":"https://ror.org/02nwg5t34","country_code":"GB","type":"education","lineage":["https://openalex.org/I178535277"]}],"countries":["GB"],"is_corresponding":false,"raw_author_name":"B. Carse","raw_affiliation_strings":["Bristol Robotics Laboratory, University of West of England, UK","Bristol Robotics Laboratory at the University of the West of England, UK"],"affiliations":[{"raw_affiliation_string":"Bristol Robotics Laboratory, University of West of England, UK","institution_ids":["https://openalex.org/I4210161128"]},{"raw_affiliation_string":"Bristol Robotics Laboratory at the University of the West of England, UK","institution_ids":["https://openalex.org/I178535277"]}]}],"institutions":[],"countries_distinct_count":2,"institutions_distinct_count":2,"corresponding_author_ids":["https://openalex.org/A5056659943"],"corresponding_institution_ids":["https://openalex.org/I201377164","https://openalex.org/I4210143731"],"apc_list":null,"apc_paid":null,"fwci":6.2926,"has_fulltext":false,"cited_by_count":15,"citation_normalized_percentile":{"value":0.96209068,"is_in_top_1_percent":false,"is_in_top_10_percent":true},"cited_by_percentile_year":{"min":89,"max":94},"biblio":{"volume":"1","issue":null,"first_page":"720","last_page":"725"},"is_retracted":false,"is_paratext":false,"is_xpac":false,"primary_topic":{"id":"https://openalex.org/T10462","display_name":"Reinforcement Learning in Robotics","score":0.9994000196456909,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},"topics":[{"id":"https://openalex.org/T10462","display_name":"Reinforcement Learning in Robotics","score":0.9994000196456909,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T10820","display_name":"Fuzzy Logic and Control Systems","score":0.991100013256073,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T11975","display_name":"Evolutionary Algorithms and Applications","score":0.9847000241279602,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}}],"keywords":[{"id":"https://openalex.org/keywords/reinforcement-learning","display_name":"Reinforcement learning","score":0.7990471124649048},{"id":"https://openalex.org/keywords/representation","display_name":"Representation (politics)","score":0.7959432601928711},{"id":"https://openalex.org/keywords/computer-science","display_name":"Computer science","score":0.7140138149261475},{"id":"https://openalex.org/keywords/process","display_name":"Process (computing)","score":0.595317006111145},{"id":"https://openalex.org/keywords/fuzzy-control-system","display_name":"Fuzzy control system","score":0.5787028074264526},{"id":"https://openalex.org/keywords/artificial-intelligence","display_name":"Artificial intelligence","score":0.5700482726097107},{"id":"https://openalex.org/keywords/fuzzy-logic","display_name":"Fuzzy logic","score":0.5616623759269714},{"id":"https://openalex.org/keywords/control","display_name":"Control (management)","score":0.5370029807090759},{"id":"https://openalex.org/keywords/iterative-learning-control","display_name":"Iterative learning control","score":0.5156237483024597},{"id":"https://openalex.org/keywords/adaptive-control","display_name":"Adaptive control","score":0.4388951063156128},{"id":"https://openalex.org/keywords/robot","display_name":"Robot","score":0.4362495541572571},{"id":"https://openalex.org/keywords/machine-learning","display_name":"Machine learning","score":0.39112791419029236}],"concepts":[{"id":"https://openalex.org/C97541855","wikidata":"https://www.wikidata.org/wiki/Q830687","display_name":"Reinforcement learning","level":2,"score":0.7990471124649048},{"id":"https://openalex.org/C2776359362","wikidata":"https://www.wikidata.org/wiki/Q2145286","display_name":"Representation (politics)","level":3,"score":0.7959432601928711},{"id":"https://openalex.org/C41008148","wikidata":"https://www.wikidata.org/wiki/Q21198","display_name":"Computer science","level":0,"score":0.7140138149261475},{"id":"https://openalex.org/C98045186","wikidata":"https://www.wikidata.org/wiki/Q205663","display_name":"Process (computing)","level":2,"score":0.595317006111145},{"id":"https://openalex.org/C195975749","wikidata":"https://www.wikidata.org/wiki/Q1475705","display_name":"Fuzzy control system","level":3,"score":0.5787028074264526},{"id":"https://openalex.org/C154945302","wikidata":"https://www.wikidata.org/wiki/Q11660","display_name":"Artificial intelligence","level":1,"score":0.5700482726097107},{"id":"https://openalex.org/C58166","wikidata":"https://www.wikidata.org/wiki/Q224821","display_name":"Fuzzy logic","level":2,"score":0.5616623759269714},{"id":"https://openalex.org/C2775924081","wikidata":"https://www.wikidata.org/wiki/Q55608371","display_name":"Control (management)","level":2,"score":0.5370029807090759},{"id":"https://openalex.org/C117619785","wikidata":"https://www.wikidata.org/wiki/Q6094414","display_name":"Iterative learning control","level":3,"score":0.5156237483024597},{"id":"https://openalex.org/C107464732","wikidata":"https://www.wikidata.org/wiki/Q235781","display_name":"Adaptive control","level":3,"score":0.4388951063156128},{"id":"https://openalex.org/C90509273","wikidata":"https://www.wikidata.org/wiki/Q11012","display_name":"Robot","level":2,"score":0.4362495541572571},{"id":"https://openalex.org/C119857082","wikidata":"https://www.wikidata.org/wiki/Q2539","display_name":"Machine learning","level":1,"score":0.39112791419029236},{"id":"https://openalex.org/C111919701","wikidata":"https://www.wikidata.org/wiki/Q9135","display_name":"Operating system","level":1,"score":0.0},{"id":"https://openalex.org/C94625758","wikidata":"https://www.wikidata.org/wiki/Q7163","display_name":"Politics","level":2,"score":0.0},{"id":"https://openalex.org/C199539241","wikidata":"https://www.wikidata.org/wiki/Q7748","display_name":"Law","level":1,"score":0.0},{"id":"https://openalex.org/C17744445","wikidata":"https://www.wikidata.org/wiki/Q36442","display_name":"Political science","level":0,"score":0.0}],"mesh":[],"locations_count":1,"locations":[{"id":"doi:10.1109/fuzzy.2008.4630449","is_oa":false,"landing_page_url":"https://doi.org/10.1109/fuzzy.2008.4630449","pdf_url":null,"source":null,"license":null,"license_id":null,"version":"publishedVersion","is_accepted":true,"is_published":true,"raw_source_name":"2008 IEEE International Conference on Fuzzy Systems (IEEE World Congress on Computational Intelligence)","raw_type":"proceedings-article"}],"best_oa_location":null,"sustainable_development_goals":[{"id":"https://metadata.un.org/sdg/1","display_name":"No poverty","score":0.5799999833106995}],"awards":[],"funders":[],"has_content":{"pdf":false,"grobid_xml":false},"content_urls":null,"referenced_works_count":17,"referenced_works":["https://openalex.org/W1551593752","https://openalex.org/W1552830313","https://openalex.org/W1564711114","https://openalex.org/W1640646391","https://openalex.org/W2019693276","https://openalex.org/W2121863487","https://openalex.org/W2124175081","https://openalex.org/W2128894957","https://openalex.org/W2142196876","https://openalex.org/W2144366468","https://openalex.org/W2158316397","https://openalex.org/W3011120880","https://openalex.org/W4214717370","https://openalex.org/W6636932949","https://openalex.org/W6678114464","https://openalex.org/W6775686901","https://openalex.org/W6941289825"],"related_works":["https://openalex.org/W2761624296","https://openalex.org/W4386994694","https://openalex.org/W4388738109","https://openalex.org/W2362901947","https://openalex.org/W2362086884","https://openalex.org/W1814814472","https://openalex.org/W2115512691","https://openalex.org/W135622916","https://openalex.org/W2162992672","https://openalex.org/W2792368061"],"abstract_inverted_index":{"Reinforcement":[0],"learning":[1,4,119],"(RL)":[2],"is":[3,95,128,162],"how":[5],"to":[6,9,13,27,36,45,79,96,109,130,164,170],"map":[7],"states":[8],"actions":[10],"so":[11],"as":[12],"maximise":[14],"a":[15,37,51,73,101,147,172],"numeric":[16],"reward":[17],"signal.":[18],"Fuzzy":[19],"Q-learning":[20,26],"(FQL)":[21],"extends":[22],"the":[23,59,77,85,92,98,106,111,114,118,132,135,152,160,167],"RL":[24,149],"technique":[25],"large":[28],"or":[29,53],"continuous":[30],"problems":[31],"and":[32,72],"has":[33],"been":[34],"applied":[35],"wide":[38],"range":[39],"of":[40,84,134,141,158],"applications":[41],"from":[42],"data":[43],"mining":[44],"robot":[46],"control.":[47],"Typically,":[48],"FQL":[49],"uses":[50],"uniform":[52,63],"pre-defined":[54,74],"internal":[55,107],"representation":[56,64,75,145,161],"provided":[57],"by":[58,104],"human":[60,102],"designer.":[61],"A":[62,121],"usually":[65],"provides":[66],"poor":[67],"generalisation":[68,112,133],"for":[69],"control":[70,87,115,136,174],"applications,":[71],"requires":[76],"designer":[78,103],"have":[80],"an":[81,142],"in-depth":[82],"knowledge":[83],"desired":[86],"policy.":[88,175],"In":[89],"this":[90],"paper,":[91],"approach":[93],"taken":[94,169],"reduce":[97,166],"reliance":[99],"on":[100,146],"adapting":[105,159],"representation,":[108],"improve":[110,131],"over":[113],"policy,":[116],"during":[117],"process.":[120],"hierarchical":[122],"fuzzy":[123],"rule":[124],"based":[125],"system":[126],"(HFRBS)":[127],"used":[129],"policy":[137],"through":[138],"iterative":[139],"refinement":[140],"initial":[143],"coarse":[144],"classical":[148],"problem":[150],"called":[151],"mountain":[153],"car":[154],"problem.":[155],"The":[156],"process":[157],"shown":[163],"significantly":[165],"time":[168],"learn":[171],"suitable":[173]},"counts_by_year":[{"year":2021,"cited_by_count":1},{"year":2015,"cited_by_count":1},{"year":2013,"cited_by_count":1},{"year":2012,"cited_by_count":1}],"updated_date":"2025-11-06T03:46:38.306776","created_date":"2025-10-10T00:00:00"}