{"id":"https://openalex.org/W2165873405","doi":"https://doi.org/10.1109/icsmc.2009.5346250","title":"Implementation of fuzzy Q-learning based on modular fuzzy model and parallel structured learning","display_name":"Implementation of fuzzy Q-learning based on modular fuzzy model and parallel structured learning","publication_year":2009,"publication_date":"2009-10-01","ids":{"openalex":"https://openalex.org/W2165873405","doi":"https://doi.org/10.1109/icsmc.2009.5346250","mag":"2165873405"},"language":"en","primary_location":{"id":"doi:10.1109/icsmc.2009.5346250","is_oa":false,"landing_page_url":"https://doi.org/10.1109/icsmc.2009.5346250","pdf_url":null,"source":null,"license":null,"license_id":null,"version":"publishedVersion","is_accepted":true,"is_published":true,"raw_source_name":"2009 IEEE International Conference on Systems, Man and Cybernetics","raw_type":"proceedings-article"},"type":"article","indexed_in":["crossref"],"open_access":{"is_oa":false,"oa_status":"closed","oa_url":null,"any_repository_has_fulltext":false},"authorships":[{"author_position":"first","author":{"id":"https://openalex.org/A5017591243","display_name":"Toshihiko Watanabe","orcid":"https://orcid.org/0000-0003-4096-4990"},"institutions":[{"id":"https://openalex.org/I189513530","display_name":"Osaka Electro-Communication University","ror":"https://ror.org/056bksm23","country_code":"JP","type":"education","lineage":["https://openalex.org/I189513530"]}],"countries":["JP"],"is_corresponding":true,"raw_author_name":"Toshihiko Watanabe","raw_affiliation_strings":["Faculty of Engineering, Osaka Electro Communication University, Neyagawa, Osaka, Japan"],"affiliations":[{"raw_affiliation_string":"Faculty of Engineering, Osaka Electro Communication University, Neyagawa, Osaka, Japan","institution_ids":["https://openalex.org/I189513530"]}]}],"institutions":[],"countries_distinct_count":1,"institutions_distinct_count":1,"corresponding_author_ids":["https://openalex.org/A5017591243"],"corresponding_institution_ids":["https://openalex.org/I189513530"],"apc_list":null,"apc_paid":null,"fwci":0.0,"has_fulltext":false,"cited_by_count":4,"citation_normalized_percentile":{"value":0.14839475,"is_in_top_1_percent":false,"is_in_top_10_percent":false},"cited_by_percentile_year":{"min":89,"max":94},"biblio":{"volume":null,"issue":null,"first_page":"1338","last_page":"1344"},"is_retracted":false,"is_paratext":false,"is_xpac":false,"primary_topic":{"id":"https://openalex.org/T10820","display_name":"Fuzzy Logic and Control Systems","score":0.9962999820709229,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},"topics":[{"id":"https://openalex.org/T10820","display_name":"Fuzzy Logic and Control Systems","score":0.9962999820709229,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T10462","display_name":"Reinforcement Learning in Robotics","score":0.9656000137329102,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T10320","display_name":"Neural Networks and Applications","score":0.9614999890327454,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}}],"keywords":[{"id":"https://openalex.org/keywords/modular-design","display_name":"Modular design","score":0.6794552206993103},{"id":"https://openalex.org/keywords/reinforcement-learning","display_name":"Reinforcement learning","score":0.6523627638816833},{"id":"https://openalex.org/keywords/computer-science","display_name":"Computer science","score":0.6396441459655762},{"id":"https://openalex.org/keywords/fuzzy-logic","display_name":"Fuzzy logic","score":0.5929414629936218},{"id":"https://openalex.org/keywords/artificial-intelligence","display_name":"Artificial intelligence","score":0.5718798637390137},{"id":"https://openalex.org/keywords/task","display_name":"Task (project management)","score":0.4791688024997711},{"id":"https://openalex.org/keywords/convergence","display_name":"Convergence (economics)","score":0.45896151661872864},{"id":"https://openalex.org/keywords/fuzzy-control-system","display_name":"Fuzzy control system","score":0.4228963255882263},{"id":"https://openalex.org/keywords/machine-learning","display_name":"Machine learning","score":0.3754872977733612},{"id":"https://openalex.org/keywords/engineering","display_name":"Engineering","score":0.13376227021217346}],"concepts":[{"id":"https://openalex.org/C101468663","wikidata":"https://www.wikidata.org/wiki/Q1620158","display_name":"Modular design","level":2,"score":0.6794552206993103},{"id":"https://openalex.org/C97541855","wikidata":"https://www.wikidata.org/wiki/Q830687","display_name":"Reinforcement learning","level":2,"score":0.6523627638816833},{"id":"https://openalex.org/C41008148","wikidata":"https://www.wikidata.org/wiki/Q21198","display_name":"Computer science","level":0,"score":0.6396441459655762},{"id":"https://openalex.org/C58166","wikidata":"https://www.wikidata.org/wiki/Q224821","display_name":"Fuzzy logic","level":2,"score":0.5929414629936218},{"id":"https://openalex.org/C154945302","wikidata":"https://www.wikidata.org/wiki/Q11660","display_name":"Artificial intelligence","level":1,"score":0.5718798637390137},{"id":"https://openalex.org/C2780451532","wikidata":"https://www.wikidata.org/wiki/Q759676","display_name":"Task (project management)","level":2,"score":0.4791688024997711},{"id":"https://openalex.org/C2777303404","wikidata":"https://www.wikidata.org/wiki/Q759757","display_name":"Convergence (economics)","level":2,"score":0.45896151661872864},{"id":"https://openalex.org/C195975749","wikidata":"https://www.wikidata.org/wiki/Q1475705","display_name":"Fuzzy control system","level":3,"score":0.4228963255882263},{"id":"https://openalex.org/C119857082","wikidata":"https://www.wikidata.org/wiki/Q2539","display_name":"Machine learning","level":1,"score":0.3754872977733612},{"id":"https://openalex.org/C127413603","wikidata":"https://www.wikidata.org/wiki/Q11023","display_name":"Engineering","level":0,"score":0.13376227021217346},{"id":"https://openalex.org/C111919701","wikidata":"https://www.wikidata.org/wiki/Q9135","display_name":"Operating system","level":1,"score":0.0},{"id":"https://openalex.org/C162324750","wikidata":"https://www.wikidata.org/wiki/Q8134","display_name":"Economics","level":0,"score":0.0},{"id":"https://openalex.org/C201995342","wikidata":"https://www.wikidata.org/wiki/Q682496","display_name":"Systems engineering","level":1,"score":0.0},{"id":"https://openalex.org/C50522688","wikidata":"https://www.wikidata.org/wiki/Q189833","display_name":"Economic growth","level":1,"score":0.0}],"mesh":[],"locations_count":1,"locations":[{"id":"doi:10.1109/icsmc.2009.5346250","is_oa":false,"landing_page_url":"https://doi.org/10.1109/icsmc.2009.5346250","pdf_url":null,"source":null,"license":null,"license_id":null,"version":"publishedVersion","is_accepted":true,"is_published":true,"raw_source_name":"2009 IEEE International Conference on Systems, Man and Cybernetics","raw_type":"proceedings-article"}],"best_oa_location":null,"sustainable_development_goals":[],"awards":[],"funders":[],"has_content":{"pdf":false,"grobid_xml":false},"content_urls":null,"referenced_works_count":19,"referenced_works":["https://openalex.org/W32403112","https://openalex.org/W1515851193","https://openalex.org/W1557517019","https://openalex.org/W1987757196","https://openalex.org/W2079325629","https://openalex.org/W2111833132","https://openalex.org/W2113913482","https://openalex.org/W2114356476","https://openalex.org/W2124175081","https://openalex.org/W2170529166","https://openalex.org/W2322432043","https://openalex.org/W2911283634","https://openalex.org/W2914656440","https://openalex.org/W2965373912","https://openalex.org/W4214717370","https://openalex.org/W4285719527","https://openalex.org/W4405172849","https://openalex.org/W6677290467","https://openalex.org/W6700444536"],"related_works":["https://openalex.org/W4306904969","https://openalex.org/W2138720691","https://openalex.org/W4362501864","https://openalex.org/W4380318855","https://openalex.org/W2031695474","https://openalex.org/W3084456289","https://openalex.org/W2024136090","https://openalex.org/W4391331176","https://openalex.org/W2586732548","https://openalex.org/W135622916"],"abstract_inverted_index":{"In":[0,80],"order":[1,91],"to":[2,37,49,75,92],"realize":[3],"intelligent":[4],"agent":[5],"such":[6],"as":[7,61,63],"autonomous":[8],"mobile":[9],"robots,":[10],"Reinforcement":[11],"Learning":[12],"is":[13,24,71,88,110,121],"one":[14,25],"of":[15,26,32,41,54,85,97,117,131,144,151],"the":[16,27,52,94,141,149],"necessary":[17],"techniques":[18],"in":[19,45,90,112],"control":[20],"system.":[21],"Fuzzy":[22],"Q-learning":[23,48,66,87,109],"promising":[28],"approaches":[29],"for":[30,56],"implementation":[31,83],"reinforcement":[33],"learning":[34,57,95,126],"function":[35],"owing":[36,74],"its":[38,76],"high":[39],"ability":[40],"model":[42,78,103,120,147],"representation.":[43],"However,":[44],"applying":[46],"fuzzy":[47,86,98,102,108,119,146,152],"actual":[50],"application,":[51],"number":[53],"iterations":[55],"also":[58],"becomes":[59],"huge":[60],"well":[62],"almost":[64],"all":[65],"application.":[67],"Furthermore":[68],"convergence":[69],"performance":[70,96,150],"often":[72],"deteriorated":[73],"complicated":[77],"structure.":[79],"this":[81,113],"study,":[82],"method":[84,105],"discussed":[89],"improve":[93],"Q-learning.":[99,153],"The":[100],"modular":[101,118,145],"construction":[104,143],"based":[106],"on":[107],"proposed":[111,142],"paper.":[114],"Multi-grain":[115],"configuration":[116],"compared":[122],"with":[123],"parallel":[124],"structured":[125],"scheme.":[127],"Through":[128],"numerical":[129],"experiments":[130],"mountain":[132],"car":[133],"task":[134],"and":[135],"Acrobot":[136],"task,":[137],"I":[138],"found":[139],"that":[140],"improved":[148]},"counts_by_year":[{"year":2020,"cited_by_count":1},{"year":2018,"cited_by_count":1},{"year":2017,"cited_by_count":1},{"year":2014,"cited_by_count":1}],"updated_date":"2025-11-06T03:46:38.306776","created_date":"2025-10-10T00:00:00"}