{"id":"https://openalex.org/W2787016545","doi":"https://doi.org/10.1109/ssci.2017.8285254","title":"Containment control of heterogeneous systems with active leaders of bounded unknown control using reinforcement learning","display_name":"Containment control of heterogeneous systems with active leaders of bounded unknown control using reinforcement learning","publication_year":2017,"publication_date":"2017-11-01","ids":{"openalex":"https://openalex.org/W2787016545","doi":"https://doi.org/10.1109/ssci.2017.8285254","mag":"2787016545"},"language":"en","primary_location":{"id":"doi:10.1109/ssci.2017.8285254","is_oa":false,"landing_page_url":"https://doi.org/10.1109/ssci.2017.8285254","pdf_url":null,"source":null,"license":null,"license_id":null,"version":"publishedVersion","is_accepted":true,"is_published":true,"raw_source_name":"2017 IEEE Symposium Series on Computational Intelligence (SSCI)","raw_type":"proceedings-article"},"type":"article","indexed_in":["crossref"],"open_access":{"is_oa":false,"oa_status":"closed","oa_url":null,"any_repository_has_fulltext":false},"authorships":[{"author_position":"first","author":{"id":"https://openalex.org/A5053342436","display_name":"Yongliang Yang","orcid":"https://orcid.org/0000-0002-3144-8604"},"institutions":[{"id":"https://openalex.org/I92403157","display_name":"University of Science and Technology Beijing","ror":"https://ror.org/02egmk993","country_code":"CN","type":"education","lineage":["https://openalex.org/I92403157"]}],"countries":["CN"],"is_corresponding":true,"raw_author_name":"Yongliang Yang","raw_affiliation_strings":["School of Automation and Electrical Engineering, University of Science and Technology Beijing, Beijing, China"],"affiliations":[{"raw_affiliation_string":"School of Automation and Electrical Engineering, University of Science and Technology Beijing, Beijing, China","institution_ids":["https://openalex.org/I92403157"]}]},{"author_position":"middle","author":{"id":"https://openalex.org/A5040323322","display_name":"Ruizhuo Song","orcid":"https://orcid.org/0000-0002-6693-2738"},"institutions":[{"id":"https://openalex.org/I92403157","display_name":"University of Science and Technology Beijing","ror":"https://ror.org/02egmk993","country_code":"CN","type":"education","lineage":["https://openalex.org/I92403157"]}],"countries":["CN"],"is_corresponding":false,"raw_author_name":"Ruizhuo Song","raw_affiliation_strings":["School of Automation and Electrical Engineering, University of Science and Technology Beijing, Beijing, China"],"affiliations":[{"raw_affiliation_string":"School of Automation and Electrical Engineering, University of Science and Technology Beijing, Beijing, China","institution_ids":["https://openalex.org/I92403157"]}]},{"author_position":"middle","author":{"id":"https://openalex.org/A5101512101","display_name":"Yixin Yin","orcid":"https://orcid.org/0000-0001-6056-8878"},"institutions":[{"id":"https://openalex.org/I92403157","display_name":"University of Science and Technology Beijing","ror":"https://ror.org/02egmk993","country_code":"CN","type":"education","lineage":["https://openalex.org/I92403157"]}],"countries":["CN"],"is_corresponding":false,"raw_author_name":"Yixin Yin","raw_affiliation_strings":["School of Automation and Electrical Engineering, University of Science and Technology Beijing, Beijing, China"],"affiliations":[{"raw_affiliation_string":"School of Automation and Electrical Engineering, University of Science and Technology Beijing, Beijing, China","institution_ids":["https://openalex.org/I92403157"]}]},{"author_position":"middle","author":{"id":"https://openalex.org/A5038037619","display_name":"Donald C. Wunsch","orcid":"https://orcid.org/0000-0002-9726-9051"},"institutions":[{"id":"https://openalex.org/I20382870","display_name":"Missouri University of Science and Technology","ror":"https://ror.org/00scwqd12","country_code":"US","type":"education","lineage":["https://openalex.org/I20382870"]}],"countries":["US"],"is_corresponding":false,"raw_author_name":"Donald C. Wunsch","raw_affiliation_strings":["Department of Electrical and Computer Engineering, Missouri University of Science and Technology, Rolla, MO, USA"],"affiliations":[{"raw_affiliation_string":"Department of Electrical and Computer Engineering, Missouri University of Science and Technology, Rolla, MO, USA","institution_ids":["https://openalex.org/I20382870"]}]},{"author_position":"last","author":{"id":"https://openalex.org/A5063118155","display_name":"Hamidreza Modares","orcid":"https://orcid.org/0000-0003-0800-5140"},"institutions":[{"id":"https://openalex.org/I20382870","display_name":"Missouri University of Science and Technology","ror":"https://ror.org/00scwqd12","country_code":"US","type":"education","lineage":["https://openalex.org/I20382870"]}],"countries":["US"],"is_corresponding":false,"raw_author_name":"Hamidreza Modares","raw_affiliation_strings":["Department of Electrical and Computer Engineering, Missouri University of Science and Technology, Rolla, MO, USA"],"affiliations":[{"raw_affiliation_string":"Department of Electrical and Computer Engineering, Missouri University of Science and Technology, Rolla, MO, USA","institution_ids":["https://openalex.org/I20382870"]}]}],"institutions":[],"countries_distinct_count":2,"institutions_distinct_count":5,"corresponding_author_ids":["https://openalex.org/A5053342436"],"corresponding_institution_ids":["https://openalex.org/I92403157"],"apc_list":null,"apc_paid":null,"fwci":0.9084,"has_fulltext":false,"cited_by_count":6,"citation_normalized_percentile":{"value":0.78094496,"is_in_top_1_percent":false,"is_in_top_10_percent":false},"cited_by_percentile_year":{"min":89,"max":97},"biblio":{"volume":null,"issue":null,"first_page":"1","last_page":"7"},"is_retracted":false,"is_paratext":false,"is_xpac":false,"primary_topic":{"id":"https://openalex.org/T12794","display_name":"Adaptive Dynamic Programming Control","score":0.9997000098228455,"subfield":{"id":"https://openalex.org/subfields/1703","display_name":"Computational Theory and Mathematics"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},"topics":[{"id":"https://openalex.org/T12794","display_name":"Adaptive Dynamic Programming Control","score":0.9997000098228455,"subfield":{"id":"https://openalex.org/subfields/1703","display_name":"Computational Theory and Mathematics"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T10249","display_name":"Distributed Control Multi-Agent Systems","score":0.998199999332428,"subfield":{"id":"https://openalex.org/subfields/1705","display_name":"Computer Networks and Communications"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T10462","display_name":"Reinforcement Learning in Robotics","score":0.994700014591217,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}}],"keywords":[{"id":"https://openalex.org/keywords/reinforcement-learning","display_name":"Reinforcement learning","score":0.7672064900398254},{"id":"https://openalex.org/keywords/bounded-function","display_name":"Bounded function","score":0.7466042041778564},{"id":"https://openalex.org/keywords/containment","display_name":"Containment (computer programming)","score":0.7238786220550537},{"id":"https://openalex.org/keywords/computer-science","display_name":"Computer science","score":0.6445393562316895},{"id":"https://openalex.org/keywords/algebraic-riccati-equation","display_name":"Algebraic Riccati equation","score":0.6113253235816956},{"id":"https://openalex.org/keywords/optimal-control","display_name":"Optimal control","score":0.5664780735969543},{"id":"https://openalex.org/keywords/transient","display_name":"Transient (computer programming)","score":0.5507147312164307},{"id":"https://openalex.org/keywords/control","display_name":"Control (management)","score":0.5314947962760925},{"id":"https://openalex.org/keywords/multi-agent-system","display_name":"Multi-agent system","score":0.48964816331863403},{"id":"https://openalex.org/keywords/mathematical-optimization","display_name":"Mathematical optimization","score":0.47426092624664307},{"id":"https://openalex.org/keywords/graph","display_name":"Graph","score":0.4536731243133545},{"id":"https://openalex.org/keywords/control-theory","display_name":"Control theory (sociology)","score":0.4258752465248108},{"id":"https://openalex.org/keywords/riccati-equation","display_name":"Riccati equation","score":0.2797278165817261},{"id":"https://openalex.org/keywords/mathematics","display_name":"Mathematics","score":0.2511645257472992},{"id":"https://openalex.org/keywords/theoretical-computer-science","display_name":"Theoretical computer science","score":0.16830343008041382},{"id":"https://openalex.org/keywords/artificial-intelligence","display_name":"Artificial intelligence","score":0.1610095202922821}],"concepts":[{"id":"https://openalex.org/C97541855","wikidata":"https://www.wikidata.org/wiki/Q830687","display_name":"Reinforcement learning","level":2,"score":0.7672064900398254},{"id":"https://openalex.org/C34388435","wikidata":"https://www.wikidata.org/wiki/Q2267362","display_name":"Bounded function","level":2,"score":0.7466042041778564},{"id":"https://openalex.org/C2777019822","wikidata":"https://www.wikidata.org/wiki/Q390066","display_name":"Containment (computer programming)","level":2,"score":0.7238786220550537},{"id":"https://openalex.org/C41008148","wikidata":"https://www.wikidata.org/wiki/Q21198","display_name":"Computer science","level":0,"score":0.6445393562316895},{"id":"https://openalex.org/C13847129","wikidata":"https://www.wikidata.org/wiki/Q4723989","display_name":"Algebraic Riccati equation","level":4,"score":0.6113253235816956},{"id":"https://openalex.org/C91575142","wikidata":"https://www.wikidata.org/wiki/Q1971426","display_name":"Optimal control","level":2,"score":0.5664780735969543},{"id":"https://openalex.org/C2780799671","wikidata":"https://www.wikidata.org/wiki/Q17087362","display_name":"Transient (computer programming)","level":2,"score":0.5507147312164307},{"id":"https://openalex.org/C2775924081","wikidata":"https://www.wikidata.org/wiki/Q55608371","display_name":"Control (management)","level":2,"score":0.5314947962760925},{"id":"https://openalex.org/C41550386","wikidata":"https://www.wikidata.org/wiki/Q529909","display_name":"Multi-agent system","level":2,"score":0.48964816331863403},{"id":"https://openalex.org/C126255220","wikidata":"https://www.wikidata.org/wiki/Q141495","display_name":"Mathematical optimization","level":1,"score":0.47426092624664307},{"id":"https://openalex.org/C132525143","wikidata":"https://www.wikidata.org/wiki/Q141488","display_name":"Graph","level":2,"score":0.4536731243133545},{"id":"https://openalex.org/C47446073","wikidata":"https://www.wikidata.org/wiki/Q5165890","display_name":"Control theory (sociology)","level":3,"score":0.4258752465248108},{"id":"https://openalex.org/C45473103","wikidata":"https://www.wikidata.org/wiki/Q851503","display_name":"Riccati equation","level":3,"score":0.2797278165817261},{"id":"https://openalex.org/C33923547","wikidata":"https://www.wikidata.org/wiki/Q395","display_name":"Mathematics","level":0,"score":0.2511645257472992},{"id":"https://openalex.org/C80444323","wikidata":"https://www.wikidata.org/wiki/Q2878974","display_name":"Theoretical computer science","level":1,"score":0.16830343008041382},{"id":"https://openalex.org/C154945302","wikidata":"https://www.wikidata.org/wiki/Q11660","display_name":"Artificial intelligence","level":1,"score":0.1610095202922821},{"id":"https://openalex.org/C111919701","wikidata":"https://www.wikidata.org/wiki/Q9135","display_name":"Operating system","level":1,"score":0.0},{"id":"https://openalex.org/C134306372","wikidata":"https://www.wikidata.org/wiki/Q7754","display_name":"Mathematical analysis","level":1,"score":0.0},{"id":"https://openalex.org/C78045399","wikidata":"https://www.wikidata.org/wiki/Q11214","display_name":"Differential equation","level":2,"score":0.0},{"id":"https://openalex.org/C199360897","wikidata":"https://www.wikidata.org/wiki/Q9143","display_name":"Programming language","level":1,"score":0.0}],"mesh":[],"locations_count":1,"locations":[{"id":"doi:10.1109/ssci.2017.8285254","is_oa":false,"landing_page_url":"https://doi.org/10.1109/ssci.2017.8285254","pdf_url":null,"source":null,"license":null,"license_id":null,"version":"publishedVersion","is_accepted":true,"is_published":true,"raw_source_name":"2017 IEEE Symposium Series on Computational Intelligence (SSCI)","raw_type":"proceedings-article"}],"best_oa_location":null,"sustainable_development_goals":[{"id":"https://metadata.un.org/sdg/16","display_name":"Peace, Justice and strong institutions","score":0.6700000166893005}],"awards":[],"funders":[],"has_content":{"grobid_xml":false,"pdf":false},"content_urls":null,"referenced_works_count":37,"referenced_works":["https://openalex.org/W1485083618","https://openalex.org/W1589115255","https://openalex.org/W1614417283","https://openalex.org/W1972243698","https://openalex.org/W1977671496","https://openalex.org/W1983523797","https://openalex.org/W1989855774","https://openalex.org/W1991119064","https://openalex.org/W1993811387","https://openalex.org/W2010152647","https://openalex.org/W2012383111","https://openalex.org/W2012451615","https://openalex.org/W2035003264","https://openalex.org/W2038739174","https://openalex.org/W2038896449","https://openalex.org/W2072302088","https://openalex.org/W2080504737","https://openalex.org/W2099175737","https://openalex.org/W2111838183","https://openalex.org/W2115206688","https://openalex.org/W2120791740","https://openalex.org/W2123876595","https://openalex.org/W2141410403","https://openalex.org/W2148439597","https://openalex.org/W2166103243","https://openalex.org/W2183137222","https://openalex.org/W2299796777","https://openalex.org/W2310756702","https://openalex.org/W2405379562","https://openalex.org/W2430619152","https://openalex.org/W2475651303","https://openalex.org/W2484646121","https://openalex.org/W2538000344","https://openalex.org/W2569238770","https://openalex.org/W2585299106","https://openalex.org/W2624483752","https://openalex.org/W2963784270"],"related_works":["https://openalex.org/W4252941105","https://openalex.org/W2058080364","https://openalex.org/W2350808199","https://openalex.org/W249480812","https://openalex.org/W3028091058","https://openalex.org/W4235551436","https://openalex.org/W2392382023","https://openalex.org/W1568533369","https://openalex.org/W2148191681","https://openalex.org/W3144661763"],"abstract_inverted_index":{"This":[0],"paper":[1],"solves":[2],"the":[3,26,35,44,53,61,72,85,92,109,122,133,136],"containment":[4,74,87,99],"problem":[5],"of":[6,56,94,121,135],"multi-agent":[7],"systems":[8],"on":[9],"undirected":[10],"graph":[11],"with":[12,48],"multiple":[13],"active":[14,24],"leaders":[15,22],"using":[16],"off-policy":[17,102],"reinforcement":[18],"learning":[19],"(RL).":[20],"The":[21],"are":[23,46,64,81],"in":[25,34,113],"sense":[27],"that":[28],"there":[29],"exists":[30],"bounded":[31],"control":[32,88],"input":[33],"dynamics":[36,96],"which":[37],"is":[38,105,129],"unknown":[39],"to":[40,68,71,83,97,107,131],"all":[41],"followers":[42,45],"and":[43,116],"heterogeneous":[47],"different":[49],"dynamics.":[50,124],"Not":[51],"only":[52],"steady":[54],"states":[55],"agent":[57],"i":[58],"but":[59],"also":[60],"transient":[62],"trajectories":[63],"taken":[65],"into":[66],"account":[67],"impose":[69],"optimality":[70],"proposed":[73,137],"control.":[75],"Inhomogeneous":[76],"algebraic":[77],"Riccati":[78],"equations":[79],"(ARE)":[80],"derived":[82],"solve":[84,108],"optimal":[86],"protocol.":[89],"To":[90],"avoid":[91],"requirement":[93],"agents'":[95,123],"obtain":[98],"control,":[100],"an":[101],"RL":[103],"algorithm":[104],"developed":[106],"inhomogeneous":[110],"AREs":[111],"online":[112],"real":[114],"time":[115],"without":[117],"requiring":[118],"any":[119],"knowledge":[120],"Finally,":[125],"a":[126],"simulation":[127],"example":[128],"presented":[130],"illustrate":[132],"effectiveness":[134],"algorithm.":[138]},"counts_by_year":[{"year":2022,"cited_by_count":1},{"year":2021,"cited_by_count":1},{"year":2020,"cited_by_count":1},{"year":2019,"cited_by_count":3}],"updated_date":"2025-11-06T03:46:38.306776","created_date":"2025-10-10T00:00:00"}