{"id":"https://openalex.org/W4401845360","doi":"https://doi.org/10.1177/01423312241267038","title":"Formation cooperative trajectory tracking control for unmanned aerial vehicles via differential game and reinforcement learning","display_name":"Formation cooperative trajectory tracking control for unmanned aerial vehicles via differential game and reinforcement learning","publication_year":2024,"publication_date":"2024-08-24","ids":{"openalex":"https://openalex.org/W4401845360","doi":"https://doi.org/10.1177/01423312241267038"},"language":"en","primary_location":{"id":"doi:10.1177/01423312241267038","is_oa":false,"landing_page_url":"https://doi.org/10.1177/01423312241267038","pdf_url":null,"source":{"id":"https://openalex.org/S24148485","display_name":"Transactions of the Institute of Measurement and Control","issn_l":"0142-3312","issn":["0142-3312","1477-0369"],"is_oa":false,"is_in_doaj":false,"is_core":true,"host_organization":"https://openalex.org/P4310320017","host_organization_name":"SAGE Publishing","host_organization_lineage":["https://openalex.org/P4310320017"],"host_organization_lineage_names":["SAGE Publishing"],"type":"journal"},"license":null,"license_id":null,"version":"publishedVersion","is_accepted":true,"is_published":true,"raw_source_name":"Transactions of the Institute of Measurement and Control","raw_type":"journal-article"},"type":"article","indexed_in":["crossref"],"open_access":{"is_oa":false,"oa_status":"closed","oa_url":null,"any_repository_has_fulltext":false},"authorships":[{"author_position":"first","author":{"id":"https://openalex.org/A5013623591","display_name":"Xiaoheng Wang","orcid":null},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Xiaoheng Wang","raw_affiliation_strings":["National Key Laboratory of Scattering and Radiation, P.R. China"],"raw_orcid":null,"affiliations":[{"raw_affiliation_string":"National Key Laboratory of Scattering and Radiation, P.R. China","institution_ids":[]}]},{"author_position":"middle","author":{"id":"https://openalex.org/A5031096961","display_name":"Zhihe Xiao","orcid":null},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Zhihe Xiao","raw_affiliation_strings":["National Key Laboratory of Scattering and Radiation, P.R. China"],"raw_orcid":null,"affiliations":[{"raw_affiliation_string":"National Key Laboratory of Scattering and Radiation, P.R. China","institution_ids":[]}]},{"author_position":"middle","author":{"id":"https://openalex.org/A5100312462","display_name":"Ziming Ren","orcid":"https://orcid.org/0000-0002-6479-7632"},"institutions":[{"id":"https://openalex.org/I82880672","display_name":"Beihang University","ror":"https://ror.org/00wk2mp56","country_code":"CN","type":"education","lineage":["https://openalex.org/I82880672"]}],"countries":["CN"],"is_corresponding":true,"raw_author_name":"Ziming Ren","raw_affiliation_strings":["School of Astronautics, Beihang University, P.R. China"],"raw_orcid":"https://orcid.org/0000-0002-6479-7632","affiliations":[{"raw_affiliation_string":"School of Astronautics, Beihang University, P.R. China","institution_ids":["https://openalex.org/I82880672"]}]},{"author_position":"middle","author":{"id":"https://openalex.org/A5091633941","display_name":"Chunzhu Dong","orcid":"https://orcid.org/0009-0004-2135-7057"},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Chunzhu Dong","raw_affiliation_strings":["National Key Laboratory of Scattering and Radiation, P.R. China"],"raw_orcid":null,"affiliations":[{"raw_affiliation_string":"National Key Laboratory of Scattering and Radiation, P.R. China","institution_ids":[]}]},{"author_position":"last","author":{"id":"https://openalex.org/A5108973759","display_name":"Xuan Dan Tian","orcid":null},"institutions":[{"id":"https://openalex.org/I82880672","display_name":"Beihang University","ror":"https://ror.org/00wk2mp56","country_code":"CN","type":"education","lineage":["https://openalex.org/I82880672"]}],"countries":["CN"],"is_corresponding":false,"raw_author_name":"Xuan Dan Tian","raw_affiliation_strings":["School of Astronautics, Beihang University, P.R. China"],"raw_orcid":null,"affiliations":[{"raw_affiliation_string":"School of Astronautics, Beihang University, P.R. China","institution_ids":["https://openalex.org/I82880672"]}]}],"institutions":[],"countries_distinct_count":1,"institutions_distinct_count":5,"corresponding_author_ids":["https://openalex.org/A5100312462"],"corresponding_institution_ids":["https://openalex.org/I82880672"],"apc_list":null,"apc_paid":null,"fwci":1.6582,"has_fulltext":false,"cited_by_count":5,"citation_normalized_percentile":{"value":0.85628911,"is_in_top_1_percent":false,"is_in_top_10_percent":false},"cited_by_percentile_year":{"min":96,"max":99},"biblio":{"volume":"47","issue":"9","first_page":"1762","last_page":"1770"},"is_retracted":false,"is_paratext":false,"is_xpac":false,"primary_topic":{"id":"https://openalex.org/T12794","display_name":"Adaptive Dynamic Programming Control","score":0.9998999834060669,"subfield":{"id":"https://openalex.org/subfields/1703","display_name":"Computational Theory and Mathematics"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},"topics":[{"id":"https://openalex.org/T12794","display_name":"Adaptive Dynamic Programming Control","score":0.9998999834060669,"subfield":{"id":"https://openalex.org/subfields/1703","display_name":"Computational Theory and Mathematics"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T10462","display_name":"Reinforcement Learning in Robotics","score":0.9851999878883362,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T10249","display_name":"Distributed Control Multi-Agent Systems","score":0.9818999767303467,"subfield":{"id":"https://openalex.org/subfields/1705","display_name":"Computer Networks and Communications"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}}],"keywords":[{"id":"https://openalex.org/keywords/reinforcement-learning","display_name":"Reinforcement learning","score":0.8084479570388794},{"id":"https://openalex.org/keywords/trajectory","display_name":"Trajectory","score":0.7851847410202026},{"id":"https://openalex.org/keywords/differential-game","display_name":"Differential game","score":0.6705678105354309},{"id":"https://openalex.org/keywords/tracking","display_name":"Tracking (education)","score":0.6468822956085205},{"id":"https://openalex.org/keywords/control-theory","display_name":"Control theory (sociology)","score":0.5582818388938904},{"id":"https://openalex.org/keywords/computer-science","display_name":"Computer science","score":0.5401180982589722},{"id":"https://openalex.org/keywords/differential","display_name":"Differential (mechanical device)","score":0.5185985565185547},{"id":"https://openalex.org/keywords/control","display_name":"Control (management)","score":0.4968571960926056},{"id":"https://openalex.org/keywords/artificial-intelligence","display_name":"Artificial intelligence","score":0.3923279643058777},{"id":"https://openalex.org/keywords/control-engineering","display_name":"Control engineering","score":0.36794495582580566},{"id":"https://openalex.org/keywords/engineering","display_name":"Engineering","score":0.3094971776008606},{"id":"https://openalex.org/keywords/aerospace-engineering","display_name":"Aerospace engineering","score":0.1887143850326538},{"id":"https://openalex.org/keywords/mathematics","display_name":"Mathematics","score":0.15807050466537476},{"id":"https://openalex.org/keywords/mathematical-optimization","display_name":"Mathematical optimization","score":0.1381916105747223},{"id":"https://openalex.org/keywords/physics","display_name":"Physics","score":0.09275549650192261}],"concepts":[{"id":"https://openalex.org/C97541855","wikidata":"https://www.wikidata.org/wiki/Q830687","display_name":"Reinforcement learning","level":2,"score":0.8084479570388794},{"id":"https://openalex.org/C13662910","wikidata":"https://www.wikidata.org/wiki/Q193139","display_name":"Trajectory","level":2,"score":0.7851847410202026},{"id":"https://openalex.org/C2779006483","wikidata":"https://www.wikidata.org/wiki/Q1973196","display_name":"Differential game","level":2,"score":0.6705678105354309},{"id":"https://openalex.org/C2775936607","wikidata":"https://www.wikidata.org/wiki/Q466845","display_name":"Tracking (education)","level":2,"score":0.6468822956085205},{"id":"https://openalex.org/C47446073","wikidata":"https://www.wikidata.org/wiki/Q5165890","display_name":"Control theory (sociology)","level":3,"score":0.5582818388938904},{"id":"https://openalex.org/C41008148","wikidata":"https://www.wikidata.org/wiki/Q21198","display_name":"Computer science","level":0,"score":0.5401180982589722},{"id":"https://openalex.org/C93226319","wikidata":"https://www.wikidata.org/wiki/Q193137","display_name":"Differential (mechanical device)","level":2,"score":0.5185985565185547},{"id":"https://openalex.org/C2775924081","wikidata":"https://www.wikidata.org/wiki/Q55608371","display_name":"Control (management)","level":2,"score":0.4968571960926056},{"id":"https://openalex.org/C154945302","wikidata":"https://www.wikidata.org/wiki/Q11660","display_name":"Artificial intelligence","level":1,"score":0.3923279643058777},{"id":"https://openalex.org/C133731056","wikidata":"https://www.wikidata.org/wiki/Q4917288","display_name":"Control engineering","level":1,"score":0.36794495582580566},{"id":"https://openalex.org/C127413603","wikidata":"https://www.wikidata.org/wiki/Q11023","display_name":"Engineering","level":0,"score":0.3094971776008606},{"id":"https://openalex.org/C146978453","wikidata":"https://www.wikidata.org/wiki/Q3798668","display_name":"Aerospace engineering","level":1,"score":0.1887143850326538},{"id":"https://openalex.org/C33923547","wikidata":"https://www.wikidata.org/wiki/Q395","display_name":"Mathematics","level":0,"score":0.15807050466537476},{"id":"https://openalex.org/C126255220","wikidata":"https://www.wikidata.org/wiki/Q141495","display_name":"Mathematical optimization","level":1,"score":0.1381916105747223},{"id":"https://openalex.org/C121332964","wikidata":"https://www.wikidata.org/wiki/Q413","display_name":"Physics","level":0,"score":0.09275549650192261},{"id":"https://openalex.org/C15744967","wikidata":"https://www.wikidata.org/wiki/Q9418","display_name":"Psychology","level":0,"score":0.0},{"id":"https://openalex.org/C19417346","wikidata":"https://www.wikidata.org/wiki/Q7922","display_name":"Pedagogy","level":1,"score":0.0},{"id":"https://openalex.org/C1276947","wikidata":"https://www.wikidata.org/wiki/Q333","display_name":"Astronomy","level":1,"score":0.0}],"mesh":[],"locations_count":1,"locations":[{"id":"doi:10.1177/01423312241267038","is_oa":false,"landing_page_url":"https://doi.org/10.1177/01423312241267038","pdf_url":null,"source":{"id":"https://openalex.org/S24148485","display_name":"Transactions of the Institute of Measurement and Control","issn_l":"0142-3312","issn":["0142-3312","1477-0369"],"is_oa":false,"is_in_doaj":false,"is_core":true,"host_organization":"https://openalex.org/P4310320017","host_organization_name":"SAGE Publishing","host_organization_lineage":["https://openalex.org/P4310320017"],"host_organization_lineage_names":["SAGE Publishing"],"type":"journal"},"license":null,"license_id":null,"version":"publishedVersion","is_accepted":true,"is_published":true,"raw_source_name":"Transactions of the Institute of Measurement and Control","raw_type":"journal-article"}],"best_oa_location":null,"sustainable_development_goals":[],"awards":[],"funders":[],"has_content":{"pdf":false,"grobid_xml":false},"content_urls":null,"referenced_works_count":27,"referenced_works":["https://openalex.org/W2010857923","https://openalex.org/W2090284141","https://openalex.org/W2107306424","https://openalex.org/W2108383324","https://openalex.org/W2148439597","https://openalex.org/W2475651303","https://openalex.org/W2484646121","https://openalex.org/W2790958326","https://openalex.org/W2911032305","https://openalex.org/W2925244937","https://openalex.org/W2963525569","https://openalex.org/W2981047237","https://openalex.org/W2983464671","https://openalex.org/W2988833249","https://openalex.org/W2999934039","https://openalex.org/W3045519138","https://openalex.org/W3080988596","https://openalex.org/W3088521775","https://openalex.org/W3102133152","https://openalex.org/W3126004433","https://openalex.org/W3212958986","https://openalex.org/W4211097982","https://openalex.org/W4296251576","https://openalex.org/W4312714074","https://openalex.org/W4312946510","https://openalex.org/W4362718213","https://openalex.org/W4388125284"],"related_works":["https://openalex.org/W4306904969","https://openalex.org/W2138720691","https://openalex.org/W4362501864","https://openalex.org/W2373557848","https://openalex.org/W2088970451","https://openalex.org/W2002488624","https://openalex.org/W2157008402","https://openalex.org/W2592302855","https://openalex.org/W4256290860","https://openalex.org/W2030449225"],"abstract_inverted_index":{"In":[0],"this":[1],"paper,":[2],"a":[3,31,53],"formation":[4,23],"cooperative":[5,24],"tracking":[6,25],"control":[7,26,65,70,95,110],"problem":[8,27,35],"for":[9],"unmanned":[10,43],"aerial":[11,44],"vehicles":[12],"is":[13,28,97],"investigated":[14],"via":[15,52,99],"non\u2013zero-sum":[16,33],"game":[17,34],"theory":[18],"and":[19],"reinforcement":[20],"learning.":[21],"The":[22,46,67,87],"converted":[29],"to":[30,36,57],"multi-player":[32],"attain":[37],"the":[38,59,77,84,91,105,108],"team":[39],"optimality":[40],"of":[41,83,90,107],"multiple":[42],"vehicles.":[45],"desired":[47],"trajectory":[48],"can":[49],"be":[50],"achieved":[51],"game-based":[54],"feedback":[55],"controller":[56],"minimize":[58],"global":[60,93],"cost":[61],"function":[62],"involving":[63],"all":[64],"policies.":[66],"Nash":[68],"equilibrium":[69],"laws":[71],"are":[72],"learned":[73],"based":[74],"on":[75],"only":[76],"collected":[78],"system":[79,96],"data,":[80],"without":[81],"knowledge":[82],"vehicle":[85],"dynamics.":[86],"asymptotic":[88],"convergence":[89],"constructed":[92],"closed-loop":[94],"proven":[98],"theoretical":[100],"analysis.":[101],"Simulation":[102],"results":[103],"validate":[104],"effectiveness":[106],"proposed":[109],"method.":[111]},"counts_by_year":[{"year":2026,"cited_by_count":2},{"year":2025,"cited_by_count":3}],"updated_date":"2026-05-21T06:26:12.895304","created_date":"2025-10-10T00:00:00"}