{"id":"https://openalex.org/W4403535444","doi":"https://doi.org/10.1109/icarm62033.2024.10715990","title":"Dynamic Formation Planning and Control for Robot Soccer Game with Multi-Agent Reinforcement Learning and Behavioral Model","display_name":"Dynamic Formation Planning and Control for Robot Soccer Game with Multi-Agent Reinforcement Learning and Behavioral Model","publication_year":2024,"publication_date":"2024-07-08","ids":{"openalex":"https://openalex.org/W4403535444","doi":"https://doi.org/10.1109/icarm62033.2024.10715990"},"language":"en","primary_location":{"id":"doi:10.1109/icarm62033.2024.10715990","is_oa":false,"landing_page_url":"https://doi.org/10.1109/icarm62033.2024.10715990","pdf_url":null,"source":null,"license":null,"license_id":null,"version":"publishedVersion","is_accepted":true,"is_published":true,"raw_source_name":"2024 International Conference on Advanced Robotics and Mechatronics (ICARM)","raw_type":"proceedings-article"},"type":"conference-paper","indexed_in":["crossref"],"open_access":{"is_oa":false,"oa_status":"closed","oa_url":null,"any_repository_has_fulltext":false},"authorships":[{"author_position":"first","author":{"id":"https://openalex.org/A5101249224","display_name":"Haier Zhu","orcid":"https://orcid.org/0000-0003-0908-0337"},"institutions":[{"id":"https://openalex.org/I4210114105","display_name":"Tsinghua\u2013Berkeley Shenzhen Institute","ror":"https://ror.org/02hhwwz98","country_code":"CN","type":"facility","lineage":["https://openalex.org/I4210114105","https://openalex.org/I95457486","https://openalex.org/I99065089"]}],"countries":["CN"],"is_corresponding":false,"raw_author_name":"Haier Zhu","raw_affiliation_strings":["Tsinghua Shenzhen International Graduate School,Shenzhen,China,518055"],"raw_orcid":null,"affiliations":[{"raw_affiliation_string":"Tsinghua Shenzhen International Graduate School,Shenzhen,China,518055","institution_ids":["https://openalex.org/I4210114105"]}]},{"author_position":"middle","author":{"id":"https://openalex.org/A5031855148","display_name":"Hanzhong Zhong","orcid":"https://orcid.org/0000-0002-2539-9252"},"institutions":[{"id":"https://openalex.org/I99065089","display_name":"Tsinghua University","ror":"https://ror.org/03cve4549","country_code":"CN","type":"education","lineage":["https://openalex.org/I99065089"]}],"countries":["CN"],"is_corresponding":false,"raw_author_name":"Hanzhong Zhong","raw_affiliation_strings":["Tsinghua University,Department of Automation,Beijing,China,100084"],"raw_orcid":null,"affiliations":[{"raw_affiliation_string":"Tsinghua University,Department of Automation,Beijing,China,100084","institution_ids":["https://openalex.org/I99065089"]}]},{"author_position":"middle","author":{"id":"https://openalex.org/A5110951538","display_name":"Bo Yan","orcid":"https://orcid.org/0000-0003-1750-3803"},"institutions":[{"id":"https://openalex.org/I4210114105","display_name":"Tsinghua\u2013Berkeley Shenzhen Institute","ror":"https://ror.org/02hhwwz98","country_code":"CN","type":"facility","lineage":["https://openalex.org/I4210114105","https://openalex.org/I95457486","https://openalex.org/I99065089"]}],"countries":["CN"],"is_corresponding":false,"raw_author_name":"Bo Yan","raw_affiliation_strings":["Tsinghua Shenzhen International Graduate School,Shenzhen,China,518055"],"raw_orcid":null,"affiliations":[{"raw_affiliation_string":"Tsinghua Shenzhen International Graduate School,Shenzhen,China,518055","institution_ids":["https://openalex.org/I4210114105"]}]},{"author_position":"last","author":{"id":"https://openalex.org/A5100331032","display_name":"Xiang Li","orcid":"https://orcid.org/0000-0002-0699-1904"},"institutions":[{"id":"https://openalex.org/I99065089","display_name":"Tsinghua University","ror":"https://ror.org/03cve4549","country_code":"CN","type":"education","lineage":["https://openalex.org/I99065089"]}],"countries":["CN"],"is_corresponding":false,"raw_author_name":"Xiang Li","raw_affiliation_strings":["Tsinghua University,Department of Automation,Beijing,China,100084"],"raw_orcid":null,"affiliations":[{"raw_affiliation_string":"Tsinghua University,Department of Automation,Beijing,China,100084","institution_ids":["https://openalex.org/I99065089"]}]}],"institutions":[],"countries_distinct_count":1,"institutions_distinct_count":2,"corresponding_author_ids":[],"corresponding_institution_ids":[],"apc_list":null,"apc_paid":null,"fwci":null,"has_fulltext":false,"cited_by_count":1,"citation_normalized_percentile":null,"cited_by_percentile_year":null,"biblio":{"volume":null,"issue":null,"first_page":"837","last_page":"842"},"is_retracted":false,"is_paratext":false,"is_xpac":false,"primary_topic":{"id":"https://openalex.org/T11500","display_name":"Evacuation and Crowd Dynamics","score":0.6757000088691711,"subfield":{"id":"https://openalex.org/subfields/2212","display_name":"Ocean Engineering"},"field":{"id":"https://openalex.org/fields/22","display_name":"Engineering"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},"topics":[{"id":"https://openalex.org/T11500","display_name":"Evacuation and Crowd Dynamics","score":0.6757000088691711,"subfield":{"id":"https://openalex.org/subfields/2212","display_name":"Ocean Engineering"},"field":{"id":"https://openalex.org/fields/22","display_name":"Engineering"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}}],"keywords":[{"id":"https://openalex.org/keywords/reinforcement-learning","display_name":"Reinforcement learning","score":0.890511155128479},{"id":"https://openalex.org/keywords/computer-science","display_name":"Computer science","score":0.6500345468521118},{"id":"https://openalex.org/keywords/robot","display_name":"Robot","score":0.5189371109008789},{"id":"https://openalex.org/keywords/control","display_name":"Control (management)","score":0.4929473400115967},{"id":"https://openalex.org/keywords/reinforcement","display_name":"Reinforcement","score":0.4694623053073883},{"id":"https://openalex.org/keywords/artificial-intelligence","display_name":"Artificial intelligence","score":0.427822470664978},{"id":"https://openalex.org/keywords/human\u2013computer-interaction","display_name":"Human\u2013computer interaction","score":0.3520125150680542},{"id":"https://openalex.org/keywords/psychology","display_name":"Psychology","score":0.16452863812446594},{"id":"https://openalex.org/keywords/social-psychology","display_name":"Social psychology","score":0.06740924715995789}],"concepts":[{"id":"https://openalex.org/C97541855","wikidata":"https://www.wikidata.org/wiki/Q830687","display_name":"Reinforcement learning","level":2,"score":0.890511155128479},{"id":"https://openalex.org/C41008148","wikidata":"https://www.wikidata.org/wiki/Q21198","display_name":"Computer science","level":0,"score":0.6500345468521118},{"id":"https://openalex.org/C90509273","wikidata":"https://www.wikidata.org/wiki/Q11012","display_name":"Robot","level":2,"score":0.5189371109008789},{"id":"https://openalex.org/C2775924081","wikidata":"https://www.wikidata.org/wiki/Q55608371","display_name":"Control (management)","level":2,"score":0.4929473400115967},{"id":"https://openalex.org/C67203356","wikidata":"https://www.wikidata.org/wiki/Q1321905","display_name":"Reinforcement","level":2,"score":0.4694623053073883},{"id":"https://openalex.org/C154945302","wikidata":"https://www.wikidata.org/wiki/Q11660","display_name":"Artificial intelligence","level":1,"score":0.427822470664978},{"id":"https://openalex.org/C107457646","wikidata":"https://www.wikidata.org/wiki/Q207434","display_name":"Human\u2013computer interaction","level":1,"score":0.3520125150680542},{"id":"https://openalex.org/C15744967","wikidata":"https://www.wikidata.org/wiki/Q9418","display_name":"Psychology","level":0,"score":0.16452863812446594},{"id":"https://openalex.org/C77805123","wikidata":"https://www.wikidata.org/wiki/Q161272","display_name":"Social psychology","level":1,"score":0.06740924715995789}],"mesh":[],"locations_count":1,"locations":[{"id":"doi:10.1109/icarm62033.2024.10715990","is_oa":false,"landing_page_url":"https://doi.org/10.1109/icarm62033.2024.10715990","pdf_url":null,"source":null,"license":null,"license_id":null,"version":"publishedVersion","is_accepted":true,"is_published":true,"raw_source_name":"2024 International Conference on Advanced Robotics and Mechatronics (ICARM)","raw_type":"proceedings-article"}],"best_oa_location":null,"sustainable_development_goals":[],"awards":[],"funders":[{"id":"https://openalex.org/F4320321001","display_name":"National Natural Science Foundation of China","ror":"https://ror.org/01h0zpd94"}],"has_content":{"grobid_xml":false,"pdf":false},"content_urls":null,"referenced_works_count":24,"referenced_works":["https://openalex.org/W1580572138","https://openalex.org/W2074500080","https://openalex.org/W2078705464","https://openalex.org/W2096145798","https://openalex.org/W2098371961","https://openalex.org/W2122136202","https://openalex.org/W2166042125","https://openalex.org/W2409517661","https://openalex.org/W2617547828","https://openalex.org/W2902907165","https://openalex.org/W2963041255","https://openalex.org/W3137739741","https://openalex.org/W3142421752","https://openalex.org/W3158362201","https://openalex.org/W4250983876","https://openalex.org/W4280596052","https://openalex.org/W4285178365","https://openalex.org/W6633127230","https://openalex.org/W6691861496","https://openalex.org/W6734678876","https://openalex.org/W6741408367","https://openalex.org/W6754779100","https://openalex.org/W6757382098","https://openalex.org/W6766805167"],"related_works":["https://openalex.org/W4310083477","https://openalex.org/W2328553770","https://openalex.org/W2920061524","https://openalex.org/W1977959518","https://openalex.org/W2038908348","https://openalex.org/W2107890255","https://openalex.org/W2106552856","https://openalex.org/W2145821588","https://openalex.org/W2086122291","https://openalex.org/W1987513656"],"abstract_inverted_index":{"The":[0,119,138],"robot":[1,30,83],"soccer":[2,31,73,84],"game":[3,32],"has":[4,25],"been":[5,26],"considered":[6],"as":[7],"an":[8],"illustrative":[9],"scenario":[10],"to":[11,134,146,162,173],"test":[12],"the":[13,36,49,56,59,69,79,96,106,136,147,151,164,167,171,174],"performance":[14,165],"of":[15,71,108,140,150,166],"research":[16],"outcomes":[17],"on":[18,78,115],"multi-agent":[19],"systems":[20],"(MAS).":[21],"While":[22],"various":[23],"algorithm":[24],"developed":[27],"for":[28,51],"a":[29,88,100,116,125,132],"and":[33,53,86,92,103,112,129,156,170],"implemented":[34],"in":[35,45,68,82],"RoboCup":[37],"competition,":[38],"relatively":[39],"little":[40],"collaboration":[41,80],"can":[42],"be":[43],"found":[44],"existing":[46],"results,":[47],"e.g.,":[48],"formation":[50,90,102,176],"passing":[52],"dribbling":[54],"during":[55,62],"offense":[57],"or":[58],"collaborative":[60],"obstruction":[61],"defense,":[63],"which":[64],"are":[65,159],"very":[66],"common":[67],"teamwork":[70],"human":[72],"game.":[74],"This":[75],"paper":[76],"focuses":[77],"problem":[81],"games":[85],"proposes":[87],"dynamic":[89],"planning":[91],"control":[93],"strategy.":[94],"Specifically,":[95],"offensive":[97],"team":[98,121],"maintains":[99],"desired":[101,175],"transits":[104],"among":[105],"tasks":[107],"catching,":[109],"passing,":[110],"dribbling,":[111],"kicking":[113],"based":[114],"behavioral":[117],"model.":[118],"defensive":[120],"is":[122,177],"regulated":[123],"by":[124],"reinforcement-learning-based":[126],"policy":[127],"network":[128],"dynamically":[130],"forms":[131],"barrier":[133],"obstruct":[135],"offender.":[137],"strategies":[139],"both":[141],"teams":[142],"will":[143],"swap":[144],"according":[145],"evolving":[148],"situation":[149],"match.":[152],"Both":[153],"simulation":[154],"studies":[155],"real-world":[157],"experiments":[158],"carried":[160],"out":[161],"illustrate":[163],"proposed":[168],"method,":[169],"convergence":[172],"also":[178],"rigorously":[179],"proved.":[180]},"counts_by_year":[{"year":2025,"cited_by_count":1}],"updated_date":"2026-07-14T23:27:15.235271","created_date":"2025-10-10T00:00:00"}