{"id":"https://openalex.org/W3112808542","doi":"https://doi.org/10.1109/smc42975.2020.9282974","title":"GHGC: Goal-based Hierarchical Group Communication in Multi-Agent Reinforcement Learning","display_name":"GHGC: Goal-based Hierarchical Group Communication in Multi-Agent Reinforcement Learning","publication_year":2020,"publication_date":"2020-10-11","ids":{"openalex":"https://openalex.org/W3112808542","doi":"https://doi.org/10.1109/smc42975.2020.9282974","mag":"3112808542"},"language":"en","primary_location":{"id":"doi:10.1109/smc42975.2020.9282974","is_oa":false,"landing_page_url":"https://doi.org/10.1109/smc42975.2020.9282974","pdf_url":null,"source":null,"license":null,"license_id":null,"version":"publishedVersion","is_accepted":true,"is_published":true,"raw_source_name":"2020 IEEE International Conference on Systems, Man, and Cybernetics (SMC)","raw_type":"proceedings-article"},"type":"article","indexed_in":["crossref"],"open_access":{"is_oa":false,"oa_status":"closed","oa_url":null,"any_repository_has_fulltext":false},"authorships":[{"author_position":"first","author":{"id":"https://openalex.org/A5101763478","display_name":"Hao Jiang","orcid":"https://orcid.org/0000-0002-8304-3692"},"institutions":[{"id":"https://openalex.org/I170215575","display_name":"National University of Defense Technology","ror":"https://ror.org/05d2yfz11","country_code":"CN","type":"education","lineage":["https://openalex.org/I170215575"]}],"countries":["CN"],"is_corresponding":false,"raw_author_name":"Hao Jiang","raw_affiliation_strings":["College of Computer, National University of Defense Technology, Changsha, China"],"raw_orcid":null,"affiliations":[{"raw_affiliation_string":"College of Computer, National University of Defense Technology, Changsha, China","institution_ids":["https://openalex.org/I170215575"]}]},{"author_position":"middle","author":{"id":"https://openalex.org/A5019758816","display_name":"Dianxi Shi","orcid":"https://orcid.org/0000-0002-8112-371X"},"institutions":[{"id":"https://openalex.org/I4210100255","display_name":"Beijing Academy of Artificial Intelligence","ror":"https://ror.org/016a74861","country_code":"CN","type":"other","lineage":["https://openalex.org/I4210100255"]}],"countries":["CN"],"is_corresponding":false,"raw_author_name":"Dianxi Shi","raw_affiliation_strings":["Tianjin Artificial Intelligence Innovation Center, National Innovation Institute of Defense Technology, Beijing, China"],"raw_orcid":null,"affiliations":[{"raw_affiliation_string":"Tianjin Artificial Intelligence Innovation Center, National Innovation Institute of Defense Technology, Beijing, China","institution_ids":["https://openalex.org/I4210100255"]}]},{"author_position":"middle","author":{"id":"https://openalex.org/A5100884245","display_name":"Chao Xue","orcid":"https://orcid.org/0000-0002-9507-9991"},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Chao Xue","raw_affiliation_strings":["Artificial Intelligence Research Center, National Innovation Institute of Defense Technology, Beijing, China"],"raw_orcid":null,"affiliations":[{"raw_affiliation_string":"Artificial Intelligence Research Center, National Innovation Institute of Defense Technology, Beijing, China","institution_ids":[]}]},{"author_position":"middle","author":{"id":"https://openalex.org/A5100455413","display_name":"Yajie Wang","orcid":"https://orcid.org/0000-0002-0962-4464"},"institutions":[{"id":"https://openalex.org/I170215575","display_name":"National University of Defense Technology","ror":"https://ror.org/05d2yfz11","country_code":"CN","type":"education","lineage":["https://openalex.org/I170215575"]}],"countries":["CN"],"is_corresponding":false,"raw_author_name":"Yajie Wang","raw_affiliation_strings":["College of Compute, National University of Defense Technology, Changsha, China"],"raw_orcid":null,"affiliations":[{"raw_affiliation_string":"College of Compute, National University of Defense Technology, Changsha, China","institution_ids":["https://openalex.org/I170215575"]}]},{"author_position":"middle","author":{"id":"https://openalex.org/A5031404939","display_name":"Gongju Wang","orcid":"https://orcid.org/0000-0002-7162-3067"},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Gongju Wang","raw_affiliation_strings":["Artificial Intelligence Research Center, National Innovation Institute of Defense Technology, Beijing, China"],"raw_orcid":null,"affiliations":[{"raw_affiliation_string":"Artificial Intelligence Research Center, National Innovation Institute of Defense Technology, Beijing, China","institution_ids":[]}]},{"author_position":"last","author":{"id":"https://openalex.org/A5060842785","display_name":"Yongjun Zhang","orcid":"https://orcid.org/0000-0002-7793-8318"},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Yongjun Zhang","raw_affiliation_strings":["Artificial Intelligence Research Center, National Innovation Institute of Defense Technology, Beijing, China"],"raw_orcid":null,"affiliations":[{"raw_affiliation_string":"Artificial Intelligence Research Center, National Innovation Institute of Defense Technology, Beijing, China","institution_ids":[]}]}],"institutions":[],"countries_distinct_count":1,"institutions_distinct_count":6,"corresponding_author_ids":[],"corresponding_institution_ids":[],"apc_list":null,"apc_paid":null,"fwci":0.6771,"has_fulltext":false,"cited_by_count":5,"citation_normalized_percentile":{"value":0.7763985,"is_in_top_1_percent":false,"is_in_top_10_percent":false},"cited_by_percentile_year":{"min":90,"max":96},"biblio":{"volume":"2","issue":null,"first_page":"3507","last_page":"3514"},"is_retracted":false,"is_paratext":false,"is_xpac":false,"primary_topic":{"id":"https://openalex.org/T10462","display_name":"Reinforcement Learning in Robotics","score":0.9991000294685364,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},"topics":[{"id":"https://openalex.org/T10462","display_name":"Reinforcement Learning in Robotics","score":0.9991000294685364,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T11574","display_name":"Artificial Intelligence in Games","score":0.9853000044822693,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T11252","display_name":"Evolutionary Game Theory and Cooperation","score":0.98089998960495,"subfield":{"id":"https://openalex.org/subfields/3312","display_name":"Sociology and Political Science"},"field":{"id":"https://openalex.org/fields/33","display_name":"Social Sciences"},"domain":{"id":"https://openalex.org/domains/2","display_name":"Social Sciences"}}],"keywords":[{"id":"https://openalex.org/keywords/reinforcement-learning","display_name":"Reinforcement learning","score":0.8558765649795532},{"id":"https://openalex.org/keywords/computer-science","display_name":"Computer science","score":0.7511837482452393},{"id":"https://openalex.org/keywords/consistency","display_name":"Consistency (knowledge bases)","score":0.5591447353363037},{"id":"https://openalex.org/keywords/artificial-intelligence","display_name":"Artificial intelligence","score":0.5025482177734375},{"id":"https://openalex.org/keywords/process","display_name":"Process (computing)","score":0.4957641065120697},{"id":"https://openalex.org/keywords/communication-in-small-groups","display_name":"Communication in small groups","score":0.4894157946109772},{"id":"https://openalex.org/keywords/scale","display_name":"Scale (ratio)","score":0.4818497896194458},{"id":"https://openalex.org/keywords/decomposition","display_name":"Decomposition","score":0.46822330355644226},{"id":"https://openalex.org/keywords/group","display_name":"Group (periodic table)","score":0.436930775642395},{"id":"https://openalex.org/keywords/multi-agent-system","display_name":"Multi-agent system","score":0.42420047521591187},{"id":"https://openalex.org/keywords/machine-learning","display_name":"Machine learning","score":0.36792030930519104},{"id":"https://openalex.org/keywords/distributed-computing","display_name":"Distributed computing","score":0.3437170386314392}],"concepts":[{"id":"https://openalex.org/C97541855","wikidata":"https://www.wikidata.org/wiki/Q830687","display_name":"Reinforcement learning","level":2,"score":0.8558765649795532},{"id":"https://openalex.org/C41008148","wikidata":"https://www.wikidata.org/wiki/Q21198","display_name":"Computer science","level":0,"score":0.7511837482452393},{"id":"https://openalex.org/C2776436953","wikidata":"https://www.wikidata.org/wiki/Q5163215","display_name":"Consistency (knowledge bases)","level":2,"score":0.5591447353363037},{"id":"https://openalex.org/C154945302","wikidata":"https://www.wikidata.org/wiki/Q11660","display_name":"Artificial intelligence","level":1,"score":0.5025482177734375},{"id":"https://openalex.org/C98045186","wikidata":"https://www.wikidata.org/wiki/Q205663","display_name":"Process (computing)","level":2,"score":0.4957641065120697},{"id":"https://openalex.org/C44871818","wikidata":"https://www.wikidata.org/wiki/Q5154139","display_name":"Communication in small groups","level":2,"score":0.4894157946109772},{"id":"https://openalex.org/C2778755073","wikidata":"https://www.wikidata.org/wiki/Q10858537","display_name":"Scale (ratio)","level":2,"score":0.4818497896194458},{"id":"https://openalex.org/C124681953","wikidata":"https://www.wikidata.org/wiki/Q339062","display_name":"Decomposition","level":2,"score":0.46822330355644226},{"id":"https://openalex.org/C2781311116","wikidata":"https://www.wikidata.org/wiki/Q83306","display_name":"Group (periodic table)","level":2,"score":0.436930775642395},{"id":"https://openalex.org/C41550386","wikidata":"https://www.wikidata.org/wiki/Q529909","display_name":"Multi-agent system","level":2,"score":0.42420047521591187},{"id":"https://openalex.org/C119857082","wikidata":"https://www.wikidata.org/wiki/Q2539","display_name":"Machine learning","level":1,"score":0.36792030930519104},{"id":"https://openalex.org/C120314980","wikidata":"https://www.wikidata.org/wiki/Q180634","display_name":"Distributed computing","level":1,"score":0.3437170386314392},{"id":"https://openalex.org/C178790620","wikidata":"https://www.wikidata.org/wiki/Q11351","display_name":"Organic chemistry","level":1,"score":0.0},{"id":"https://openalex.org/C185592680","wikidata":"https://www.wikidata.org/wiki/Q2329","display_name":"Chemistry","level":0,"score":0.0},{"id":"https://openalex.org/C18903297","wikidata":"https://www.wikidata.org/wiki/Q7150","display_name":"Ecology","level":1,"score":0.0},{"id":"https://openalex.org/C111919701","wikidata":"https://www.wikidata.org/wiki/Q9135","display_name":"Operating system","level":1,"score":0.0},{"id":"https://openalex.org/C62520636","wikidata":"https://www.wikidata.org/wiki/Q944","display_name":"Quantum mechanics","level":1,"score":0.0},{"id":"https://openalex.org/C86803240","wikidata":"https://www.wikidata.org/wiki/Q420","display_name":"Biology","level":0,"score":0.0},{"id":"https://openalex.org/C121332964","wikidata":"https://www.wikidata.org/wiki/Q413","display_name":"Physics","level":0,"score":0.0}],"mesh":[],"locations_count":1,"locations":[{"id":"doi:10.1109/smc42975.2020.9282974","is_oa":false,"landing_page_url":"https://doi.org/10.1109/smc42975.2020.9282974","pdf_url":null,"source":null,"license":null,"license_id":null,"version":"publishedVersion","is_accepted":true,"is_published":true,"raw_source_name":"2020 IEEE International Conference on Systems, Man, and Cybernetics (SMC)","raw_type":"proceedings-article"}],"best_oa_location":null,"sustainable_development_goals":[{"id":"https://metadata.un.org/sdg/17","display_name":"Partnerships for the goals","score":0.4699999988079071}],"awards":[],"funders":[{"id":"https://openalex.org/F4320321543","display_name":"China Postdoctoral Science Foundation","ror":"https://ror.org/0426zh255"},{"id":"https://openalex.org/F4320337504","display_name":"Research and Development","ror":"https://ror.org/027s68j25"}],"has_content":{"pdf":false,"grobid_xml":false},"content_urls":null,"referenced_works_count":52,"referenced_works":["https://openalex.org/W2054339854","https://openalex.org/W2128814508","https://openalex.org/W2145339207","https://openalex.org/W2168977355","https://openalex.org/W2405878133","https://openalex.org/W2580105916","https://openalex.org/W2601465345","https://openalex.org/W2617547828","https://openalex.org/W2749807327","https://openalex.org/W2766447205","https://openalex.org/W2785315072","https://openalex.org/W2794643322","https://openalex.org/W2803155336","https://openalex.org/W2894976951","https://openalex.org/W2896451037","https://openalex.org/W2949886883","https://openalex.org/W2962938168","https://openalex.org/W2962966033","https://openalex.org/W2963039558","https://openalex.org/W2963407617","https://openalex.org/W2963588154","https://openalex.org/W2963717208","https://openalex.org/W2964014087","https://openalex.org/W2964338167","https://openalex.org/W2965163470","https://openalex.org/W2975185915","https://openalex.org/W2987046690","https://openalex.org/W2997070234","https://openalex.org/W2998367975","https://openalex.org/W3031321468","https://openalex.org/W3099134564","https://openalex.org/W4289100326","https://openalex.org/W4289363497","https://openalex.org/W4295598622","https://openalex.org/W4299802797","https://openalex.org/W4306179383","https://openalex.org/W6684660688","https://openalex.org/W6713411898","https://openalex.org/W6735698609","https://openalex.org/W6738796088","https://openalex.org/W6743756900","https://openalex.org/W6747941106","https://openalex.org/W6751139674","https://openalex.org/W6755069753","https://openalex.org/W6755542948","https://openalex.org/W6755662481","https://openalex.org/W6757784512","https://openalex.org/W6768395096","https://openalex.org/W6770126465","https://openalex.org/W6771817571","https://openalex.org/W6846392434","https://openalex.org/W6864424756"],"related_works":["https://openalex.org/W4306904969","https://openalex.org/W2138720691","https://openalex.org/W4362501864","https://openalex.org/W4380318855","https://openalex.org/W2031695474","https://openalex.org/W3084456289","https://openalex.org/W2024136090","https://openalex.org/W4391331176","https://openalex.org/W2586732548","https://openalex.org/W2159684889"],"abstract_inverted_index":{"In":[0,37],"large-scale":[1,182],"multi-agent":[2,38,70],"systems,":[3,39],"the":[4,30,42,78,89,94,103,126,133,154,167],"existence":[5],"of":[6,10,81,96,107],"a":[7,116,143],"large":[8],"number":[9,104],"agents":[11,40,83,108,127],"with":[12,41,51],"different":[13,129,174],"target":[14,44],"tasks":[15,45],"and":[16,54,105,131,146,176],"connected":[17],"by":[18],"complex":[19],"game":[20],"relationships":[21],"causes":[22,93],"great":[23],"difficulty":[24,95],"for":[25,181],"policy":[26,97],"learning.":[27],"Therefore,":[28],"simplifying":[29],"learning":[31,72,98],"process":[32],"is":[33],"an":[34],"important":[35],"issue.":[36],"same":[43],"or":[46],"attributes":[47],"often":[48],"interact":[49],"more":[50,57],"each":[52],"other":[53],"exhibit":[55],"behaviors":[56],"similar.":[58],"That":[59],"means":[60],"there":[61],"are":[62],"stronger":[63],"collaborations":[64],"between":[65,153],"these":[66],"agents.":[67],"Most":[68],"existing":[69],"reinforcement":[71],"(MARL)":[73],"algorithms":[74],"expect":[75],"to":[76,87,99,150],"learn":[77],"collaborative":[79],"strategies":[80],"all":[82],"directly":[84],"in":[85],"order":[86],"maximize":[88],"common":[90],"rewards.":[91],"This":[92,123],"increase":[100],"exponentially":[101],"as":[102],"types":[106],"increase.":[109],"To":[110],"address":[111],"this":[112],"problem,":[113],"we":[114,141],"propose":[115],"goal-based":[117],"hierarchical":[118],"group":[119,144],"communication":[120,145],"(GHGC)":[121],"algorithm.":[122],"algorithm":[124],"divides":[125],"into":[128],"groups,":[130],"maintains":[132],"group's":[134],"cognitive":[135],"consistency":[136],"through":[137],"knowledge":[138],"sharing.":[139],"Subsequently,":[140],"introduce":[142],"value":[147,180],"decomposition":[148],"method":[149],"ensure":[151],"cooperation":[152],"various":[155],"groups.":[156],"Experiments":[157],"demonstrate":[158],"that":[159],"our":[160],"model":[161],"outperforms":[162],"state-of-the-art":[163],"MARL":[164],"methods":[165],"on":[166],"widely":[168],"adopted":[169],"StarCraft":[170],"II":[171],"benchmarks":[172],"across":[173],"scenarios,":[175],"also":[177],"possesses":[178],"potential":[179],"real-world":[183],"applications.":[184]},"counts_by_year":[{"year":2023,"cited_by_count":1},{"year":2022,"cited_by_count":2},{"year":2021,"cited_by_count":2}],"updated_date":"2026-06-11T09:08:48.828518","created_date":"2025-10-10T00:00:00"}