{"id":"https://openalex.org/W4414405057","doi":"https://doi.org/10.1109/iccworkshops67674.2025.11162376","title":"Graph Based Deep Reinforcement Learning Aided by Transformers for Multi-Agent Cooperation","display_name":"Graph Based Deep Reinforcement Learning Aided by Transformers for Multi-Agent Cooperation","publication_year":2025,"publication_date":"2025-06-08","ids":{"openalex":"https://openalex.org/W4414405057","doi":"https://doi.org/10.1109/iccworkshops67674.2025.11162376"},"language":"en","primary_location":{"id":"doi:10.1109/iccworkshops67674.2025.11162376","is_oa":false,"landing_page_url":"https://doi.org/10.1109/iccworkshops67674.2025.11162376","pdf_url":null,"source":null,"license":null,"license_id":null,"version":"publishedVersion","is_accepted":true,"is_published":true,"raw_source_name":"2025 IEEE International Conference on Communications Workshops (ICC Workshops)","raw_type":"proceedings-article"},"type":"conference-paper","indexed_in":["crossref"],"open_access":{"is_oa":false,"oa_status":"closed","oa_url":null,"any_repository_has_fulltext":false},"authorships":[{"author_position":"first","author":{"id":"https://openalex.org/A5119695047","display_name":"Michael Elrod","orcid":null},"institutions":[{"id":"https://openalex.org/I8078737","display_name":"Clemson University","ror":"https://ror.org/037s24f05","country_code":"US","type":"education","lineage":["https://openalex.org/I8078737"]}],"countries":["US"],"is_corresponding":false,"raw_author_name":"Michael Elrod","raw_affiliation_strings":["Clemson University,School of Computing,Clemson,SC,USA"],"raw_orcid":null,"affiliations":[{"raw_affiliation_string":"Clemson University,School of Computing,Clemson,SC,USA","institution_ids":["https://openalex.org/I8078737"]}]},{"author_position":"middle","author":{"id":"https://openalex.org/A5082851711","display_name":"Niloufar Mehrabi","orcid":"https://orcid.org/0000-0001-6507-0243"},"institutions":[{"id":"https://openalex.org/I8078737","display_name":"Clemson University","ror":"https://ror.org/037s24f05","country_code":"US","type":"education","lineage":["https://openalex.org/I8078737"]}],"countries":["US"],"is_corresponding":false,"raw_author_name":"Niloufar Mehrabi","raw_affiliation_strings":["Clemson University,School of Computing,Clemson,SC,USA"],"raw_orcid":null,"affiliations":[{"raw_affiliation_string":"Clemson University,School of Computing,Clemson,SC,USA","institution_ids":["https://openalex.org/I8078737"]}]},{"author_position":"middle","author":{"id":"https://openalex.org/A5085194763","display_name":"Rahul Amin","orcid":"https://orcid.org/0000-0002-2865-2356"},"institutions":[{"id":"https://openalex.org/I4210122954","display_name":"MIT Lincoln Laboratory","ror":"https://ror.org/022z6jk58","country_code":"US","type":"facility","lineage":["https://openalex.org/I4210122954","https://openalex.org/I63966007"]},{"id":"https://openalex.org/I63966007","display_name":"Massachusetts Institute of Technology","ror":"https://ror.org/042nb2s44","country_code":"US","type":"education","lineage":["https://openalex.org/I63966007"]}],"countries":["US"],"is_corresponding":false,"raw_author_name":"Rahul Amin","raw_affiliation_strings":["Massachusetts Institute of Technology,Lincoln Laboratory,Lexington,MA,USA"],"raw_orcid":null,"affiliations":[{"raw_affiliation_string":"Massachusetts Institute of Technology,Lincoln Laboratory,Lexington,MA,USA","institution_ids":["https://openalex.org/I4210122954","https://openalex.org/I63966007"]}]},{"author_position":"middle","author":{"id":"https://openalex.org/A5060173129","display_name":"Manveen Kaur","orcid":"https://orcid.org/0000-0003-0003-5206"},"institutions":[{"id":"https://openalex.org/I27825529","display_name":"California State University Los Angeles","ror":"https://ror.org/0294hxs80","country_code":"US","type":"education","lineage":["https://openalex.org/I27825529"]}],"countries":["US"],"is_corresponding":false,"raw_author_name":"Manveen Kaur","raw_affiliation_strings":["California State University,Computer Science Department,Los Angeles,CA,USA"],"raw_orcid":null,"affiliations":[{"raw_affiliation_string":"California State University,Computer Science Department,Los Angeles,CA,USA","institution_ids":["https://openalex.org/I27825529"]}]},{"author_position":"middle","author":{"id":"https://openalex.org/A5112228608","display_name":"Long Cheng","orcid":"https://orcid.org/0009-0003-8338-7545"},"institutions":[{"id":"https://openalex.org/I8078737","display_name":"Clemson University","ror":"https://ror.org/037s24f05","country_code":"US","type":"education","lineage":["https://openalex.org/I8078737"]}],"countries":["US"],"is_corresponding":false,"raw_author_name":"Long Cheng","raw_affiliation_strings":["Clemson University,School of Computing,Clemson,SC,USA"],"raw_orcid":null,"affiliations":[{"raw_affiliation_string":"Clemson University,School of Computing,Clemson,SC,USA","institution_ids":["https://openalex.org/I8078737"]}]},{"author_position":"middle","author":{"id":null,"display_name":"Jim Martin","orcid":null},"institutions":[{"id":"https://openalex.org/I8078737","display_name":"Clemson University","ror":"https://ror.org/037s24f05","country_code":"US","type":"education","lineage":["https://openalex.org/I8078737"]}],"countries":["US"],"is_corresponding":false,"raw_author_name":"Jim Martin","raw_affiliation_strings":["Clemson University,School of Computing,Clemson,SC,USA"],"raw_orcid":null,"affiliations":[{"raw_affiliation_string":"Clemson University,School of Computing,Clemson,SC,USA","institution_ids":["https://openalex.org/I8078737"]}]},{"author_position":"last","author":{"id":"https://openalex.org/A5011987346","display_name":"Abolfazl Razi","orcid":"https://orcid.org/0000-0002-3330-6132"},"institutions":[{"id":"https://openalex.org/I8078737","display_name":"Clemson University","ror":"https://ror.org/037s24f05","country_code":"US","type":"education","lineage":["https://openalex.org/I8078737"]}],"countries":["US"],"is_corresponding":false,"raw_author_name":"Abolfazl Razi","raw_affiliation_strings":["Clemson University,School of Computing,Clemson,SC,USA"],"raw_orcid":null,"affiliations":[{"raw_affiliation_string":"Clemson University,School of Computing,Clemson,SC,USA","institution_ids":["https://openalex.org/I8078737"]}]}],"institutions":[],"countries_distinct_count":1,"institutions_distinct_count":4,"corresponding_author_ids":[],"corresponding_institution_ids":[],"apc_list":null,"apc_paid":null,"fwci":6.7072,"has_fulltext":false,"cited_by_count":4,"citation_normalized_percentile":{"value":0.97177603,"is_in_top_1_percent":false,"is_in_top_10_percent":true},"cited_by_percentile_year":{"min":95,"max":98},"biblio":{"volume":null,"issue":null,"first_page":"415","last_page":"420"},"is_retracted":false,"is_paratext":false,"is_xpac":false,"primary_topic":{"id":"https://openalex.org/T10462","display_name":"Reinforcement Learning in Robotics","score":0.5612000226974487,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},"topics":[{"id":"https://openalex.org/T10462","display_name":"Reinforcement Learning in Robotics","score":0.5612000226974487,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}}],"keywords":[{"id":"https://openalex.org/keywords/reinforcement-learning","display_name":"Reinforcement learning","score":0.7335000038146973},{"id":"https://openalex.org/keywords/grid","display_name":"Grid","score":0.5076000094413757},{"id":"https://openalex.org/keywords/graph","display_name":"Graph","score":0.4706000089645386},{"id":"https://openalex.org/keywords/transformer","display_name":"Transformer","score":0.4659000039100647},{"id":"https://openalex.org/keywords/benchmark","display_name":"Benchmark (surveying)","score":0.35929998755455017},{"id":"https://openalex.org/keywords/provisioning","display_name":"Provisioning","score":0.3587999939918518},{"id":"https://openalex.org/keywords/greedy-algorithm","display_name":"Greedy algorithm","score":0.35199999809265137},{"id":"https://openalex.org/keywords/task","display_name":"Task (project management)","score":0.34470000863075256}],"concepts":[{"id":"https://openalex.org/C41008148","wikidata":"https://www.wikidata.org/wiki/Q21198","display_name":"Computer science","level":0,"score":0.7670999765396118},{"id":"https://openalex.org/C97541855","wikidata":"https://www.wikidata.org/wiki/Q830687","display_name":"Reinforcement learning","level":2,"score":0.7335000038146973},{"id":"https://openalex.org/C120314980","wikidata":"https://www.wikidata.org/wiki/Q180634","display_name":"Distributed computing","level":1,"score":0.5461999773979187},{"id":"https://openalex.org/C187691185","wikidata":"https://www.wikidata.org/wiki/Q2020720","display_name":"Grid","level":2,"score":0.5076000094413757},{"id":"https://openalex.org/C154945302","wikidata":"https://www.wikidata.org/wiki/Q11660","display_name":"Artificial intelligence","level":1,"score":0.47269999980926514},{"id":"https://openalex.org/C132525143","wikidata":"https://www.wikidata.org/wiki/Q141488","display_name":"Graph","level":2,"score":0.4706000089645386},{"id":"https://openalex.org/C66322947","wikidata":"https://www.wikidata.org/wiki/Q11658","display_name":"Transformer","level":3,"score":0.4659000039100647},{"id":"https://openalex.org/C185798385","wikidata":"https://www.wikidata.org/wiki/Q1161707","display_name":"Benchmark (surveying)","level":2,"score":0.35929998755455017},{"id":"https://openalex.org/C172191483","wikidata":"https://www.wikidata.org/wiki/Q1071806","display_name":"Provisioning","level":2,"score":0.3587999939918518},{"id":"https://openalex.org/C51823790","wikidata":"https://www.wikidata.org/wiki/Q504353","display_name":"Greedy algorithm","level":2,"score":0.35199999809265137},{"id":"https://openalex.org/C2780451532","wikidata":"https://www.wikidata.org/wiki/Q759676","display_name":"Task (project management)","level":2,"score":0.34470000863075256},{"id":"https://openalex.org/C41550386","wikidata":"https://www.wikidata.org/wiki/Q529909","display_name":"Multi-agent system","level":2,"score":0.3359000086784363},{"id":"https://openalex.org/C119857082","wikidata":"https://www.wikidata.org/wiki/Q2539","display_name":"Machine learning","level":1,"score":0.32919999957084656},{"id":"https://openalex.org/C85617194","wikidata":"https://www.wikidata.org/wiki/Q2072794","display_name":"Particle swarm optimization","level":2,"score":0.3125999867916107},{"id":"https://openalex.org/C90509273","wikidata":"https://www.wikidata.org/wiki/Q11012","display_name":"Robot","level":2,"score":0.3098999857902527},{"id":"https://openalex.org/C175154964","wikidata":"https://www.wikidata.org/wiki/Q380077","display_name":"Task analysis","level":3,"score":0.3089999854564667},{"id":"https://openalex.org/C108583219","wikidata":"https://www.wikidata.org/wiki/Q197536","display_name":"Deep learning","level":2,"score":0.3066999912261963},{"id":"https://openalex.org/C34413123","wikidata":"https://www.wikidata.org/wiki/Q170978","display_name":"Robotics","level":3,"score":0.30489999055862427},{"id":"https://openalex.org/C59519942","wikidata":"https://www.wikidata.org/wiki/Q650665","display_name":"Drone","level":2,"score":0.29820001125335693},{"id":"https://openalex.org/C60891933","wikidata":"https://www.wikidata.org/wiki/Q796575","display_name":"Ant colony","level":3,"score":0.2971999943256378},{"id":"https://openalex.org/C80444323","wikidata":"https://www.wikidata.org/wiki/Q2878974","display_name":"Theoretical computer science","level":1,"score":0.2816999852657318},{"id":"https://openalex.org/C13687954","wikidata":"https://www.wikidata.org/wiki/Q4826847","display_name":"Autonomous agent","level":2,"score":0.2628999948501587},{"id":"https://openalex.org/C2129575","wikidata":"https://www.wikidata.org/wiki/Q54837","display_name":"Semantic Web","level":2,"score":0.25769999623298645},{"id":"https://openalex.org/C113336015","wikidata":"https://www.wikidata.org/wiki/Q574010","display_name":"Complete information","level":2,"score":0.2549000084400177},{"id":"https://openalex.org/C181335050","wikidata":"https://www.wikidata.org/wiki/Q14915018","display_name":"Swarm behaviour","level":2,"score":0.25380000472068787}],"mesh":[],"locations_count":2,"locations":[{"id":"doi:10.1109/iccworkshops67674.2025.11162376","is_oa":false,"landing_page_url":"https://doi.org/10.1109/iccworkshops67674.2025.11162376","pdf_url":null,"source":null,"license":null,"license_id":null,"version":"publishedVersion","is_accepted":true,"is_published":true,"raw_source_name":"2025 IEEE International Conference on Communications Workshops (ICC Workshops)","raw_type":"proceedings-article"},{"id":"pmh:oai:open.clemson.edu:all_theses-5525","is_oa":false,"landing_page_url":"https://open.clemson.edu/all_theses/4519","pdf_url":null,"source":{"id":"https://openalex.org/S4377196397","display_name":"TigerPrints (Clemson University)","issn_l":null,"issn":null,"is_oa":false,"is_in_doaj":false,"is_core":false,"host_organization":"https://openalex.org/I8078737","host_organization_name":"Clemson University","host_organization_lineage":["https://openalex.org/I8078737"],"host_organization_lineage_names":[],"type":"repository"},"license":null,"license_id":null,"version":"submittedVersion","is_accepted":false,"is_published":false,"raw_source_name":"All Theses","raw_type":"text"}],"best_oa_location":null,"sustainable_development_goals":[],"awards":[],"funders":[{"id":"https://openalex.org/F4320306076","display_name":"National Science Foundation","ror":"https://ror.org/021nxhr62"}],"has_content":{"grobid_xml":false,"pdf":false},"content_urls":null,"referenced_works_count":9,"referenced_works":["https://openalex.org/W3175360899","https://openalex.org/W3214468037","https://openalex.org/W4289521015","https://openalex.org/W4322503516","https://openalex.org/W4327956071","https://openalex.org/W4382402823","https://openalex.org/W4384831806","https://openalex.org/W4393072609","https://openalex.org/W4410087574"],"related_works":[],"abstract_inverted_index":{"Mission":[0],"planning":[1],"for":[2,73,181],"a":[3,57,117],"fleet":[4],"of":[5,143],"cooperative":[6],"autonomous":[7],"drones":[8],"in":[9,41,130],"applications":[10],"that":[11,60],"involve":[12],"serving":[13],"distributed":[14],"target":[15],"points,":[16],"such":[17,146,184],"as":[18,147,185],"disaster":[19],"response,":[20],"environmental":[21],"monitoring,":[22],"and":[23,34,70,77,88,99,150,163,192],"surveillance,":[24],"is":[25,48,136],"challenging,":[26],"especially":[27],"under":[28,101],"partial":[29],"observability,":[30],"limited":[31],"communication":[32],"range,":[33],"uncertain":[35],"environments.":[36,133],"Traditional":[37],"path-planning":[38],"algorithms":[39,191],"struggle":[40],"these":[42,53],"scenarios,":[43],"particularly":[44],"when":[45],"prior":[46],"information":[47,97],"not":[49],"available.":[50],"To":[51],"address":[52,140],"challenges,":[54],"we":[55],"propose":[56],"novel":[58],"framework":[59],"integrates":[61],"Graph":[62],"Neural":[63],"Networks":[64],"(GNNs),":[65],"Deep":[66,119],"Reinforcement":[67],"Learning":[68],"(DRL),":[69],"transformer-based":[71,105],"mechanisms":[72],"enhanced":[74],"multi-agent":[75,144],"coordination":[76],"collective":[78],"task":[79,152],"execution.":[80,153],"Our":[81],"approach":[82],"leverages":[83],"GNNs":[84],"to":[85,139,176,179],"model":[86],"agent-agent":[87],"agent-goal":[89],"interactions":[90],"through":[91],"adaptive":[92],"graph":[93],"construction,":[94],"enabling":[95],"efficient":[96,151],"aggregation":[98],"decision-making":[100],"constrained":[102],"communication.":[103],"A":[104],"message-passing":[106],"mechanism,":[107],"augmented":[108],"with":[109,123,159],"edge-feature-enhanced":[110],"attention,":[111],"captures":[112],"complex":[113],"interaction":[114],"patterns,":[115],"while":[116,169],"Double":[118],"Q-Network":[120],"(Double":[121],"DQN)":[122],"prioritized":[124],"experience":[125],"replay":[126],"optimizes":[127],"agent":[128],"policies":[129],"partially":[131],"observable":[132],"This":[134],"integration":[135],"carefully":[137],"designed":[138],"specific":[141],"requirements":[142],"navigation,":[145],"scalability,":[148],"adaptability,":[149],"Experimental":[154],"results":[155],"demonstrate":[156],"superior":[157],"performance,":[158],"90%":[160],"service":[161],"provisioning":[162],"100%":[164],"grid":[165],"coverage":[166],"(node":[167],"discovery),":[168],"reducing":[170],"the":[171],"average":[172],"steps":[173],"per":[174],"episode":[175],"200,":[177],"compared":[178],"600":[180],"benchmark":[182],"methods":[183],"particle":[186],"swarm":[187],"optimization":[188],"(PSO),":[189],"greedy":[190],"DQN.":[193]},"counts_by_year":[{"year":2026,"cited_by_count":2},{"year":2025,"cited_by_count":2}],"updated_date":"2026-07-29T14:22:42.915294","created_date":"2025-10-10T00:00:00"}