{"id":"https://openalex.org/W4399909891","doi":"https://doi.org/10.1109/icnc59896.2024.10556056","title":"Accelerating Autonomous Cyber Operations: A Symbolic Logic Planner Guided Reinforcement Learning Approach","display_name":"Accelerating Autonomous Cyber Operations: A Symbolic Logic Planner Guided Reinforcement Learning Approach","publication_year":2024,"publication_date":"2024-02-19","ids":{"openalex":"https://openalex.org/W4399909891","doi":"https://doi.org/10.1109/icnc59896.2024.10556056"},"language":"en","primary_location":{"id":"doi:10.1109/icnc59896.2024.10556056","is_oa":false,"landing_page_url":"https://doi.org/10.1109/icnc59896.2024.10556056","pdf_url":null,"source":null,"license":null,"license_id":null,"version":"publishedVersion","is_accepted":true,"is_published":true,"raw_source_name":"2024 International Conference on Computing, Networking and Communications (ICNC)","raw_type":"proceedings-article"},"type":"article","indexed_in":["crossref"],"open_access":{"is_oa":false,"oa_status":"closed","oa_url":null,"any_repository_has_fulltext":false},"authorships":[{"author_position":"first","author":{"id":"https://openalex.org/A5037205605","display_name":"Ryan Kerr","orcid":"https://orcid.org/0000-0002-3454-7640"},"institutions":[{"id":"https://openalex.org/I204722609","display_name":"Queen's University","ror":"https://ror.org/02y72wh86","country_code":"CA","type":"education","lineage":["https://openalex.org/I204722609"]}],"countries":["CA"],"is_corresponding":false,"raw_author_name":"Ryan Kerr","raw_affiliation_strings":["Queen&#x0027;s School of Computing,Kingston, Ontario,Canada"],"raw_orcid":null,"affiliations":[{"raw_affiliation_string":"Queen&#x0027;s School of Computing,Kingston, Ontario,Canada","institution_ids":["https://openalex.org/I204722609"]}]},{"author_position":"middle","author":{"id":"https://openalex.org/A5007693994","display_name":"Steven H. H. Ding","orcid":"https://orcid.org/0000-0003-4513-200X"},"institutions":[{"id":"https://openalex.org/I204722609","display_name":"Queen's University","ror":"https://ror.org/02y72wh86","country_code":"CA","type":"education","lineage":["https://openalex.org/I204722609"]}],"countries":["CA"],"is_corresponding":false,"raw_author_name":"Steven Ding","raw_affiliation_strings":["Queen&#x0027;s School of Computing,Kingston, Ontario,Canada"],"raw_orcid":null,"affiliations":[{"raw_affiliation_string":"Queen&#x0027;s School of Computing,Kingston, Ontario,Canada","institution_ids":["https://openalex.org/I204722609"]}]},{"author_position":"middle","author":{"id":"https://openalex.org/A5106407830","display_name":"Li Li","orcid":"https://orcid.org/0000-0003-2990-1614"},"institutions":[{"id":"https://openalex.org/I1297460800","display_name":"Defence Research and Development Canada","ror":"https://ror.org/00hgy8d33","country_code":"CA","type":"government","lineage":["https://openalex.org/I1297460800","https://openalex.org/I1336338359","https://openalex.org/I2802286613"]}],"countries":["CA"],"is_corresponding":false,"raw_author_name":"Li Li","raw_affiliation_strings":["Defence Research and Development Canada,Ottawa, Ontario,Canada","Defence Research and Development Canada, Ottawa, Ontario, Canada"],"raw_orcid":null,"affiliations":[{"raw_affiliation_string":"Defence Research and Development Canada,Ottawa, Ontario,Canada","institution_ids":["https://openalex.org/I1297460800"]},{"raw_affiliation_string":"Defence Research and Development Canada, Ottawa, Ontario, Canada","institution_ids":["https://openalex.org/I1297460800"]}]},{"author_position":"last","author":{"id":"https://openalex.org/A5033634735","display_name":"Adrian Taylor","orcid":"https://orcid.org/0000-0003-2701-9468"},"institutions":[{"id":"https://openalex.org/I1297460800","display_name":"Defence Research and Development Canada","ror":"https://ror.org/00hgy8d33","country_code":"CA","type":"government","lineage":["https://openalex.org/I1297460800","https://openalex.org/I1336338359","https://openalex.org/I2802286613"]}],"countries":["CA"],"is_corresponding":false,"raw_author_name":"Adrian Taylor","raw_affiliation_strings":["Defence Research and Development Canada,Ottawa, Ontario,Canada","Defence Research and Development Canada, Ottawa, Ontario, Canada"],"raw_orcid":null,"affiliations":[{"raw_affiliation_string":"Defence Research and Development Canada,Ottawa, Ontario,Canada","institution_ids":["https://openalex.org/I1297460800"]},{"raw_affiliation_string":"Defence Research and Development Canada, Ottawa, Ontario, Canada","institution_ids":["https://openalex.org/I1297460800"]}]}],"institutions":[],"countries_distinct_count":1,"institutions_distinct_count":4,"corresponding_author_ids":[],"corresponding_institution_ids":[],"apc_list":null,"apc_paid":null,"fwci":1.2219,"has_fulltext":false,"cited_by_count":4,"citation_normalized_percentile":{"value":0.82185076,"is_in_top_1_percent":false,"is_in_top_10_percent":false},"cited_by_percentile_year":{"min":90,"max":97},"biblio":{"volume":null,"issue":null,"first_page":"641","last_page":"647"},"is_retracted":false,"is_paratext":false,"is_xpac":false,"primary_topic":{"id":"https://openalex.org/T10906","display_name":"AI-based Problem Solving and Planning","score":0.995199978351593,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},"topics":[{"id":"https://openalex.org/T10906","display_name":"AI-based Problem Solving and Planning","score":0.995199978351593,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T10462","display_name":"Reinforcement Learning in Robotics","score":0.9936000108718872,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T12002","display_name":"Computability, Logic, AI Algorithms","score":0.9824000000953674,"subfield":{"id":"https://openalex.org/subfields/1703","display_name":"Computational Theory and Mathematics"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}}],"keywords":[{"id":"https://openalex.org/keywords/planner","display_name":"Planner","score":0.8819522857666016},{"id":"https://openalex.org/keywords/reinforcement-learning","display_name":"Reinforcement learning","score":0.7889100313186646},{"id":"https://openalex.org/keywords/computer-science","display_name":"Computer science","score":0.6897882223129272},{"id":"https://openalex.org/keywords/logic-programming","display_name":"Logic programming","score":0.501678466796875},{"id":"https://openalex.org/keywords/artificial-intelligence","display_name":"Artificial intelligence","score":0.4122491478919983},{"id":"https://openalex.org/keywords/human\u2013computer-interaction","display_name":"Human\u2013computer interaction","score":0.39552628993988037}],"concepts":[{"id":"https://openalex.org/C2776999362","wikidata":"https://www.wikidata.org/wiki/Q2349274","display_name":"Planner","level":2,"score":0.8819522857666016},{"id":"https://openalex.org/C97541855","wikidata":"https://www.wikidata.org/wiki/Q830687","display_name":"Reinforcement learning","level":2,"score":0.7889100313186646},{"id":"https://openalex.org/C41008148","wikidata":"https://www.wikidata.org/wiki/Q21198","display_name":"Computer science","level":0,"score":0.6897882223129272},{"id":"https://openalex.org/C128838566","wikidata":"https://www.wikidata.org/wiki/Q275603","display_name":"Logic programming","level":2,"score":0.501678466796875},{"id":"https://openalex.org/C154945302","wikidata":"https://www.wikidata.org/wiki/Q11660","display_name":"Artificial intelligence","level":1,"score":0.4122491478919983},{"id":"https://openalex.org/C107457646","wikidata":"https://www.wikidata.org/wiki/Q207434","display_name":"Human\u2013computer interaction","level":1,"score":0.39552628993988037}],"mesh":[],"locations_count":1,"locations":[{"id":"doi:10.1109/icnc59896.2024.10556056","is_oa":false,"landing_page_url":"https://doi.org/10.1109/icnc59896.2024.10556056","pdf_url":null,"source":null,"license":null,"license_id":null,"version":"publishedVersion","is_accepted":true,"is_published":true,"raw_source_name":"2024 International Conference on Computing, Networking and Communications (ICNC)","raw_type":"proceedings-article"}],"best_oa_location":null,"sustainable_development_goals":[],"awards":[],"funders":[],"has_content":{"grobid_xml":false,"pdf":false},"content_urls":null,"referenced_works_count":16,"referenced_works":["https://openalex.org/W1545688112","https://openalex.org/W2044152003","https://openalex.org/W2945365276","https://openalex.org/W3037164854","https://openalex.org/W3137498832","https://openalex.org/W3171213563","https://openalex.org/W4287022721","https://openalex.org/W6602776271","https://openalex.org/W6637676880","https://openalex.org/W6671719220","https://openalex.org/W6712864396","https://openalex.org/W6762456871","https://openalex.org/W6797766548","https://openalex.org/W6800884497","https://openalex.org/W6801077506","https://openalex.org/W6801396756"],"related_works":["https://openalex.org/W1568779110","https://openalex.org/W804484174","https://openalex.org/W4244698559","https://openalex.org/W4246538999","https://openalex.org/W56933075","https://openalex.org/W4399598005","https://openalex.org/W2002361198","https://openalex.org/W2168364913","https://openalex.org/W1548568597","https://openalex.org/W24256479"],"abstract_inverted_index":{"Training":[0],"a":[1,64,97,128,141,146],"reinforcement":[2,50],"learning":[3,51],"agent":[4,66,83],"to":[5,13,23,121,133],"learn":[6],"network":[7,34],"penetration":[8,45],"testing":[9,46],"is":[10,112,145],"challenging":[11],"due":[12],"the":[14,59,81,117,124],"partially-observable,":[15],"non-deterministic":[16],"environment.":[17],"The":[18,105],"large":[19],"action":[20,90,110],"space":[21],"leads":[22],"extended":[24],"training":[25,67,84],"time,":[26],"an":[27,70,102],"issue":[28],"of":[29,119],"particular":[30],"concern":[31],"in":[32,85],"mission-oriented":[33],"deployment":[35],"that":[36,108,140],"requires":[37],"timely":[38],"hardening":[39],"tests.":[40],"Current":[41],"solutions":[42],"for":[43,79,92,153],"automating":[44],"are":[47,77],"divided":[48],"between":[49],"(RL)":[52],"and":[53,62,95,148,155],"AI":[54],"planning.":[55],"This":[56],"work":[57],"integrates":[58],"two":[60],"paradigms":[61],"establishes":[63],"neuro-symbolic":[65,143],"system":[68],"through":[69],"interactive":[71],"symbolic":[72,98],"logic":[73,99],"engine.":[74],"Two":[75],"methods":[76],"examined":[78],"accelerating":[80],"pentest":[82],"this":[86],"system,":[87],"namely:":[88],"invalid":[89,109],"masking":[91,111],"Deep":[93],"Q-Networks":[94],"using":[96],"engine":[100],"as":[101],"environment":[103],"driver.":[104],"results":[106,138],"show":[107],"highly":[113],"effective":[114],"at":[115],"reducing":[116],"number":[118],"steps":[120],"convergence,":[122],"while":[123],"logic-based":[125],"simulator":[126],"provides":[127],"significant":[129],"per-step":[130],"performance":[131],"improvement":[132],"speed":[134],"up":[135],"training.":[136],"These":[137],"highlight":[139],"hybrid":[142],"approach":[144],"viable,":[147],"perhaps":[149],"even":[150],"necessary,":[151],"method":[152],"developing":[154],"improving":[156],"cyber":[157],"RL":[158],"agents.":[159]},"counts_by_year":[{"year":2025,"cited_by_count":3},{"year":2024,"cited_by_count":1}],"updated_date":"2026-06-11T09:08:48.828518","created_date":"2025-10-10T00:00:00"}