{"id":"https://openalex.org/W7140166511","doi":"https://doi.org/10.48550/arxiv.2603.20994","title":"The Intelligent Disobedience Game: Formulating Disobedience in Stackelberg Games and Markov Decision Processes","display_name":"The Intelligent Disobedience Game: Formulating Disobedience in Stackelberg Games and Markov Decision Processes","publication_year":2026,"publication_date":"2026-03-22","ids":{"openalex":"https://openalex.org/W7140166511","doi":"https://doi.org/10.48550/arxiv.2603.20994"},"language":null,"primary_location":{"id":"doi:10.48550/arxiv.2603.20994","is_oa":true,"landing_page_url":"https://doi.org/10.48550/arxiv.2603.20994","pdf_url":null,"source":{"id":"https://openalex.org/S4306400194","display_name":"arXiv (Cornell University)","issn_l":null,"issn":null,"is_oa":true,"is_in_doaj":false,"is_core":false,"host_organization":"https://openalex.org/I205783295","host_organization_name":"Cornell University","host_organization_lineage":["https://openalex.org/I205783295"],"host_organization_lineage_names":[],"type":"repository"},"license":"cc-by","license_id":"https://openalex.org/licenses/cc-by","version":null,"is_accepted":false,"is_published":false,"raw_source_name":null,"raw_type":"article"},"type":"preprint","indexed_in":["datacite"],"open_access":{"is_oa":true,"oa_status":"green","oa_url":"https://doi.org/10.48550/arxiv.2603.20994","any_repository_has_fulltext":true},"authorships":[{"author_position":"first","author":{"id":null,"display_name":"Hornig, Benedikt","orcid":null},"institutions":[],"countries":[],"is_corresponding":true,"raw_author_name":"Hornig, Benedikt","raw_affiliation_strings":[],"raw_orcid":null,"affiliations":[]},{"author_position":"last","author":{"id":null,"display_name":"Mirsky, Reuth","orcid":null},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Mirsky, Reuth","raw_affiliation_strings":[],"raw_orcid":null,"affiliations":[]}],"institutions":[],"countries_distinct_count":0,"institutions_distinct_count":2,"corresponding_author_ids":[],"corresponding_institution_ids":[],"apc_list":null,"apc_paid":null,"fwci":null,"has_fulltext":false,"cited_by_count":0,"citation_normalized_percentile":null,"cited_by_percentile_year":null,"biblio":{"volume":null,"issue":null,"first_page":null,"last_page":null},"is_retracted":false,"is_paratext":false,"is_xpac":false,"primary_topic":{"id":"https://openalex.org/T10883","display_name":"Ethics and Social Impacts of AI","score":0.2085999995470047,"subfield":{"id":"https://openalex.org/subfields/3311","display_name":"Safety Research"},"field":{"id":"https://openalex.org/fields/33","display_name":"Social Sciences"},"domain":{"id":"https://openalex.org/domains/2","display_name":"Social Sciences"}},"topics":[{"id":"https://openalex.org/T10883","display_name":"Ethics and Social Impacts of AI","score":0.2085999995470047,"subfield":{"id":"https://openalex.org/subfields/3311","display_name":"Safety Research"},"field":{"id":"https://openalex.org/fields/33","display_name":"Social Sciences"},"domain":{"id":"https://openalex.org/domains/2","display_name":"Social Sciences"}},{"id":"https://openalex.org/T10462","display_name":"Reinforcement Learning in Robotics","score":0.18930000066757202,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T11689","display_name":"Adversarial Robustness in Machine Learning","score":0.08160000294446945,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}}],"keywords":[{"id":"https://openalex.org/keywords/stackelberg-competition","display_name":"Stackelberg competition","score":0.7710999846458435},{"id":"https://openalex.org/keywords/markov-decision-process","display_name":"Markov decision process","score":0.7085000276565552},{"id":"https://openalex.org/keywords/process","display_name":"Process (computing)","score":0.5241000056266785},{"id":"https://openalex.org/keywords/testbed","display_name":"Testbed","score":0.4796000123023987},{"id":"https://openalex.org/keywords/reinforcement-learning","display_name":"Reinforcement learning","score":0.4147999882698059},{"id":"https://openalex.org/keywords/partially-observable-markov-decision-process","display_name":"Partially observable Markov decision process","score":0.40689998865127563},{"id":"https://openalex.org/keywords/game-theory","display_name":"Game theory","score":0.3668999969959259},{"id":"https://openalex.org/keywords/set","display_name":"Set (abstract data type)","score":0.35519999265670776},{"id":"https://openalex.org/keywords/control","display_name":"Control (management)","score":0.353300005197525}],"concepts":[{"id":"https://openalex.org/C199510392","wikidata":"https://www.wikidata.org/wiki/Q1184602","display_name":"Stackelberg competition","level":2,"score":0.7710999846458435},{"id":"https://openalex.org/C106189395","wikidata":"https://www.wikidata.org/wiki/Q176789","display_name":"Markov decision process","level":3,"score":0.7085000276565552},{"id":"https://openalex.org/C41008148","wikidata":"https://www.wikidata.org/wiki/Q21198","display_name":"Computer science","level":0,"score":0.6460000276565552},{"id":"https://openalex.org/C98045186","wikidata":"https://www.wikidata.org/wiki/Q205663","display_name":"Process (computing)","level":2,"score":0.5241000056266785},{"id":"https://openalex.org/C31395832","wikidata":"https://www.wikidata.org/wiki/Q1318674","display_name":"Testbed","level":2,"score":0.4796000123023987},{"id":"https://openalex.org/C154945302","wikidata":"https://www.wikidata.org/wiki/Q11660","display_name":"Artificial intelligence","level":1,"score":0.4284999966621399},{"id":"https://openalex.org/C97541855","wikidata":"https://www.wikidata.org/wiki/Q830687","display_name":"Reinforcement learning","level":2,"score":0.4147999882698059},{"id":"https://openalex.org/C17098449","wikidata":"https://www.wikidata.org/wiki/Q176814","display_name":"Partially observable Markov decision process","level":4,"score":0.40689998865127563},{"id":"https://openalex.org/C177142836","wikidata":"https://www.wikidata.org/wiki/Q44455","display_name":"Game theory","level":2,"score":0.3668999969959259},{"id":"https://openalex.org/C177264268","wikidata":"https://www.wikidata.org/wiki/Q1514741","display_name":"Set (abstract data type)","level":2,"score":0.35519999265670776},{"id":"https://openalex.org/C2775924081","wikidata":"https://www.wikidata.org/wiki/Q55608371","display_name":"Control (management)","level":2,"score":0.353300005197525},{"id":"https://openalex.org/C539667460","wikidata":"https://www.wikidata.org/wiki/Q2414942","display_name":"Management science","level":1,"score":0.3375999927520752},{"id":"https://openalex.org/C13687954","wikidata":"https://www.wikidata.org/wiki/Q4826847","display_name":"Autonomous agent","level":2,"score":0.33390000462532043},{"id":"https://openalex.org/C98763669","wikidata":"https://www.wikidata.org/wiki/Q176645","display_name":"Markov chain","level":2,"score":0.3294000029563904},{"id":"https://openalex.org/C107457646","wikidata":"https://www.wikidata.org/wiki/Q207434","display_name":"Human\u2013computer interaction","level":1,"score":0.3257000148296356},{"id":"https://openalex.org/C2780966255","wikidata":"https://www.wikidata.org/wiki/Q5474306","display_name":"Foundation (evidence)","level":2,"score":0.32170000672340393},{"id":"https://openalex.org/C74072328","wikidata":"https://www.wikidata.org/wiki/Q1142726","display_name":"Intelligent agent","level":2,"score":0.3140999972820282},{"id":"https://openalex.org/C115988155","wikidata":"https://www.wikidata.org/wiki/Q3262192","display_name":"Decision problem","level":2,"score":0.3124000132083893},{"id":"https://openalex.org/C2777363581","wikidata":"https://www.wikidata.org/wiki/Q15098235","display_name":"Harm","level":2,"score":0.3046000003814697},{"id":"https://openalex.org/C42475967","wikidata":"https://www.wikidata.org/wiki/Q194292","display_name":"Operations research","level":1,"score":0.3028999865055084},{"id":"https://openalex.org/C192034797","wikidata":"https://www.wikidata.org/wiki/Q3502995","display_name":"Undecidable problem","level":3,"score":0.2928999960422516},{"id":"https://openalex.org/C2984634286","wikidata":"https://www.wikidata.org/wiki/Q1331926","display_name":"Decision process","level":2,"score":0.2842000126838684},{"id":"https://openalex.org/C122308676","wikidata":"https://www.wikidata.org/wiki/Q1331926","display_name":"Decision-making","level":3,"score":0.2809000015258789},{"id":"https://openalex.org/C38652104","wikidata":"https://www.wikidata.org/wiki/Q3510521","display_name":"Computer security","level":1,"score":0.27630001306533813},{"id":"https://openalex.org/C73795354","wikidata":"https://www.wikidata.org/wiki/Q287618","display_name":"Sequential game","level":3,"score":0.2669999897480011},{"id":"https://openalex.org/C36299963","wikidata":"https://www.wikidata.org/wiki/Q1369844","display_name":"Observability","level":2,"score":0.266400009393692},{"id":"https://openalex.org/C56397880","wikidata":"https://www.wikidata.org/wiki/Q6044094","display_name":"Intelligent decision support system","level":2,"score":0.26019999384880066},{"id":"https://openalex.org/C28901747","wikidata":"https://www.wikidata.org/wiki/Q177571","display_name":"Decision theory","level":2,"score":0.25529998540878296},{"id":"https://openalex.org/C159886148","wikidata":"https://www.wikidata.org/wiki/Q176645","display_name":"Markov process","level":2,"score":0.25529998540878296},{"id":"https://openalex.org/C2780791683","wikidata":"https://www.wikidata.org/wiki/Q846785","display_name":"Action (physics)","level":2,"score":0.2549999952316284}],"mesh":[],"locations_count":1,"locations":[{"id":"doi:10.48550/arxiv.2603.20994","is_oa":true,"landing_page_url":"https://doi.org/10.48550/arxiv.2603.20994","pdf_url":null,"source":{"id":"https://openalex.org/S4306400194","display_name":"arXiv (Cornell University)","issn_l":null,"issn":null,"is_oa":true,"is_in_doaj":false,"is_core":false,"host_organization":"https://openalex.org/I205783295","host_organization_name":"Cornell University","host_organization_lineage":["https://openalex.org/I205783295"],"host_organization_lineage_names":[],"type":"repository"},"license":"cc-by","license_id":"https://openalex.org/licenses/cc-by","version":null,"is_accepted":false,"is_published":null,"raw_source_name":null,"raw_type":"article"}],"best_oa_location":{"id":"doi:10.48550/arxiv.2603.20994","is_oa":true,"landing_page_url":"https://doi.org/10.48550/arxiv.2603.20994","pdf_url":null,"source":{"id":"https://openalex.org/S4306400194","display_name":"arXiv (Cornell University)","issn_l":null,"issn":null,"is_oa":true,"is_in_doaj":false,"is_core":false,"host_organization":"https://openalex.org/I205783295","host_organization_name":"Cornell University","host_organization_lineage":["https://openalex.org/I205783295"],"host_organization_lineage_names":[],"type":"repository"},"license":"cc-by","license_id":"https://openalex.org/licenses/cc-by","version":null,"is_accepted":false,"is_published":false,"raw_source_name":null,"raw_type":"article"},"sustainable_development_goals":[{"display_name":"Peace, Justice and strong institutions","id":"https://metadata.un.org/sdg/16","score":0.7934480309486389}],"awards":[],"funders":[],"has_content":{"grobid_xml":false,"pdf":false},"content_urls":null,"referenced_works_count":0,"referenced_works":[],"related_works":[],"abstract_inverted_index":{"In":[0],"shared":[1,139],"autonomy,":[2],"a":[3,15,45,58,102,138,147],"critical":[4],"tension":[5],"arises":[6],"when":[7],"an":[8,62],"automated":[9],"assistant":[10],"must":[11],"choose":[12],"between":[13,57],"obeying":[14],"human's":[16,97],"instruction":[17],"and":[18,61,119,127],"deliberately":[19],"overriding":[20],"it":[21],"to":[22,94],"prevent":[23],"harm.":[24],"This":[25],"safety-critical":[26],"behavior":[27],"is":[28],"known":[29],"as":[30,83],"intelligent":[31],"disobedience.":[32],"To":[33],"formalize":[34],"this":[35,37],"dynamic,":[36],"paper":[38,132],"introduces":[39],"the":[40,55,87,96,109,120,135],"Intelligent":[41],"Disobedience":[42],"Game":[43],"(IDG),":[44],"sequential":[46],"game-theoretic":[47],"framework":[48],"based":[49],"on":[50],"Stackelberg":[51],"games":[52],"that":[53,106,114],"models":[54],"interaction":[56],"human":[59],"leader":[60],"assistive":[63],"follower":[64],"operating":[65],"under":[66],"asymmetric":[67],"information.":[68],"It":[69],"characterizes":[70],"optimal":[71],"strategies":[72],"for":[73,151],"both":[74,108],"agents":[75,113],"across":[76],"multi-step":[77],"scenarios,":[78],"identifying":[79],"strategic":[80],"phenomena":[81],"such":[82],"``safety":[84],"traps,''":[85],"where":[86],"system":[88],"indefinitely":[89],"avoids":[90],"harm":[91],"but":[92],"fails":[93],"achieve":[95],"goal.":[98],"The":[99,131],"IDG":[100,136],"provides":[101],"needed":[103],"mathematical":[104],"foundation":[105],"enables":[107],"algorithmic":[110],"development":[111],"of":[112,123],"can":[115],"learn":[116],"safe":[117],"non-compliance":[118],"empirical":[121],"study":[122],"how":[124],"humans":[125],"perceive":[126],"trust":[128],"disobedient":[129],"AI.":[130],"further":[133],"translates":[134],"into":[137],"control":[140],"Multi-Agent":[141],"Markov":[142],"Decision":[143],"Process":[144],"representation,":[145],"forming":[146],"compact":[148],"computational":[149],"testbed":[150],"training":[152],"reinforcement":[153],"learning":[154],"agents.":[155]},"counts_by_year":[],"updated_date":"2026-04-25T08:17:42.794288","created_date":"2026-03-25T00:00:00"}