{"id":"https://openalex.org/W7154470946","doi":"https://doi.org/10.48550/arxiv.2604.11914","title":"Self-Monitoring Benefits from Structural Integration: Lessons from Metacognition in Continuous-Time Multi-Timescale Agents","display_name":"Self-Monitoring Benefits from Structural Integration: Lessons from Metacognition in Continuous-Time Multi-Timescale Agents","publication_year":2026,"publication_date":"2026-04-13","ids":{"openalex":"https://openalex.org/W7154470946","doi":"https://doi.org/10.48550/arxiv.2604.11914"},"language":null,"primary_location":{"id":"doi:10.48550/arxiv.2604.11914","is_oa":true,"landing_page_url":"https://doi.org/10.48550/arxiv.2604.11914","pdf_url":null,"source":{"id":"https://openalex.org/S4306400194","display_name":"arXiv (Cornell University)","issn_l":null,"issn":null,"is_oa":true,"is_in_doaj":false,"is_core":false,"host_organization":"https://openalex.org/I205783295","host_organization_name":"Cornell University","host_organization_lineage":["https://openalex.org/I205783295"],"host_organization_lineage_names":[],"type":"repository"},"license":null,"license_id":null,"version":null,"is_accepted":false,"is_published":false,"raw_source_name":null,"raw_type":"article"},"type":"preprint","indexed_in":["datacite"],"open_access":{"is_oa":true,"oa_status":"green","oa_url":"https://doi.org/10.48550/arxiv.2604.11914","any_repository_has_fulltext":true},"authorships":[{"author_position":"first","author":{"id":"https://openalex.org/A5128344404","display_name":"Ying Xie","orcid":null},"institutions":[],"countries":[],"is_corresponding":true,"raw_author_name":"Xie, Ying","raw_affiliation_strings":[],"affiliations":[]}],"institutions":[],"countries_distinct_count":0,"institutions_distinct_count":1,"corresponding_author_ids":["https://openalex.org/A5128344404"],"corresponding_institution_ids":[],"apc_list":null,"apc_paid":null,"fwci":null,"has_fulltext":false,"cited_by_count":0,"citation_normalized_percentile":null,"cited_by_percentile_year":null,"biblio":{"volume":null,"issue":null,"first_page":null,"last_page":null},"is_retracted":false,"is_paratext":false,"is_xpac":false,"primary_topic":{"id":"https://openalex.org/T10462","display_name":"Reinforcement Learning in Robotics","score":0.8118000030517578,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},"topics":[{"id":"https://openalex.org/T10462","display_name":"Reinforcement Learning in Robotics","score":0.8118000030517578,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T10502","display_name":"Advanced Memory and Neural Computing","score":0.017100000753998756,"subfield":{"id":"https://openalex.org/subfields/2208","display_name":"Electrical and Electronic Engineering"},"field":{"id":"https://openalex.org/fields/22","display_name":"Engineering"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T11307","display_name":"Domain Adaptation and Few-Shot Learning","score":0.015699999406933784,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}}],"keywords":[{"id":"https://openalex.org/keywords/surprise","display_name":"Surprise","score":0.6746000051498413},{"id":"https://openalex.org/keywords/duration","display_name":"Duration (music)","score":0.5953999757766724},{"id":"https://openalex.org/keywords/reinforcement-learning","display_name":"Reinforcement learning","score":0.5630999803543091},{"id":"https://openalex.org/keywords/metacognition","display_name":"Metacognition","score":0.5615000128746033},{"id":"https://openalex.org/keywords/harm","display_name":"Harm","score":0.5587000250816345},{"id":"https://openalex.org/keywords/baseline","display_name":"Baseline (sea)","score":0.5231999754905701},{"id":"https://openalex.org/keywords/sensitivity","display_name":"Sensitivity (control systems)","score":0.453000009059906},{"id":"https://openalex.org/keywords/mechanism","display_name":"Mechanism (biology)","score":0.37290000915527344}],"concepts":[{"id":"https://openalex.org/C2780343955","wikidata":"https://www.wikidata.org/wiki/Q333173","display_name":"Surprise","level":2,"score":0.6746000051498413},{"id":"https://openalex.org/C112758219","wikidata":"https://www.wikidata.org/wiki/Q16038819","display_name":"Duration (music)","level":2,"score":0.5953999757766724},{"id":"https://openalex.org/C97541855","wikidata":"https://www.wikidata.org/wiki/Q830687","display_name":"Reinforcement learning","level":2,"score":0.5630999803543091},{"id":"https://openalex.org/C118147538","wikidata":"https://www.wikidata.org/wiki/Q1126970","display_name":"Metacognition","level":3,"score":0.5615000128746033},{"id":"https://openalex.org/C2777363581","wikidata":"https://www.wikidata.org/wiki/Q15098235","display_name":"Harm","level":2,"score":0.5587000250816345},{"id":"https://openalex.org/C41008148","wikidata":"https://www.wikidata.org/wiki/Q21198","display_name":"Computer science","level":0,"score":0.5302000045776367},{"id":"https://openalex.org/C12725497","wikidata":"https://www.wikidata.org/wiki/Q810247","display_name":"Baseline (sea)","level":2,"score":0.5231999754905701},{"id":"https://openalex.org/C154945302","wikidata":"https://www.wikidata.org/wiki/Q11660","display_name":"Artificial intelligence","level":1,"score":0.4758000075817108},{"id":"https://openalex.org/C21200559","wikidata":"https://www.wikidata.org/wiki/Q7451068","display_name":"Sensitivity (control systems)","level":2,"score":0.453000009059906},{"id":"https://openalex.org/C119857082","wikidata":"https://www.wikidata.org/wiki/Q2539","display_name":"Machine learning","level":1,"score":0.37540000677108765},{"id":"https://openalex.org/C89611455","wikidata":"https://www.wikidata.org/wiki/Q6804646","display_name":"Mechanism (biology)","level":2,"score":0.37290000915527344},{"id":"https://openalex.org/C180747234","wikidata":"https://www.wikidata.org/wiki/Q23373","display_name":"Cognitive psychology","level":1,"score":0.37070000171661377},{"id":"https://openalex.org/C2775924081","wikidata":"https://www.wikidata.org/wiki/Q55608371","display_name":"Control (management)","level":2,"score":0.3635999858379364},{"id":"https://openalex.org/C15744967","wikidata":"https://www.wikidata.org/wiki/Q9418","display_name":"Psychology","level":0,"score":0.3555999994277954},{"id":"https://openalex.org/C148220186","wikidata":"https://www.wikidata.org/wiki/Q7111912","display_name":"Outcome (game theory)","level":2,"score":0.34540000557899475},{"id":"https://openalex.org/C67203356","wikidata":"https://www.wikidata.org/wiki/Q1321905","display_name":"Reinforcement","level":2,"score":0.34279999136924744},{"id":"https://openalex.org/C2775936607","wikidata":"https://www.wikidata.org/wiki/Q466845","display_name":"Tracking (education)","level":2,"score":0.3043999969959259},{"id":"https://openalex.org/C28719098","wikidata":"https://www.wikidata.org/wiki/Q44946","display_name":"Point (geometry)","level":2,"score":0.3043000102043152},{"id":"https://openalex.org/C168167062","wikidata":"https://www.wikidata.org/wiki/Q1117970","display_name":"Component (thermodynamics)","level":2,"score":0.30219998955726624},{"id":"https://openalex.org/C2779662365","wikidata":"https://www.wikidata.org/wiki/Q5416694","display_name":"Event (particle physics)","level":2,"score":0.2922999858856201},{"id":"https://openalex.org/C61797465","wikidata":"https://www.wikidata.org/wiki/Q1188986","display_name":"Term (time)","level":2,"score":0.27079999446868896},{"id":"https://openalex.org/C13662910","wikidata":"https://www.wikidata.org/wiki/Q193139","display_name":"Trajectory","level":2,"score":0.26409998536109924},{"id":"https://openalex.org/C112930515","wikidata":"https://www.wikidata.org/wiki/Q4389547","display_name":"Risk analysis (engineering)","level":1,"score":0.2547999918460846}],"mesh":[],"locations_count":1,"locations":[{"id":"doi:10.48550/arxiv.2604.11914","is_oa":true,"landing_page_url":"https://doi.org/10.48550/arxiv.2604.11914","pdf_url":null,"source":{"id":"https://openalex.org/S4306400194","display_name":"arXiv (Cornell University)","issn_l":null,"issn":null,"is_oa":true,"is_in_doaj":false,"is_core":false,"host_organization":"https://openalex.org/I205783295","host_organization_name":"Cornell University","host_organization_lineage":["https://openalex.org/I205783295"],"host_organization_lineage_names":[],"type":"repository"},"license":null,"license_id":null,"version":null,"is_accepted":false,"is_published":null,"raw_source_name":null,"raw_type":"article"}],"best_oa_location":{"id":"doi:10.48550/arxiv.2604.11914","is_oa":true,"landing_page_url":"https://doi.org/10.48550/arxiv.2604.11914","pdf_url":null,"source":{"id":"https://openalex.org/S4306400194","display_name":"arXiv (Cornell University)","issn_l":null,"issn":null,"is_oa":true,"is_in_doaj":false,"is_core":false,"host_organization":"https://openalex.org/I205783295","host_organization_name":"Cornell University","host_organization_lineage":["https://openalex.org/I205783295"],"host_organization_lineage_names":[],"type":"repository"},"license":null,"license_id":null,"version":null,"is_accepted":false,"is_published":false,"raw_source_name":null,"raw_type":"article"},"sustainable_development_goals":[{"display_name":"Peace, Justice and strong institutions","id":"https://metadata.un.org/sdg/16","score":0.6779577136039734}],"awards":[],"funders":[],"has_content":{"pdf":false,"grobid_xml":false},"content_urls":null,"referenced_works_count":0,"referenced_works":[],"related_works":[],"abstract_inverted_index":{"Self-monitoring":[0],"capabilities":[1],"--":[2,8,146,163],"metacognition,":[3],"self-prediction,":[4],"and":[5,73,79,82,109,157,214],"subjective":[6,111],"duration":[7,112],"are":[9,129],"often":[10],"proposed":[11],"as":[12,55,160],"useful":[13],"additions":[14],"to":[15,58,86,97,149,153],"reinforcement":[16],"learning":[17],"agents.":[18],"But":[19],"do":[20],"they":[21],"actually":[22],"help?":[23],"We":[24,47,137],"investigate":[25],"this":[26,135,194],"question":[27],"in":[28,34,134,180,227,238],"a":[29,42,59,165,181,203,215],"continuous-time":[30],"multi-timescale":[31,60],"agent":[32],"operating":[33],"predator-prey":[35,75],"survival":[36],"environments":[37,76],"of":[38,193,233],"varying":[39],"complexity,":[40],"including":[41],"2D":[43,74],"partially":[44],"observable":[45],"variant.":[46],"first":[48],"show":[49,139],"that":[50,140,187,245],"three":[51],"self-monitoring":[52,207,239,246],"modules,":[53],"implemented":[54],"auxiliary-loss":[56],"add-ons":[57],"cortical":[61],"hierarchy,":[62],"provide":[63],"no":[64,206],"statistically":[65],"significant":[66],"benefit":[67,224],"across":[68],"20":[69],"random":[70],"seeds,":[71],"1D":[72],"with":[77,205],"standard":[78],"non-stationary":[80,182],"variants,":[81],"training":[83],"horizons":[84],"up":[85],"50,000":[87],"steps.":[88],"Diagnosing":[89],"the":[90,94,110,115,126,143,169,188,223,230,250],"failure,":[91],"we":[92],"find":[93],"modules":[95,219,235],"collapse":[96],"near-constant":[98],"outputs":[99,133,145],"(confidence":[100],"std":[101,106],"&lt;":[102,107],"0.006,":[103],"attention":[104],"allocation":[105],"0.011)":[108],"mechanism":[113],"shifts":[114],"discount":[116],"factor":[117],"by":[118,131],"less":[119],"than":[120,237],"0.03%.":[121],"Policy":[122],"sensitivity":[123],"analysis":[124],"confirms":[125],"agent's":[127],"decisions":[128],"unaffected":[130],"module":[132,144],"design.":[136],"then":[138],"structurally":[141],"integrating":[142],"using":[147],"confidence":[148],"gate":[150],"exploration,":[151],"surprise":[152],"trigger":[154],"workspace":[155],"broadcasts,":[156],"self-model":[158],"predictions":[159],"policy":[161],"input":[162],"produces":[164],"medium-large":[166],"improvement":[167],"over":[168],"add-on":[170],"approach":[171],"(Cohen's":[172],"d":[173],"=":[174,177,209,212],"0.62,":[175],"p":[176,211],"0.06,":[178],"paired)":[179],"environment.":[183],"Component-wise":[184],"ablations":[185],"reveal":[186],"TSM-to-policy":[189],"pathway":[190],"contributes":[191],"most":[192],"gain.":[195],"However,":[196],"structural":[197],"integration":[198],"does":[199],"not":[200,253],"significantly":[201],"outperform":[202],"baseline":[204],"(d":[208],"0.15,":[210],"0.67),":[213],"parameter-matched":[216],"control":[217],"without":[218],"performs":[220],"comparably,":[221],"so":[222],"may":[225],"lie":[226],"recovering":[228],"from":[229],"trend-level":[231],"harm":[232],"ignored":[234],"rather":[236],"content.":[240],"The":[241],"architectural":[242],"implication":[243],"is":[244],"should":[247],"sit":[248],"on":[249],"decision":[251],"pathway,":[252],"beside":[254],"it.":[255]},"counts_by_year":[],"updated_date":"2026-04-16T06:09:31.884825","created_date":"2026-04-16T00:00:00"}