{"id":"https://openalex.org/W7133733250","doi":"https://doi.org/10.48550/arxiv.2603.03475","title":"When Shallow Wins: Silent Failures and the Depth-Accuracy Paradox in Latent Reasoning","display_name":"When Shallow Wins: Silent Failures and the Depth-Accuracy Paradox in Latent Reasoning","publication_year":2026,"publication_date":"2026-03-03","ids":{"openalex":"https://openalex.org/W7133733250","doi":"https://doi.org/10.48550/arxiv.2603.03475"},"language":null,"primary_location":{"id":"pmh:doi:10.48550/arxiv.2603.03475","is_oa":true,"landing_page_url":null,"pdf_url":null,"source":{"id":"https://openalex.org/S4406922384","display_name":"Open MIND","issn_l":null,"issn":null,"is_oa":false,"is_in_doaj":false,"is_core":false,"host_organization":null,"host_organization_name":null,"host_organization_lineage":[],"host_organization_lineage_names":[],"type":"repository"},"license":"cc-by","license_id":"https://openalex.org/licenses/cc-by","version":"submittedVersion","is_accepted":false,"is_published":false,"raw_source_name":null,"raw_type":"Article"},"type":"preprint","indexed_in":["datacite"],"open_access":{"is_oa":true,"oa_status":"green","oa_url":null,"any_repository_has_fulltext":true},"authorships":[{"author_position":"first","author":{"id":"https://openalex.org/A5128216351","display_name":"Subramanyam Sahoo","orcid":null},"institutions":[],"countries":[],"is_corresponding":true,"raw_author_name":"Sahoo, Subramanyam","raw_affiliation_strings":[],"affiliations":[]},{"author_position":"middle","author":{"id":"https://openalex.org/A5128128426","display_name":"Aman Chadha","orcid":null},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Chadha, Aman","raw_affiliation_strings":[],"affiliations":[]},{"author_position":"middle","author":{"id":"https://openalex.org/A5122946330","display_name":"Vinija Jain","orcid":null},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Jain, Vinija","raw_affiliation_strings":[],"affiliations":[]},{"author_position":"last","author":{"id":"https://openalex.org/A5127901258","display_name":"Divya Chaudhary","orcid":null},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Chaudhary, Divya","raw_affiliation_strings":[],"affiliations":[]}],"institutions":[],"countries_distinct_count":0,"institutions_distinct_count":4,"corresponding_author_ids":["https://openalex.org/A5128216351"],"corresponding_institution_ids":[],"apc_list":null,"apc_paid":null,"fwci":null,"has_fulltext":false,"cited_by_count":0,"citation_normalized_percentile":null,"cited_by_percentile_year":null,"biblio":{"volume":null,"issue":null,"first_page":null,"last_page":null},"is_retracted":false,"is_paratext":false,"is_xpac":false,"primary_topic":{"id":"https://openalex.org/T11902","display_name":"Intelligent Tutoring Systems and Adaptive Learning","score":0.5709999799728394,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},"topics":[{"id":"https://openalex.org/T11902","display_name":"Intelligent Tutoring Systems and Adaptive Learning","score":0.5709999799728394,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T12026","display_name":"Explainable Artificial Intelligence (XAI)","score":0.06530000269412994,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T10130","display_name":"Mathematics Education and Teaching Techniques","score":0.027000000700354576,"subfield":{"id":"https://openalex.org/subfields/3304","display_name":"Education"},"field":{"id":"https://openalex.org/fields/33","display_name":"Social Sciences"},"domain":{"id":"https://openalex.org/domains/2","display_name":"Social Sciences"}}],"keywords":[{"id":"https://openalex.org/keywords/correctness","display_name":"Correctness","score":0.7110000252723694},{"id":"https://openalex.org/keywords/benchmark","display_name":"Benchmark (surveying)","score":0.46549999713897705},{"id":"https://openalex.org/keywords/artifact","display_name":"Artifact (error)","score":0.46369999647140503},{"id":"https://openalex.org/keywords/stability","display_name":"Stability (learning theory)","score":0.4498000144958496},{"id":"https://openalex.org/keywords/monotonic-function","display_name":"Monotonic function","score":0.375},{"id":"https://openalex.org/keywords/binary-number","display_name":"Binary number","score":0.37049999833106995},{"id":"https://openalex.org/keywords/automated-reasoning","display_name":"Automated reasoning","score":0.36970001459121704},{"id":"https://openalex.org/keywords/scaling","display_name":"Scaling","score":0.3693000078201294},{"id":"https://openalex.org/keywords/computational-model","display_name":"Computational model","score":0.3671000003814697}],"concepts":[{"id":"https://openalex.org/C55439883","wikidata":"https://www.wikidata.org/wiki/Q360812","display_name":"Correctness","level":2,"score":0.7110000252723694},{"id":"https://openalex.org/C41008148","wikidata":"https://www.wikidata.org/wiki/Q21198","display_name":"Computer science","level":0,"score":0.5989000201225281},{"id":"https://openalex.org/C154945302","wikidata":"https://www.wikidata.org/wiki/Q11660","display_name":"Artificial intelligence","level":1,"score":0.586899995803833},{"id":"https://openalex.org/C185798385","wikidata":"https://www.wikidata.org/wiki/Q1161707","display_name":"Benchmark (surveying)","level":2,"score":0.46549999713897705},{"id":"https://openalex.org/C2779010991","wikidata":"https://www.wikidata.org/wiki/Q2720909","display_name":"Artifact (error)","level":2,"score":0.46369999647140503},{"id":"https://openalex.org/C112972136","wikidata":"https://www.wikidata.org/wiki/Q7595718","display_name":"Stability (learning theory)","level":2,"score":0.4498000144958496},{"id":"https://openalex.org/C119857082","wikidata":"https://www.wikidata.org/wiki/Q2539","display_name":"Machine learning","level":1,"score":0.42910000681877136},{"id":"https://openalex.org/C72169020","wikidata":"https://www.wikidata.org/wiki/Q194404","display_name":"Monotonic function","level":2,"score":0.375},{"id":"https://openalex.org/C48372109","wikidata":"https://www.wikidata.org/wiki/Q3913","display_name":"Binary number","level":2,"score":0.37049999833106995},{"id":"https://openalex.org/C195344581","wikidata":"https://www.wikidata.org/wiki/Q2555318","display_name":"Automated reasoning","level":2,"score":0.36970001459121704},{"id":"https://openalex.org/C99844830","wikidata":"https://www.wikidata.org/wiki/Q102441924","display_name":"Scaling","level":2,"score":0.3693000078201294},{"id":"https://openalex.org/C66024118","wikidata":"https://www.wikidata.org/wiki/Q1122506","display_name":"Computational model","level":2,"score":0.3671000003814697},{"id":"https://openalex.org/C3309909","wikidata":"https://www.wikidata.org/wiki/Q864155","display_name":"Binary decision diagram","level":2,"score":0.3476000130176544},{"id":"https://openalex.org/C2779530757","wikidata":"https://www.wikidata.org/wiki/Q1207505","display_name":"Quality (philosophy)","level":2,"score":0.3427000045776367},{"id":"https://openalex.org/C179799912","wikidata":"https://www.wikidata.org/wiki/Q205084","display_name":"Computational complexity theory","level":2,"score":0.31619998812675476},{"id":"https://openalex.org/C83725634","wikidata":"https://www.wikidata.org/wiki/Q7268699","display_name":"Qualitative reasoning","level":2,"score":0.3059000074863434},{"id":"https://openalex.org/C11413529","wikidata":"https://www.wikidata.org/wiki/Q8366","display_name":"Algorithm","level":1,"score":0.2976999878883362},{"id":"https://openalex.org/C159032336","wikidata":"https://www.wikidata.org/wiki/Q2488768","display_name":"Non-monotonic logic","level":2,"score":0.29429998993873596},{"id":"https://openalex.org/C2778334786","wikidata":"https://www.wikidata.org/wiki/Q1586270","display_name":"Variation (astronomy)","level":2,"score":0.2865999937057495},{"id":"https://openalex.org/C117220453","wikidata":"https://www.wikidata.org/wiki/Q5172842","display_name":"Correlation","level":2,"score":0.2849999964237213},{"id":"https://openalex.org/C37335422","wikidata":"https://www.wikidata.org/wiki/Q6888134","display_name":"Model-based reasoning","level":3,"score":0.2800000011920929},{"id":"https://openalex.org/C36299963","wikidata":"https://www.wikidata.org/wiki/Q1369844","display_name":"Observability","level":2,"score":0.27469998598098755},{"id":"https://openalex.org/C108650721","wikidata":"https://www.wikidata.org/wiki/Q1783253","display_name":"Counterfactual thinking","level":2,"score":0.27160000801086426},{"id":"https://openalex.org/C80444323","wikidata":"https://www.wikidata.org/wiki/Q2878974","display_name":"Theoretical computer science","level":1,"score":0.2639999985694885},{"id":"https://openalex.org/C61797465","wikidata":"https://www.wikidata.org/wiki/Q1188986","display_name":"Term (time)","level":2,"score":0.25369998812675476},{"id":"https://openalex.org/C2779714256","wikidata":"https://www.wikidata.org/wiki/Q25305062","display_name":"Multiple Models","level":2,"score":0.25290000438690186}],"mesh":[],"locations_count":2,"locations":[{"id":"pmh:doi:10.48550/arxiv.2603.03475","is_oa":true,"landing_page_url":null,"pdf_url":null,"source":{"id":"https://openalex.org/S4406922384","display_name":"Open MIND","issn_l":null,"issn":null,"is_oa":false,"is_in_doaj":false,"is_core":false,"host_organization":null,"host_organization_name":null,"host_organization_lineage":[],"host_organization_lineage_names":[],"type":"repository"},"license":"cc-by","license_id":"https://openalex.org/licenses/cc-by","version":"submittedVersion","is_accepted":false,"is_published":false,"raw_source_name":null,"raw_type":"Article"},{"id":"doi:10.48550/arxiv.2603.03475","is_oa":true,"landing_page_url":"https://doi.org/10.48550/arxiv.2603.03475","pdf_url":null,"source":{"id":"https://openalex.org/S4306400194","display_name":"arXiv (Cornell University)","issn_l":null,"issn":null,"is_oa":true,"is_in_doaj":false,"is_core":false,"host_organization":"https://openalex.org/I205783295","host_organization_name":"Cornell University","host_organization_lineage":["https://openalex.org/I205783295"],"host_organization_lineage_names":[],"type":"repository"},"license":"cc-by","license_id":"https://openalex.org/licenses/cc-by","version":null,"is_accepted":false,"is_published":null,"raw_source_name":null,"raw_type":"article"}],"best_oa_location":{"id":"pmh:doi:10.48550/arxiv.2603.03475","is_oa":true,"landing_page_url":null,"pdf_url":null,"source":{"id":"https://openalex.org/S4406922384","display_name":"Open MIND","issn_l":null,"issn":null,"is_oa":false,"is_in_doaj":false,"is_core":false,"host_organization":null,"host_organization_name":null,"host_organization_lineage":[],"host_organization_lineage_names":[],"type":"repository"},"license":"cc-by","license_id":"https://openalex.org/licenses/cc-by","version":"submittedVersion","is_accepted":false,"is_published":false,"raw_source_name":null,"raw_type":"Article"},"sustainable_development_goals":[{"display_name":"Peace, Justice and strong institutions","id":"https://metadata.un.org/sdg/16","score":0.5375871062278748}],"awards":[],"funders":[],"has_content":{"pdf":false,"grobid_xml":false},"content_urls":null,"referenced_works_count":0,"referenced_works":[],"related_works":[],"abstract_inverted_index":{"Mathematical":[0],"reasoning":[1,35,44,75,126],"models":[2,23],"are":[3,57],"widely":[4],"deployed":[5],"in":[6],"education,":[7],"automated":[8],"tutoring,":[9],"and":[10,33,123],"decision":[11],"support":[12],"systems":[13],"despite":[14],"exhibiting":[15],"fundamental":[16],"computational":[17,129,144],"instabilities.":[18],"We":[19],"demonstrate":[20],"that":[21,139],"state-of-the-art":[22],"(Qwen2.5-Math-7B)":[24],"achieve":[25],"61%":[26],"accuracy":[27,108,141],"through":[28,48],"a":[29,86,93],"mixture":[30],"of":[31,38,54,115],"reliable":[32],"unreliable":[34],"pathways:":[36],"18.4%":[37],"correct":[39],"predictions":[40,56],"employ":[41],"stable,":[42],"faithful":[43],"while":[45],"81.6%":[46],"emerge":[47],"computationally":[49],"inconsistent":[50],"pathways.":[51],"Additionally,":[52],"8.8%":[53],"all":[55],"silent":[58],"failures":[59],"--":[60],"confident":[61],"yet":[62],"incorrect":[63],"outputs.":[64],"Through":[65],"comprehensive":[66],"analysis":[67],"using":[68],"novel":[69],"faithfulness":[70],"metrics,":[71],"we":[72],"reveal:":[73],"(1)":[74],"quality":[76],"shows":[77],"weak":[78],"negative":[79],"correlation":[80],"with":[81,131],"correctness":[82],"(r=-0.21,":[83],"p=0.002),":[84],"reflecting":[85],"binary":[87],"classification":[88],"threshold":[89],"artifact":[90],"rather":[91],"than":[92],"monotonic":[94],"inverse":[95],"relationship;":[96],"(2)":[97],"scaling":[98],"from":[99],"1.5B":[100],"to":[101],"7B":[102],"parameters":[103],"(4.7x":[104],"increase)":[105],"provides":[106],"zero":[107],"benefit":[109],"on":[110,119],"our":[111],"evaluated":[112],"subset":[113],"(6%":[114],"GSM8K),":[116],"requiring":[117],"validation":[118],"the":[120],"complete":[121],"benchmark;":[122],"(3)":[124],"latent":[125],"employs":[127],"diverse":[128],"strategies,":[130],"~20%":[132],"sharing":[133],"CoT-like":[134],"patterns.":[135],"These":[136],"findings":[137],"highlight":[138],"benchmark":[140],"can":[142],"mask":[143],"unreliability,":[145],"demanding":[146],"evaluation":[147],"reforms":[148],"measuring":[149],"stability":[150],"beyond":[151],"single-sample":[152],"metrics.":[153]},"counts_by_year":[],"updated_date":"2026-04-04T16:13:02.066488","created_date":"2026-03-06T00:00:00"}