{"id":"https://openalex.org/W7155102463","doi":"https://doi.org/10.48550/arxiv.2604.18419","title":"Knowing When to Quit: A Principled Framework for Dynamic Abstention in LLM Reasoning","display_name":"Knowing When to Quit: A Principled Framework for Dynamic Abstention in LLM Reasoning","publication_year":2026,"publication_date":"2026-04-20","ids":{"openalex":"https://openalex.org/W7155102463","doi":"https://doi.org/10.48550/arxiv.2604.18419"},"language":null,"primary_location":{"id":"doi:10.48550/arxiv.2604.18419","is_oa":true,"landing_page_url":"https://doi.org/10.48550/arxiv.2604.18419","pdf_url":null,"source":{"id":"https://openalex.org/S4306400194","display_name":"arXiv (Cornell University)","issn_l":null,"issn":null,"is_oa":true,"is_in_doaj":false,"is_core":false,"host_organization":"https://openalex.org/I205783295","host_organization_name":"Cornell University","host_organization_lineage":["https://openalex.org/I205783295"],"host_organization_lineage_names":[],"type":"repository"},"license":"cc-by","license_id":"https://openalex.org/licenses/cc-by","version":null,"is_accepted":false,"is_published":false,"raw_source_name":null,"raw_type":"Preprint"},"type":"preprint","indexed_in":["datacite"],"open_access":{"is_oa":true,"oa_status":"green","oa_url":"https://doi.org/10.48550/arxiv.2604.18419","any_repository_has_fulltext":true},"authorships":[{"author_position":"first","author":{"id":"https://openalex.org/A5119967943","display_name":"Hen Davidov","orcid":null},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Davidov, Hen","raw_affiliation_strings":[],"raw_orcid":null,"affiliations":[]},{"author_position":"middle","author":{"id":"https://openalex.org/A5039180591","display_name":"Nachshon Cohen","orcid":"https://orcid.org/0000-0001-8302-2739"},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Cohen, Nachshon","raw_affiliation_strings":[],"raw_orcid":null,"affiliations":[]},{"author_position":"middle","author":{"id":"https://openalex.org/A5045241462","display_name":"Oren Kalinsky","orcid":null},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Kalinsky, Oren","raw_affiliation_strings":[],"raw_orcid":null,"affiliations":[]},{"author_position":"middle","author":{"id":"https://openalex.org/A5009340389","display_name":"Yaron Fairstein","orcid":null},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Fairstein, Yaron","raw_affiliation_strings":[],"raw_orcid":null,"affiliations":[]},{"author_position":"middle","author":{"id":"https://openalex.org/A5082898388","display_name":"Guy Kushilevitz","orcid":null},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Kushilevitz, Guy","raw_affiliation_strings":[],"raw_orcid":null,"affiliations":[]},{"author_position":"middle","author":{"id":"https://openalex.org/A5021692551","display_name":"Ram Yazdi","orcid":null},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Yazdi, Ram","raw_affiliation_strings":[],"raw_orcid":null,"affiliations":[]},{"author_position":"last","author":{"id":"https://openalex.org/A5091668854","display_name":"Patrick Rebeschini","orcid":"https://orcid.org/0000-0001-7772-4160"},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Rebeschini, Patrick","raw_affiliation_strings":[],"raw_orcid":null,"affiliations":[]}],"institutions":[],"countries_distinct_count":0,"institutions_distinct_count":0,"corresponding_author_ids":[],"corresponding_institution_ids":[],"apc_list":null,"apc_paid":null,"fwci":null,"has_fulltext":false,"cited_by_count":0,"citation_normalized_percentile":null,"cited_by_percentile_year":null,"biblio":{"volume":null,"issue":null,"first_page":null,"last_page":null},"is_retracted":false,"is_paratext":false,"is_xpac":false,"primary_topic":{"id":"https://openalex.org/T10028","display_name":"Topic Modeling","score":0.26080000400543213,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},"topics":[{"id":"https://openalex.org/T10028","display_name":"Topic Modeling","score":0.26080000400543213,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T12026","display_name":"Explainable Artificial Intelligence (XAI)","score":0.23100000619888306,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T11714","display_name":"Multimodal Machine Learning Applications","score":0.11129999905824661,"subfield":{"id":"https://openalex.org/subfields/1707","display_name":"Computer Vision and Pattern Recognition"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}}],"keywords":[{"id":"https://openalex.org/keywords/reinforcement-learning","display_name":"Reinforcement learning","score":0.6040999889373779},{"id":"https://openalex.org/keywords/value","display_name":"Value (mathematics)","score":0.5171999931335449},{"id":"https://openalex.org/keywords/function","display_name":"Function (biology)","score":0.5004000067710876},{"id":"https://openalex.org/keywords/action","display_name":"Action (physics)","score":0.47510001063346863},{"id":"https://openalex.org/keywords/bellman-equation","display_name":"Bellman equation","score":0.4406000077724457},{"id":"https://openalex.org/keywords/security-token","display_name":"Security token","score":0.34119999408721924}],"concepts":[{"id":"https://openalex.org/C41008148","wikidata":"https://www.wikidata.org/wiki/Q21198","display_name":"Computer science","level":0,"score":0.6421999931335449},{"id":"https://openalex.org/C97541855","wikidata":"https://www.wikidata.org/wiki/Q830687","display_name":"Reinforcement learning","level":2,"score":0.6040999889373779},{"id":"https://openalex.org/C2776291640","wikidata":"https://www.wikidata.org/wiki/Q2912517","display_name":"Value (mathematics)","level":2,"score":0.5171999931335449},{"id":"https://openalex.org/C14036430","wikidata":"https://www.wikidata.org/wiki/Q3736076","display_name":"Function (biology)","level":2,"score":0.5004000067710876},{"id":"https://openalex.org/C2780791683","wikidata":"https://www.wikidata.org/wiki/Q846785","display_name":"Action (physics)","level":2,"score":0.47510001063346863},{"id":"https://openalex.org/C154945302","wikidata":"https://www.wikidata.org/wiki/Q11660","display_name":"Artificial intelligence","level":1,"score":0.4632999897003174},{"id":"https://openalex.org/C14646407","wikidata":"https://www.wikidata.org/wiki/Q1430750","display_name":"Bellman equation","level":2,"score":0.4406000077724457},{"id":"https://openalex.org/C48145219","wikidata":"https://www.wikidata.org/wiki/Q1335365","display_name":"Security token","level":2,"score":0.34119999408721924},{"id":"https://openalex.org/C2776608160","wikidata":"https://www.wikidata.org/wiki/Q4785462","display_name":"Natural (archaeology)","level":2,"score":0.3160000145435333},{"id":"https://openalex.org/C120936955","wikidata":"https://www.wikidata.org/wiki/Q2155640","display_name":"Empirical research","level":2,"score":0.3124000132083893},{"id":"https://openalex.org/C195324797","wikidata":"https://www.wikidata.org/wiki/Q33742","display_name":"Natural language","level":2,"score":0.31029999256134033},{"id":"https://openalex.org/C127729010","wikidata":"https://www.wikidata.org/wiki/Q60165","display_name":"Dynamic inconsistency","level":2,"score":0.29420000314712524},{"id":"https://openalex.org/C2775924081","wikidata":"https://www.wikidata.org/wiki/Q55608371","display_name":"Control (management)","level":2,"score":0.2815999984741211},{"id":"https://openalex.org/C37404715","wikidata":"https://www.wikidata.org/wiki/Q380679","display_name":"Dynamic programming","level":2,"score":0.2554999887943268}],"mesh":[],"locations_count":1,"locations":[{"id":"doi:10.48550/arxiv.2604.18419","is_oa":true,"landing_page_url":"https://doi.org/10.48550/arxiv.2604.18419","pdf_url":null,"source":{"id":"https://openalex.org/S4306400194","display_name":"arXiv (Cornell University)","issn_l":null,"issn":null,"is_oa":true,"is_in_doaj":false,"is_core":false,"host_organization":"https://openalex.org/I205783295","host_organization_name":"Cornell University","host_organization_lineage":["https://openalex.org/I205783295"],"host_organization_lineage_names":[],"type":"repository"},"license":"cc-by","license_id":"https://openalex.org/licenses/cc-by","version":null,"is_accepted":false,"is_published":null,"raw_source_name":null,"raw_type":"Preprint"}],"best_oa_location":{"id":"doi:10.48550/arxiv.2604.18419","is_oa":true,"landing_page_url":"https://doi.org/10.48550/arxiv.2604.18419","pdf_url":null,"source":{"id":"https://openalex.org/S4306400194","display_name":"arXiv (Cornell University)","issn_l":null,"issn":null,"is_oa":true,"is_in_doaj":false,"is_core":false,"host_organization":"https://openalex.org/I205783295","host_organization_name":"Cornell University","host_organization_lineage":["https://openalex.org/I205783295"],"host_organization_lineage_names":[],"type":"repository"},"license":"cc-by","license_id":"https://openalex.org/licenses/cc-by","version":null,"is_accepted":false,"is_published":false,"raw_source_name":null,"raw_type":"Preprint"},"sustainable_development_goals":[],"awards":[],"funders":[],"has_content":{"pdf":false,"grobid_xml":false},"content_urls":null,"referenced_works_count":0,"referenced_works":[],"related_works":[],"abstract_inverted_index":{"LLMs":[0],"utilizing":[1],"chain-of-thought":[2],"reasoning":[3,44,137],"often":[4],"waste":[5],"substantial":[6],"compute":[7,98],"by":[8,17],"producing":[9],"long,":[10],"incorrect":[11],"responses.":[12],"Abstention":[13],"can":[14],"mitigate":[15],"this":[16,57,111],"withholding":[18],"outputs":[19,31],"unlikely":[20],"to":[21,29,128],"be":[22],"correct.":[23],"While":[24],"most":[25],"abstention":[26,38,64,75,79,91],"methods":[27],"decide":[28],"withhold":[30],"before":[32],"or":[33],"after":[34],"generation,":[35],"dynamic":[36,74],"mid-generation":[37],"considers":[39],"early":[40],"termination":[41],"of":[42,56,73],"unpromising":[43],"traces":[45],"at":[46],"each":[47],"token":[48],"position.":[49],"Prior":[50],"work":[51],"has":[52],"explored":[53],"empirical":[54],"variants":[55],"idea,":[58],"but":[59],"principled":[60,124],"guidance":[61],"for":[62,76],"the":[63,95,106,130],"rule":[65],"remains":[66],"lacking.":[67],"We":[68,101,120],"present":[69],"a":[70,85,123],"formal":[71],"analysis":[72],"LLMs,":[77],"modeling":[78],"as":[80],"an":[81],"explicit":[82],"action":[83],"within":[84],"regularized":[86],"reinforcement":[87],"learning":[88],"framework.":[89],"An":[90],"reward":[92,112],"parameter":[93],"controls":[94],"trade-off":[96],"between":[97],"and":[99,125,138,145],"information.":[100],"show":[102],"that":[103],"abstaining":[104],"when":[105],"value":[107,131],"function":[108],"falls":[109],"below":[110],"strictly":[113],"outperforms":[114],"natural":[115],"baselines":[116],"under":[117],"general":[118],"conditions.":[119],"further":[121],"derive":[122],"efficient":[126],"method":[127],"approximate":[129],"function.":[132],"Empirical":[133],"results":[134],"on":[135],"mathematical":[136],"toxicity":[139],"avoidance":[140],"tasks":[141],"support":[142],"our":[143],"theory":[144],"demonstrate":[146],"improved":[147],"selective":[148],"accuracy":[149],"over":[150],"existing":[151],"methods.":[152]},"counts_by_year":[],"updated_date":"2026-07-01T06:00:48.157686","created_date":"2026-04-22T00:00:00"}