{"id":"https://openalex.org/W7134050657","doi":"https://doi.org/10.48550/arxiv.2603.04412","title":"Additive Multi-Step Markov Chains and the Curse of Dimensionality in Large Language Models","display_name":"Additive Multi-Step Markov Chains and the Curse of Dimensionality in Large Language Models","publication_year":2026,"publication_date":"2026-02-03","ids":{"openalex":"https://openalex.org/W7134050657","doi":"https://doi.org/10.48550/arxiv.2603.04412"},"language":null,"primary_location":{"id":"pmh:doi:10.48550/arxiv.2603.04412","is_oa":true,"landing_page_url":null,"pdf_url":null,"source":{"id":"https://openalex.org/S4406922384","display_name":"Open MIND","issn_l":null,"issn":null,"is_oa":false,"is_in_doaj":false,"is_core":false,"host_organization":null,"host_organization_name":null,"host_organization_lineage":[],"host_organization_lineage_names":[],"type":"repository"},"license":"cc-by","license_id":"https://openalex.org/licenses/cc-by","version":"submittedVersion","is_accepted":false,"is_published":false,"raw_source_name":null,"raw_type":"Article"},"type":"preprint","indexed_in":["datacite"],"open_access":{"is_oa":true,"oa_status":"green","oa_url":null,"any_repository_has_fulltext":true},"authorships":[{"author_position":"first","author":{"id":"https://openalex.org/A5128255621","display_name":"O. V. Usatenko","orcid":null},"institutions":[],"countries":[],"is_corresponding":true,"raw_author_name":"Usatenko, O. V.","raw_affiliation_strings":[],"affiliations":[]},{"author_position":"middle","author":{"id":"https://openalex.org/A5128253355","display_name":"S. S. Melnyk","orcid":null},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Melnyk, S. S.","raw_affiliation_strings":[],"affiliations":[]},{"author_position":"last","author":{"id":"https://openalex.org/A5128233219","display_name":"G. M. Pritula","orcid":null},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Pritula, G. M.","raw_affiliation_strings":[],"affiliations":[]}],"institutions":[],"countries_distinct_count":0,"institutions_distinct_count":3,"corresponding_author_ids":["https://openalex.org/A5128255621"],"corresponding_institution_ids":[],"apc_list":null,"apc_paid":null,"fwci":null,"has_fulltext":false,"cited_by_count":0,"citation_normalized_percentile":null,"cited_by_percentile_year":null,"biblio":{"volume":null,"issue":null,"first_page":null,"last_page":null},"is_retracted":false,"is_paratext":false,"is_xpac":false,"primary_topic":{"id":"https://openalex.org/T10181","display_name":"Natural Language Processing Techniques","score":0.3903000056743622,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},"topics":[{"id":"https://openalex.org/T10181","display_name":"Natural Language Processing Techniques","score":0.3903000056743622,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T12090","display_name":"Language and cultural evolution","score":0.07329999655485153,"subfield":{"id":"https://openalex.org/subfields/3316","display_name":"Cultural Studies"},"field":{"id":"https://openalex.org/fields/33","display_name":"Social Sciences"},"domain":{"id":"https://openalex.org/domains/2","display_name":"Social Sciences"}},{"id":"https://openalex.org/T10201","display_name":"Speech Recognition and Synthesis","score":0.0608999989926815,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}}],"keywords":[{"id":"https://openalex.org/keywords/markov-chain","display_name":"Markov chain","score":0.8040000200271606},{"id":"https://openalex.org/keywords/curse-of-dimensionality","display_name":"Curse of dimensionality","score":0.6176000237464905},{"id":"https://openalex.org/keywords/variable-order-markov-model","display_name":"Variable-order Markov model","score":0.5597000122070312},{"id":"https://openalex.org/keywords/markov-process","display_name":"Markov process","score":0.5282999873161316},{"id":"https://openalex.org/keywords/markov-model","display_name":"Markov model","score":0.5231000185012817},{"id":"https://openalex.org/keywords/markov-property","display_name":"Markov property","score":0.4934000074863434},{"id":"https://openalex.org/keywords/equivalence","display_name":"Equivalence (formal languages)","score":0.47999998927116394},{"id":"https://openalex.org/keywords/markov-kernel","display_name":"Markov kernel","score":0.4262999892234802},{"id":"https://openalex.org/keywords/additive-markov-chain","display_name":"Additive Markov chain","score":0.3978999853134155}],"concepts":[{"id":"https://openalex.org/C98763669","wikidata":"https://www.wikidata.org/wiki/Q176645","display_name":"Markov chain","level":2,"score":0.8040000200271606},{"id":"https://openalex.org/C111030470","wikidata":"https://www.wikidata.org/wiki/Q1430460","display_name":"Curse of dimensionality","level":2,"score":0.6176000237464905},{"id":"https://openalex.org/C54907487","wikidata":"https://www.wikidata.org/wiki/Q7915688","display_name":"Variable-order Markov model","level":4,"score":0.5597000122070312},{"id":"https://openalex.org/C159886148","wikidata":"https://www.wikidata.org/wiki/Q176645","display_name":"Markov process","level":2,"score":0.5282999873161316},{"id":"https://openalex.org/C163836022","wikidata":"https://www.wikidata.org/wiki/Q6771326","display_name":"Markov model","level":3,"score":0.5231000185012817},{"id":"https://openalex.org/C189973286","wikidata":"https://www.wikidata.org/wiki/Q176695","display_name":"Markov property","level":4,"score":0.4934000074863434},{"id":"https://openalex.org/C2780069185","wikidata":"https://www.wikidata.org/wiki/Q7977945","display_name":"Equivalence (formal languages)","level":2,"score":0.47999998927116394},{"id":"https://openalex.org/C33923547","wikidata":"https://www.wikidata.org/wiki/Q395","display_name":"Mathematics","level":0,"score":0.4794999957084656},{"id":"https://openalex.org/C41008148","wikidata":"https://www.wikidata.org/wiki/Q21198","display_name":"Computer science","level":0,"score":0.4422999918460846},{"id":"https://openalex.org/C106666656","wikidata":"https://www.wikidata.org/wiki/Q6771323","display_name":"Markov kernel","level":5,"score":0.4262999892234802},{"id":"https://openalex.org/C80444323","wikidata":"https://www.wikidata.org/wiki/Q2878974","display_name":"Theoretical computer science","level":1,"score":0.42010000348091125},{"id":"https://openalex.org/C96810086","wikidata":"https://www.wikidata.org/wiki/Q17003273","display_name":"Additive Markov chain","level":5,"score":0.3978999853134155},{"id":"https://openalex.org/C147080032","wikidata":"https://www.wikidata.org/wiki/Q176720","display_name":"Continuous-time Markov chain","level":5,"score":0.38350000977516174},{"id":"https://openalex.org/C199185054","wikidata":"https://www.wikidata.org/wiki/Q552299","display_name":"Chain (unit)","level":2,"score":0.3779999911785126},{"id":"https://openalex.org/C97074811","wikidata":"https://www.wikidata.org/wiki/Q6771322","display_name":"Markov chain mixing time","level":5,"score":0.36649999022483826},{"id":"https://openalex.org/C48145219","wikidata":"https://www.wikidata.org/wiki/Q1335365","display_name":"Security token","level":2,"score":0.36480000615119934},{"id":"https://openalex.org/C27753989","wikidata":"https://www.wikidata.org/wiki/Q284885","display_name":"Superposition principle","level":2,"score":0.362199991941452},{"id":"https://openalex.org/C2778112365","wikidata":"https://www.wikidata.org/wiki/Q3511065","display_name":"Sequence (biology)","level":2,"score":0.32910001277923584},{"id":"https://openalex.org/C163540672","wikidata":"https://www.wikidata.org/wiki/Q1115431","display_name":"Markov renewal process","level":5,"score":0.31709998846054077},{"id":"https://openalex.org/C44492722","wikidata":"https://www.wikidata.org/wiki/Q327069","display_name":"Conditional probability","level":2,"score":0.3167000114917755},{"id":"https://openalex.org/C11413529","wikidata":"https://www.wikidata.org/wiki/Q8366","display_name":"Algorithm","level":1,"score":0.31200000643730164},{"id":"https://openalex.org/C196956702","wikidata":"https://www.wikidata.org/wiki/Q6795829","display_name":"Maximum-entropy Markov model","level":5,"score":0.3050000071525574},{"id":"https://openalex.org/C48103436","wikidata":"https://www.wikidata.org/wiki/Q599031","display_name":"State (computer science)","level":2,"score":0.30250000953674316},{"id":"https://openalex.org/C154945302","wikidata":"https://www.wikidata.org/wiki/Q11660","display_name":"Artificial intelligence","level":1,"score":0.29670000076293945},{"id":"https://openalex.org/C23224414","wikidata":"https://www.wikidata.org/wiki/Q176769","display_name":"Hidden Markov model","level":2,"score":0.2849999964237213},{"id":"https://openalex.org/C93457212","wikidata":"https://www.wikidata.org/wiki/Q4669888","display_name":"Absorbing Markov chain","level":5,"score":0.2809999883174896},{"id":"https://openalex.org/C196455857","wikidata":"https://www.wikidata.org/wiki/Q5473264","display_name":"Forward algorithm","level":5,"score":0.2676999866962433},{"id":"https://openalex.org/C76408418","wikidata":"https://www.wikidata.org/wiki/Q5419314","display_name":"Examples of Markov chains","level":5,"score":0.26649999618530273},{"id":"https://openalex.org/C79772020","wikidata":"https://www.wikidata.org/wiki/Q5159264","display_name":"Conditional independence","level":2,"score":0.25949999690055847},{"id":"https://openalex.org/C156103551","wikidata":"https://www.wikidata.org/wiki/Q130998","display_name":"Equivalence relation","level":2,"score":0.2529999911785126},{"id":"https://openalex.org/C106189395","wikidata":"https://www.wikidata.org/wiki/Q176789","display_name":"Markov decision process","level":3,"score":0.2515000104904175}],"mesh":[],"locations_count":2,"locations":[{"id":"pmh:doi:10.48550/arxiv.2603.04412","is_oa":true,"landing_page_url":null,"pdf_url":null,"source":{"id":"https://openalex.org/S4406922384","display_name":"Open MIND","issn_l":null,"issn":null,"is_oa":false,"is_in_doaj":false,"is_core":false,"host_organization":null,"host_organization_name":null,"host_organization_lineage":[],"host_organization_lineage_names":[],"type":"repository"},"license":"cc-by","license_id":"https://openalex.org/licenses/cc-by","version":"submittedVersion","is_accepted":false,"is_published":false,"raw_source_name":null,"raw_type":"Article"},{"id":"doi:10.48550/arxiv.2603.04412","is_oa":true,"landing_page_url":"https://doi.org/10.48550/arxiv.2603.04412","pdf_url":null,"source":{"id":"https://openalex.org/S4306400194","display_name":"arXiv (Cornell University)","issn_l":null,"issn":null,"is_oa":true,"is_in_doaj":false,"is_core":false,"host_organization":"https://openalex.org/I205783295","host_organization_name":"Cornell University","host_organization_lineage":["https://openalex.org/I205783295"],"host_organization_lineage_names":[],"type":"repository"},"license":"cc-by","license_id":"https://openalex.org/licenses/cc-by","version":null,"is_accepted":false,"is_published":null,"raw_source_name":null,"raw_type":"article"}],"best_oa_location":{"id":"pmh:doi:10.48550/arxiv.2603.04412","is_oa":true,"landing_page_url":null,"pdf_url":null,"source":{"id":"https://openalex.org/S4406922384","display_name":"Open MIND","issn_l":null,"issn":null,"is_oa":false,"is_in_doaj":false,"is_core":false,"host_organization":null,"host_organization_name":null,"host_organization_lineage":[],"host_organization_lineage_names":[],"type":"repository"},"license":"cc-by","license_id":"https://openalex.org/licenses/cc-by","version":"submittedVersion","is_accepted":false,"is_published":false,"raw_source_name":null,"raw_type":"Article"},"sustainable_development_goals":[],"awards":[],"funders":[],"has_content":{"pdf":false,"grobid_xml":false},"content_urls":null,"referenced_works_count":0,"referenced_works":[],"related_works":[],"abstract_inverted_index":{"Large-scale":[0],"language":[1],"models":[2,48],"(LLMs)":[3],"operate":[4],"in":[5],"extremely":[6],"high-dimensional":[7],"state":[8],"spaces,":[9],"where":[10],"both":[11],"token":[12,56],"embeddings":[13],"and":[14,96],"their":[15],"hidden":[16],"representations":[17],"create":[18],"complex":[19],"dependencies":[20],"that":[21],"are":[22],"not":[23,115],"easily":[24],"reduced":[25],"to":[26,57],"classical":[27],"Markov":[28,45,77,124],"structures.":[29],"In":[30],"this":[31],"paper,":[32],"we":[33],"explore":[34],"a":[35,61,89,97,100],"theoretically":[36],"feasible":[37],"approximation":[38],"of":[39,53,63,82,88,109,112],"LLM":[40],"dynamics":[41],"using":[42],"N-order":[43,123],"additive":[44,93,122],"chains.":[46,125],"Such":[47],"allow":[49],"the":[50,54,70,83,86,107,110],"conditional":[51],"probability":[52],"next":[55],"be":[58],"decomposed":[59],"into":[60],"superposition":[62],"contributions":[64],"from":[65],"multiple":[66],"historical":[67],"depths,":[68],"reducing":[69],"combinatorial":[71],"explosion":[72],"typically":[73],"associated":[74],"with":[75,99],"high-order":[76],"processes.":[78],"The":[79],"main":[80],"result":[81],"work":[84],"is":[85],"establishment":[87],"correspondence":[90],"between":[91],"an":[92],"multi-step":[94],"chain":[95,98],"step-wise":[101],"memory":[102],"function.":[103],"This":[104],"equivalence":[105],"allowed":[106],"introduction":[108],"concept":[111],"information":[113],"temperature":[114],"only":[116],"for":[117,121],"stepwise":[118],"but":[119],"also":[120]},"counts_by_year":[],"updated_date":"2026-04-04T16:13:02.066488","created_date":"2026-03-07T00:00:00"}