{"id":"https://openalex.org/W7148289212","doi":"https://doi.org/10.48550/arxiv.2604.00179","title":"Finite-Time Analysis of Projected Two-Time-Scale Stochastic Approximation","display_name":"Finite-Time Analysis of Projected Two-Time-Scale Stochastic Approximation","publication_year":2026,"publication_date":"2026-03-31","ids":{"openalex":"https://openalex.org/W7148289212","doi":"https://doi.org/10.48550/arxiv.2604.00179"},"language":null,"primary_location":{"id":"doi:10.48550/arxiv.2604.00179","is_oa":true,"landing_page_url":"https://doi.org/10.48550/arxiv.2604.00179","pdf_url":null,"source":{"id":"https://openalex.org/S4306400194","display_name":"arXiv (Cornell University)","issn_l":null,"issn":null,"is_oa":true,"is_in_doaj":false,"is_core":false,"host_organization":"https://openalex.org/I205783295","host_organization_name":"Cornell University","host_organization_lineage":["https://openalex.org/I205783295"],"host_organization_lineage_names":[],"type":"repository"},"license":"cc-by","license_id":"https://openalex.org/licenses/cc-by","version":null,"is_accepted":false,"is_published":false,"raw_source_name":null,"raw_type":"article"},"type":"preprint","indexed_in":["datacite"],"open_access":{"is_oa":true,"oa_status":"green","oa_url":"https://doi.org/10.48550/arxiv.2604.00179","any_repository_has_fulltext":true},"authorships":[{"author_position":"first","author":{"id":"https://openalex.org/A5103935807","display_name":"Yitao Bai","orcid":null},"institutions":[],"countries":[],"is_corresponding":true,"raw_author_name":"Bai, Yitao","raw_affiliation_strings":[],"affiliations":[]},{"author_position":"middle","author":{"id":"https://openalex.org/A5035207859","display_name":"Thinh T. Doan","orcid":"https://orcid.org/0000-0001-5135-3429"},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Doan, Thinh T.","raw_affiliation_strings":[],"affiliations":[]},{"author_position":"last","author":{"id":"https://openalex.org/A5132797593","display_name":"Justin Romberg","orcid":null},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Romberg, Justin","raw_affiliation_strings":[],"affiliations":[]}],"institutions":[],"countries_distinct_count":0,"institutions_distinct_count":3,"corresponding_author_ids":["https://openalex.org/A5103935807"],"corresponding_institution_ids":[],"apc_list":null,"apc_paid":null,"fwci":null,"has_fulltext":false,"cited_by_count":0,"citation_normalized_percentile":null,"cited_by_percentile_year":null,"biblio":{"volume":null,"issue":null,"first_page":null,"last_page":null},"is_retracted":false,"is_paratext":false,"is_xpac":false,"primary_topic":{"id":"https://openalex.org/T11413","display_name":"Risk and Portfolio Optimization","score":0.28929999470710754,"subfield":{"id":"https://openalex.org/subfields/1803","display_name":"Management Science and Operations Research"},"field":{"id":"https://openalex.org/fields/18","display_name":"Decision Sciences"},"domain":{"id":"https://openalex.org/domains/2","display_name":"Social Sciences"}},"topics":[{"id":"https://openalex.org/T11413","display_name":"Risk and Portfolio Optimization","score":0.28929999470710754,"subfield":{"id":"https://openalex.org/subfields/1803","display_name":"Management Science and Operations Research"},"field":{"id":"https://openalex.org/fields/18","display_name":"Decision Sciences"},"domain":{"id":"https://openalex.org/domains/2","display_name":"Social Sciences"}},{"id":"https://openalex.org/T10462","display_name":"Reinforcement Learning in Robotics","score":0.1477999985218048,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T11612","display_name":"Stochastic Gradient Optimization Techniques","score":0.08720000088214874,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}}],"keywords":[{"id":"https://openalex.org/keywords/subspace-topology","display_name":"Subspace topology","score":0.7473000288009644},{"id":"https://openalex.org/keywords/sublinear-function","display_name":"Sublinear function","score":0.7178999781608582},{"id":"https://openalex.org/keywords/stochastic-approximation","display_name":"Stochastic approximation","score":0.6779000163078308},{"id":"https://openalex.org/keywords/constant","display_name":"Constant (computer programming)","score":0.6216999888420105},{"id":"https://openalex.org/keywords/stability","display_name":"Stability (learning theory)","score":0.6212999820709229},{"id":"https://openalex.org/keywords/convergence","display_name":"Convergence (economics)","score":0.5843999981880188},{"id":"https://openalex.org/keywords/approximation-error","display_name":"Approximation error","score":0.49810001254081726},{"id":"https://openalex.org/keywords/approximation-theory","display_name":"Approximation theory","score":0.37380000948905945}],"concepts":[{"id":"https://openalex.org/C32834561","wikidata":"https://www.wikidata.org/wiki/Q660730","display_name":"Subspace topology","level":2,"score":0.7473000288009644},{"id":"https://openalex.org/C33923547","wikidata":"https://www.wikidata.org/wiki/Q395","display_name":"Mathematics","level":0,"score":0.7426000237464905},{"id":"https://openalex.org/C117160843","wikidata":"https://www.wikidata.org/wiki/Q338652","display_name":"Sublinear function","level":2,"score":0.7178999781608582},{"id":"https://openalex.org/C55479107","wikidata":"https://www.wikidata.org/wiki/Q97663916","display_name":"Stochastic approximation","level":3,"score":0.6779000163078308},{"id":"https://openalex.org/C2777027219","wikidata":"https://www.wikidata.org/wiki/Q1284190","display_name":"Constant (computer programming)","level":2,"score":0.6216999888420105},{"id":"https://openalex.org/C112972136","wikidata":"https://www.wikidata.org/wiki/Q7595718","display_name":"Stability (learning theory)","level":2,"score":0.6212999820709229},{"id":"https://openalex.org/C2777303404","wikidata":"https://www.wikidata.org/wiki/Q759757","display_name":"Convergence (economics)","level":2,"score":0.5843999981880188},{"id":"https://openalex.org/C28826006","wikidata":"https://www.wikidata.org/wiki/Q33521","display_name":"Applied mathematics","level":1,"score":0.5613999962806702},{"id":"https://openalex.org/C122383733","wikidata":"https://www.wikidata.org/wiki/Q865920","display_name":"Approximation error","level":2,"score":0.49810001254081726},{"id":"https://openalex.org/C145242015","wikidata":"https://www.wikidata.org/wiki/Q774123","display_name":"Approximation theory","level":2,"score":0.37380000948905945},{"id":"https://openalex.org/C3018824978","wikidata":"https://www.wikidata.org/wiki/Q2894891","display_name":"Error analysis","level":2,"score":0.36500000953674316},{"id":"https://openalex.org/C160824197","wikidata":"https://www.wikidata.org/wiki/Q2071054","display_name":"Linear approximation","level":3,"score":0.3425999879837036},{"id":"https://openalex.org/C131584629","wikidata":"https://www.wikidata.org/wiki/Q4308705","display_name":"Coupling (piping)","level":2,"score":0.3312000036239624},{"id":"https://openalex.org/C8272713","wikidata":"https://www.wikidata.org/wiki/Q176737","display_name":"Stochastic process","level":2,"score":0.31790000200271606},{"id":"https://openalex.org/C117148685","wikidata":"https://www.wikidata.org/wiki/Q6865376","display_name":"Minimax approximation algorithm","level":2,"score":0.30300000309944153},{"id":"https://openalex.org/C126255220","wikidata":"https://www.wikidata.org/wiki/Q141495","display_name":"Mathematical optimization","level":1,"score":0.30090001225471497},{"id":"https://openalex.org/C97541855","wikidata":"https://www.wikidata.org/wiki/Q830687","display_name":"Reinforcement learning","level":2,"score":0.29899999499320984},{"id":"https://openalex.org/C127491075","wikidata":"https://www.wikidata.org/wiki/Q7617825","display_name":"Stochastic modelling","level":2,"score":0.28850001096725464},{"id":"https://openalex.org/C61797465","wikidata":"https://www.wikidata.org/wiki/Q1188986","display_name":"Term (time)","level":2,"score":0.26440000534057617}],"mesh":[],"locations_count":1,"locations":[{"id":"doi:10.48550/arxiv.2604.00179","is_oa":true,"landing_page_url":"https://doi.org/10.48550/arxiv.2604.00179","pdf_url":null,"source":{"id":"https://openalex.org/S4306400194","display_name":"arXiv (Cornell University)","issn_l":null,"issn":null,"is_oa":true,"is_in_doaj":false,"is_core":false,"host_organization":"https://openalex.org/I205783295","host_organization_name":"Cornell University","host_organization_lineage":["https://openalex.org/I205783295"],"host_organization_lineage_names":[],"type":"repository"},"license":"cc-by","license_id":"https://openalex.org/licenses/cc-by","version":null,"is_accepted":false,"is_published":null,"raw_source_name":null,"raw_type":"article"}],"best_oa_location":{"id":"doi:10.48550/arxiv.2604.00179","is_oa":true,"landing_page_url":"https://doi.org/10.48550/arxiv.2604.00179","pdf_url":null,"source":{"id":"https://openalex.org/S4306400194","display_name":"arXiv (Cornell University)","issn_l":null,"issn":null,"is_oa":true,"is_in_doaj":false,"is_core":false,"host_organization":"https://openalex.org/I205783295","host_organization_name":"Cornell University","host_organization_lineage":["https://openalex.org/I205783295"],"host_organization_lineage_names":[],"type":"repository"},"license":"cc-by","license_id":"https://openalex.org/licenses/cc-by","version":null,"is_accepted":false,"is_published":false,"raw_source_name":null,"raw_type":"article"},"sustainable_development_goals":[],"awards":[],"funders":[],"has_content":{"grobid_xml":false,"pdf":false},"content_urls":null,"referenced_works_count":0,"referenced_works":[],"related_works":[],"abstract_inverted_index":{"We":[0,18,80],"study":[1],"the":[2,36,64,72,75],"finite-time":[3],"convergence":[4],"of":[5,66,74,88],"projected":[6],"linear":[7],"two-time-scale":[8],"stochastic":[9],"approximation":[10,32],"with":[11,48],"constant":[12],"step":[13],"sizes":[14],"and":[15,39,55,94],"Polyak--Ruppert":[16],"averaging.":[17],"establish":[19],"an":[20,31],"explicit":[21],"mean-square":[22],"error":[23,33,42],"bound,":[24],"decomposing":[25],"it":[26],"into":[27],"two":[28],"interpretable":[29],"components,":[30],"determined":[34],"by":[35],"constrained":[37],"subspace":[38,67],"a":[40,45,56,86],"statistical":[41],"decaying":[43],"at":[44],"sublinear":[46],"rate,":[47],"constants":[49,61],"expressed":[50],"through":[51,85],"restricted":[52],"stability":[53],"margins":[54],"coupling":[57],"invertibility":[58],"condition.":[59],"These":[60],"cleanly":[62],"separate":[63],"effect":[65,73],"choice":[68],"(approximation":[69],"errors)":[70],"from":[71],"averaging":[76],"horizon":[77],"(statistical":[78],"errors).":[79],"illustrate":[81],"our":[82],"theoretical":[83],"results":[84],"number":[87],"numerical":[89],"experiments":[90],"on":[91],"both":[92],"synthetic":[93],"reinforcement":[95],"learning":[96],"problems.":[97]},"counts_by_year":[],"updated_date":"2026-04-03T16:44:17.987007","created_date":"2026-04-03T00:00:00"}