{"id":"https://openalex.org/W7162008884","doi":"https://doi.org/10.48550/arxiv.2605.21451","title":"Approximation Theory for Neural Networks: Old and New","display_name":"Approximation Theory for Neural Networks: Old and New","publication_year":2026,"publication_date":"2026-05-20","ids":{"openalex":"https://openalex.org/W7162008884","doi":"https://doi.org/10.48550/arxiv.2605.21451"},"language":null,"primary_location":{"id":"doi:10.48550/arxiv.2605.21451","is_oa":true,"landing_page_url":"https://doi.org/10.48550/arxiv.2605.21451","pdf_url":null,"source":{"id":"https://openalex.org/S4306400194","display_name":"arXiv (Cornell University)","issn_l":null,"issn":null,"is_oa":true,"is_in_doaj":false,"is_core":false,"host_organization":"https://openalex.org/I205783295","host_organization_name":"Cornell University","host_organization_lineage":["https://openalex.org/I205783295"],"host_organization_lineage_names":[],"type":"repository"},"license":null,"license_id":null,"version":null,"is_accepted":false,"is_published":false,"raw_source_name":null,"raw_type":"Preprint"},"type":"preprint","indexed_in":["datacite"],"open_access":{"is_oa":true,"oa_status":"green","oa_url":"https://doi.org/10.48550/arxiv.2605.21451","any_repository_has_fulltext":true},"authorships":[{"author_position":"first","author":{"id":"https://openalex.org/A5085153518","display_name":"Soumendu Sundar Mukherjee","orcid":"https://orcid.org/0000-0002-6716-9586"},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Mukherjee, Soumendu Sundar","raw_affiliation_strings":[],"raw_orcid":null,"affiliations":[]},{"author_position":"last","author":{"id":"https://openalex.org/A5136661898","display_name":"Himasish Talukdar","orcid":null},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Talukdar, Himasish","raw_affiliation_strings":[],"raw_orcid":null,"affiliations":[]}],"institutions":[],"countries_distinct_count":0,"institutions_distinct_count":0,"corresponding_author_ids":[],"corresponding_institution_ids":[],"apc_list":null,"apc_paid":null,"fwci":null,"has_fulltext":false,"cited_by_count":0,"citation_normalized_percentile":null,"cited_by_percentile_year":null,"biblio":{"volume":null,"issue":null,"first_page":null,"last_page":null},"is_retracted":false,"is_paratext":false,"is_xpac":false,"primary_topic":{"id":"https://openalex.org/T11612","display_name":"Stochastic Gradient Optimization Techniques","score":0.43790000677108765,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},"topics":[{"id":"https://openalex.org/T11612","display_name":"Stochastic Gradient Optimization Techniques","score":0.43790000677108765,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T10320","display_name":"Neural Networks and Applications","score":0.12439999729394913,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T11206","display_name":"Model Reduction and Neural Networks","score":0.09109999984502792,"subfield":{"id":"https://openalex.org/subfields/3109","display_name":"Statistical and Nonlinear Physics"},"field":{"id":"https://openalex.org/fields/31","display_name":"Physics and Astronomy"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}}],"keywords":[{"id":"https://openalex.org/keywords/function-approximation","display_name":"Function approximation","score":0.6385999917984009},{"id":"https://openalex.org/keywords/artificial-neural-network","display_name":"Artificial neural network","score":0.5776000022888184},{"id":"https://openalex.org/keywords/feedforward-neural-network","display_name":"Feedforward neural network","score":0.560699999332428},{"id":"https://openalex.org/keywords/smoothness","display_name":"Smoothness","score":0.5403000116348267},{"id":"https://openalex.org/keywords/approximation-theory","display_name":"Approximation theory","score":0.5056999921798706},{"id":"https://openalex.org/keywords/universality","display_name":"Universality (dynamical systems)","score":0.4814000129699707},{"id":"https://openalex.org/keywords/feed-forward","display_name":"Feed forward","score":0.42160001397132874},{"id":"https://openalex.org/keywords/sobolev-space","display_name":"Sobolev space","score":0.41609999537467957}],"concepts":[{"id":"https://openalex.org/C91873725","wikidata":"https://www.wikidata.org/wiki/Q3445816","display_name":"Function approximation","level":3,"score":0.6385999917984009},{"id":"https://openalex.org/C50644808","wikidata":"https://www.wikidata.org/wiki/Q192776","display_name":"Artificial neural network","level":2,"score":0.5776000022888184},{"id":"https://openalex.org/C47702885","wikidata":"https://www.wikidata.org/wiki/Q5441227","display_name":"Feedforward neural network","level":3,"score":0.560699999332428},{"id":"https://openalex.org/C102634674","wikidata":"https://www.wikidata.org/wiki/Q868473","display_name":"Smoothness","level":2,"score":0.5403000116348267},{"id":"https://openalex.org/C145242015","wikidata":"https://www.wikidata.org/wiki/Q774123","display_name":"Approximation theory","level":2,"score":0.5056999921798706},{"id":"https://openalex.org/C183992945","wikidata":"https://www.wikidata.org/wiki/Q2495574","display_name":"Universality (dynamical systems)","level":2,"score":0.4814000129699707},{"id":"https://openalex.org/C41008148","wikidata":"https://www.wikidata.org/wiki/Q21198","display_name":"Computer science","level":0,"score":0.44999998807907104},{"id":"https://openalex.org/C38858127","wikidata":"https://www.wikidata.org/wiki/Q5441228","display_name":"Feed forward","level":2,"score":0.42160001397132874},{"id":"https://openalex.org/C99730327","wikidata":"https://www.wikidata.org/wiki/Q1501536","display_name":"Sobolev space","level":2,"score":0.41609999537467957},{"id":"https://openalex.org/C122383733","wikidata":"https://www.wikidata.org/wiki/Q865920","display_name":"Approximation error","level":2,"score":0.413100004196167},{"id":"https://openalex.org/C33923547","wikidata":"https://www.wikidata.org/wiki/Q395","display_name":"Mathematics","level":0,"score":0.4115000069141388},{"id":"https://openalex.org/C14036430","wikidata":"https://www.wikidata.org/wiki/Q3736076","display_name":"Function (biology)","level":2,"score":0.4068000018596649},{"id":"https://openalex.org/C28826006","wikidata":"https://www.wikidata.org/wiki/Q33521","display_name":"Applied mathematics","level":1,"score":0.34869998693466187},{"id":"https://openalex.org/C154945302","wikidata":"https://www.wikidata.org/wiki/Q11660","display_name":"Artificial intelligence","level":1,"score":0.32330000400543213},{"id":"https://openalex.org/C108583219","wikidata":"https://www.wikidata.org/wiki/Q197536","display_name":"Deep learning","level":2,"score":0.3197999894618988},{"id":"https://openalex.org/C177454536","wikidata":"https://www.wikidata.org/wiki/Q578290","display_name":"Emphasis (telecommunications)","level":2,"score":0.3093999922275543},{"id":"https://openalex.org/C148764684","wikidata":"https://www.wikidata.org/wiki/Q621751","display_name":"Approximation algorithm","level":2,"score":0.3068999946117401},{"id":"https://openalex.org/C80444323","wikidata":"https://www.wikidata.org/wiki/Q2878974","display_name":"Theoretical computer science","level":1,"score":0.29809999465942383},{"id":"https://openalex.org/C163258240","wikidata":"https://www.wikidata.org/wiki/Q25342","display_name":"Power (physics)","level":2,"score":0.27889999747276306},{"id":"https://openalex.org/C11413529","wikidata":"https://www.wikidata.org/wiki/Q8366","display_name":"Algorithm","level":1,"score":0.27790001034736633},{"id":"https://openalex.org/C2984842247","wikidata":"https://www.wikidata.org/wiki/Q197536","display_name":"Deep neural networks","level":3,"score":0.2736000120639801},{"id":"https://openalex.org/C197055811","wikidata":"https://www.wikidata.org/wiki/Q207522","display_name":"Probability density function","level":2,"score":0.2662000060081482},{"id":"https://openalex.org/C2777212361","wikidata":"https://www.wikidata.org/wiki/Q5127848","display_name":"Class (philosophy)","level":2,"score":0.26260000467300415},{"id":"https://openalex.org/C195818886","wikidata":"https://www.wikidata.org/wiki/Q5421724","display_name":"Expressive power","level":2,"score":0.2621999979019165}],"mesh":[],"locations_count":1,"locations":[{"id":"doi:10.48550/arxiv.2605.21451","is_oa":true,"landing_page_url":"https://doi.org/10.48550/arxiv.2605.21451","pdf_url":null,"source":{"id":"https://openalex.org/S4306400194","display_name":"arXiv (Cornell University)","issn_l":null,"issn":null,"is_oa":true,"is_in_doaj":false,"is_core":false,"host_organization":"https://openalex.org/I205783295","host_organization_name":"Cornell University","host_organization_lineage":["https://openalex.org/I205783295"],"host_organization_lineage_names":[],"type":"repository"},"license":null,"license_id":null,"version":null,"is_accepted":false,"is_published":null,"raw_source_name":null,"raw_type":"Preprint"}],"best_oa_location":{"id":"doi:10.48550/arxiv.2605.21451","is_oa":true,"landing_page_url":"https://doi.org/10.48550/arxiv.2605.21451","pdf_url":null,"source":{"id":"https://openalex.org/S4306400194","display_name":"arXiv (Cornell University)","issn_l":null,"issn":null,"is_oa":true,"is_in_doaj":false,"is_core":false,"host_organization":"https://openalex.org/I205783295","host_organization_name":"Cornell University","host_organization_lineage":["https://openalex.org/I205783295"],"host_organization_lineage_names":[],"type":"repository"},"license":null,"license_id":null,"version":null,"is_accepted":false,"is_published":false,"raw_source_name":null,"raw_type":"Preprint"},"sustainable_development_goals":[],"awards":[],"funders":[],"has_content":{"grobid_xml":false,"pdf":false},"content_urls":null,"referenced_works_count":0,"referenced_works":[],"related_works":[],"abstract_inverted_index":{"Universal":[0],"approximation":[1,64,102],"theorems":[2],"provide":[3],"a":[4,59],"mathematical":[5],"explanation":[6],"for":[7,92,132],"the":[8,21,48,69],"expressive":[9],"power":[10],"of":[11,40,71],"neural":[12,25,141],"networks.":[13],"They":[14],"assert":[15],"that,":[16],"under":[17],"mild":[18],"conditions":[19],"on":[20,37,110,117,121,148],"activation":[22],"function,":[23],"feedforward":[24,140],"networks":[26],"are":[27],"dense":[28],"in":[29],"broad":[30],"function":[31,134],"classes,":[32],"such":[33,74],"as":[34,75,95,97],"continuous":[35],"functions":[36],"compact":[38],"subsets":[39],"$\\mathbb{R}^d$,":[41],"$L^p$":[42],"spaces,":[43],"or":[44],"Sobolev":[45],"spaces.":[46],"Over":[47],"past":[49],"four":[50],"decades,":[51],"these":[52],"qualitative":[53],"universality":[54],"results":[55,91,122],"have":[56,162],"evolved":[57],"into":[58,84],"rich":[60],"quantitative":[61,98],"theory":[62],"addressing":[63],"rates,":[65],"parameter":[66,130],"efficiency,":[67],"and":[68,77,107,120,158],"role":[70],"architectural":[72,156],"features":[73],"depth":[76],"width.":[78],"This":[79],"survey":[80],"presents":[81],"several":[82],"glimpses":[83],"this":[85],"theory.":[86],"We":[87],"review":[88,145],"classical":[89],"density":[90],"single-hidden-layer":[93],"networks,":[94,142],"well":[96],"bounds":[99],"that":[100,124],"relate":[101],"error":[103],"to":[104,138,164],"network":[105],"size":[106],"smoothness":[108],"assumptions":[109],"target":[111],"functions.":[112],"Particular":[113],"emphasis":[114],"is":[115],"placed":[116],"depth--width":[118],"trade-offs":[119],"demonstrating":[123],"deeper":[125],"architectures":[126],"can":[127],"achieve":[128],"superior":[129],"efficiency":[131],"structured":[133],"classes.":[135],"In":[136],"addition":[137],"standard":[139],"we":[143],"also":[144],"recent":[146],"developments":[147],"Kolmogorov--Arnold":[149],"Networks":[150],"(KANs),":[151],"which":[152],"offer":[153],"an":[154],"alternative":[155],"paradigm":[157],"whose":[159],"approximation-theoretic":[160],"properties":[161],"begun":[163],"attract":[165],"significant":[166],"theoretical":[167],"attention.":[168]},"counts_by_year":[],"updated_date":"2026-07-01T06:00:48.157686","created_date":"2026-05-22T00:00:00"}