{"id":"https://openalex.org/W7131402988","doi":"https://doi.org/10.48550/arxiv.2602.19845","title":"I Dropped a Neural Net","display_name":"I Dropped a Neural Net","publication_year":2026,"publication_date":"2026-02-23","ids":{"openalex":"https://openalex.org/W7131402988","doi":"https://doi.org/10.48550/arxiv.2602.19845"},"language":null,"primary_location":{"id":"doi:10.48550/arxiv.2602.19845","is_oa":true,"landing_page_url":"https://doi.org/10.48550/arxiv.2602.19845","pdf_url":null,"source":{"id":"https://openalex.org/S4306400194","display_name":"arXiv (Cornell University)","issn_l":null,"issn":null,"is_oa":true,"is_in_doaj":false,"is_core":false,"host_organization":"https://openalex.org/I205783295","host_organization_name":"Cornell University","host_organization_lineage":["https://openalex.org/I205783295"],"host_organization_lineage_names":[],"type":"repository"},"license":null,"license_id":null,"version":null,"is_accepted":false,"is_published":false,"raw_source_name":null,"raw_type":"article"},"type":"preprint","indexed_in":["datacite"],"open_access":{"is_oa":true,"oa_status":"green","oa_url":"https://doi.org/10.48550/arxiv.2602.19845","any_repository_has_fulltext":true},"authorships":[{"author_position":"first","author":{"id":"https://openalex.org/A5126659697","display_name":"Hyunwoo Park","orcid":null},"institutions":[],"countries":[],"is_corresponding":true,"raw_author_name":"Park, Hyunwoo","raw_affiliation_strings":[],"affiliations":[]}],"institutions":[],"countries_distinct_count":0,"institutions_distinct_count":1,"corresponding_author_ids":["https://openalex.org/A5126659697"],"corresponding_institution_ids":[],"apc_list":null,"apc_paid":null,"fwci":null,"has_fulltext":false,"cited_by_count":0,"citation_normalized_percentile":null,"cited_by_percentile_year":null,"biblio":{"volume":null,"issue":null,"first_page":null,"last_page":null},"is_retracted":false,"is_paratext":false,"is_xpac":false,"primary_topic":{"id":"https://openalex.org/T11612","display_name":"Stochastic Gradient Optimization Techniques","score":0.28369998931884766,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},"topics":[{"id":"https://openalex.org/T11612","display_name":"Stochastic Gradient Optimization Techniques","score":0.28369998931884766,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T10320","display_name":"Neural Networks and Applications","score":0.24469999969005585,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T11206","display_name":"Model Reduction and Neural Networks","score":0.05950000137090683,"subfield":{"id":"https://openalex.org/subfields/3109","display_name":"Statistical and Nonlinear Physics"},"field":{"id":"https://openalex.org/fields/31","display_name":"Physics and Astronomy"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}}],"keywords":[{"id":"https://openalex.org/keywords/diagonal","display_name":"Diagonal","score":0.5454000234603882},{"id":"https://openalex.org/keywords/artificial-neural-network","display_name":"Artificial neural network","score":0.5414000153541565},{"id":"https://openalex.org/keywords/residual","display_name":"Residual","score":0.5270000100135803},{"id":"https://openalex.org/keywords/dominance","display_name":"Dominance (genetics)","score":0.4316999912261963},{"id":"https://openalex.org/keywords/training-set","display_name":"Training set","score":0.39730000495910645},{"id":"https://openalex.org/keywords/pairing","display_name":"Pairing","score":0.38370001316070557},{"id":"https://openalex.org/keywords/stability","display_name":"Stability (learning theory)","score":0.349700003862381},{"id":"https://openalex.org/keywords/observable","display_name":"Observable","score":0.32899999618530273}],"concepts":[{"id":"https://openalex.org/C33923547","wikidata":"https://www.wikidata.org/wiki/Q395","display_name":"Mathematics","level":0,"score":0.5855000019073486},{"id":"https://openalex.org/C130367717","wikidata":"https://www.wikidata.org/wiki/Q189791","display_name":"Diagonal","level":2,"score":0.5454000234603882},{"id":"https://openalex.org/C50644808","wikidata":"https://www.wikidata.org/wiki/Q192776","display_name":"Artificial neural network","level":2,"score":0.5414000153541565},{"id":"https://openalex.org/C155512373","wikidata":"https://www.wikidata.org/wiki/Q287450","display_name":"Residual","level":2,"score":0.5270000100135803},{"id":"https://openalex.org/C151913843","wikidata":"https://www.wikidata.org/wiki/Q3454555","display_name":"Dominance (genetics)","level":3,"score":0.4316999912261963},{"id":"https://openalex.org/C11413529","wikidata":"https://www.wikidata.org/wiki/Q8366","display_name":"Algorithm","level":1,"score":0.42750000953674316},{"id":"https://openalex.org/C51632099","wikidata":"https://www.wikidata.org/wiki/Q3985153","display_name":"Training set","level":2,"score":0.39730000495910645},{"id":"https://openalex.org/C114614502","wikidata":"https://www.wikidata.org/wiki/Q76592","display_name":"Combinatorics","level":1,"score":0.3912000060081482},{"id":"https://openalex.org/C14103023","wikidata":"https://www.wikidata.org/wiki/Q11681459","display_name":"Pairing","level":3,"score":0.38370001316070557},{"id":"https://openalex.org/C154945302","wikidata":"https://www.wikidata.org/wiki/Q11660","display_name":"Artificial intelligence","level":1,"score":0.37860000133514404},{"id":"https://openalex.org/C41008148","wikidata":"https://www.wikidata.org/wiki/Q21198","display_name":"Computer science","level":0,"score":0.376800000667572},{"id":"https://openalex.org/C112972136","wikidata":"https://www.wikidata.org/wiki/Q7595718","display_name":"Stability (learning theory)","level":2,"score":0.349700003862381},{"id":"https://openalex.org/C105795698","wikidata":"https://www.wikidata.org/wiki/Q12483","display_name":"Statistics","level":1,"score":0.335999995470047},{"id":"https://openalex.org/C32848918","wikidata":"https://www.wikidata.org/wiki/Q845789","display_name":"Observable","level":2,"score":0.32899999618530273},{"id":"https://openalex.org/C90673727","wikidata":"https://www.wikidata.org/wiki/Q901718","display_name":"Product (mathematics)","level":2,"score":0.32330000400543213},{"id":"https://openalex.org/C139945424","wikidata":"https://www.wikidata.org/wiki/Q1940696","display_name":"Mean squared error","level":2,"score":0.32190001010894775},{"id":"https://openalex.org/C2778112365","wikidata":"https://www.wikidata.org/wiki/Q3511065","display_name":"Sequence (biology)","level":2,"score":0.3025999963283539},{"id":"https://openalex.org/C153180895","wikidata":"https://www.wikidata.org/wiki/Q7148389","display_name":"Pattern recognition (psychology)","level":2,"score":0.2980000078678131},{"id":"https://openalex.org/C2780813799","wikidata":"https://www.wikidata.org/wiki/Q3274237","display_name":"Zero (linguistics)","level":2,"score":0.2978000044822693},{"id":"https://openalex.org/C118615104","wikidata":"https://www.wikidata.org/wiki/Q121416","display_name":"Discrete mathematics","level":1,"score":0.29330000281333923},{"id":"https://openalex.org/C28826006","wikidata":"https://www.wikidata.org/wiki/Q33521","display_name":"Applied mathematics","level":1,"score":0.28870001435279846},{"id":"https://openalex.org/C14166107","wikidata":"https://www.wikidata.org/wiki/Q253829","display_name":"Net (polyhedron)","level":2,"score":0.2818000018596649},{"id":"https://openalex.org/C2778572836","wikidata":"https://www.wikidata.org/wiki/Q380933","display_name":"Space (punctuation)","level":2,"score":0.2759000062942505},{"id":"https://openalex.org/C2780148112","wikidata":"https://www.wikidata.org/wiki/Q1432581","display_name":"Proxy (statistics)","level":2,"score":0.26420000195503235},{"id":"https://openalex.org/C2988709989","wikidata":"https://www.wikidata.org/wiki/Q85784623","display_name":"Mean square","level":2,"score":0.25589999556541443},{"id":"https://openalex.org/C2777211547","wikidata":"https://www.wikidata.org/wiki/Q17141490","display_name":"Training (meteorology)","level":2,"score":0.25220000743865967}],"mesh":[],"locations_count":1,"locations":[{"id":"doi:10.48550/arxiv.2602.19845","is_oa":true,"landing_page_url":"https://doi.org/10.48550/arxiv.2602.19845","pdf_url":null,"source":{"id":"https://openalex.org/S4306400194","display_name":"arXiv (Cornell University)","issn_l":null,"issn":null,"is_oa":true,"is_in_doaj":false,"is_core":false,"host_organization":"https://openalex.org/I205783295","host_organization_name":"Cornell University","host_organization_lineage":["https://openalex.org/I205783295"],"host_organization_lineage_names":[],"type":"repository"},"license":null,"license_id":null,"version":null,"is_accepted":false,"is_published":null,"raw_source_name":null,"raw_type":"article"}],"best_oa_location":{"id":"doi:10.48550/arxiv.2602.19845","is_oa":true,"landing_page_url":"https://doi.org/10.48550/arxiv.2602.19845","pdf_url":null,"source":{"id":"https://openalex.org/S4306400194","display_name":"arXiv (Cornell University)","issn_l":null,"issn":null,"is_oa":true,"is_in_doaj":false,"is_core":false,"host_organization":"https://openalex.org/I205783295","host_organization_name":"Cornell University","host_organization_lineage":["https://openalex.org/I205783295"],"host_organization_lineage_names":[],"type":"repository"},"license":null,"license_id":null,"version":null,"is_accepted":false,"is_published":false,"raw_source_name":null,"raw_type":"article"},"sustainable_development_goals":[],"awards":[],"funders":[],"has_content":{"grobid_xml":false,"pdf":false},"content_urls":null,"referenced_works_count":0,"referenced_works":[],"related_works":[],"abstract_inverted_index":{"A":[0],"recent":[1],"Dwarkesh":[2],"Patel":[3],"podcast":[4],"with":[5,112,133],"John":[6],"Collison":[7],"and":[8,27,42,62,67],"Elon":[9],"Musk":[10],"featured":[11],"an":[12],"interesting":[13],"puzzle":[14],"from":[15],"Jane":[16],"Street:":[17],"they":[18],"trained":[19],"a":[20,39,75,113,125,134],"neural":[21],"net,":[22],"shuffled":[23],"all":[24],"96":[25],"layers,":[26],"asked":[28],"to":[29,119,144],"put":[30],"them":[31],"back":[32],"in":[33,89],"order.":[34],"Given":[35],"unlabelled":[36],"layers":[37,111],"of":[38,51,79],"Residual":[40],"Network":[41],"its":[43],"training":[44,99],"dataset,":[45],"we":[46,131],"recover":[47],"the":[48,52,69,87,90,104],"exact":[49],"ordering":[50,68],"layers.":[53],"The":[54],"problem":[55],"decomposes":[56],"into":[57],"pairing":[58],"each":[59],"block's":[60],"input":[61],"output":[63],"projections":[64],"($48!$":[65,72],"possibilities)":[66],"reassembled":[70],"blocks":[71],"possibilities),":[73],"for":[74,108,127],"combined":[76],"search":[77],"space":[78],"$(48!)^2":[80],"\\approx":[81],"10^{122}$,":[82],"which":[83],"is":[84],"more":[85],"than":[86],"atoms":[88],"observable":[91],"universe.":[92],"We":[93],"show":[94],"that":[95],"stability":[96],"conditions":[97],"during":[98],"like":[100],"dynamic":[101],"isometry":[102],"leave":[103],"product":[105],"$W_{\\text{out}}":[106],"W_{\\text{in}}$":[107],"correctly":[109],"paired":[110],"negative":[114],"diagonal":[115,121],"structure,":[116],"allowing":[117],"us":[118],"use":[120],"dominance":[122],"ratio":[123],"as":[124,138],"signal":[126],"pairing.":[128],"For":[129],"ordering,":[130],"seed-initialize":[132],"rough":[135],"proxy":[136],"such":[137],"delta-norm":[139],"or":[140],"$\\|W_{\\text{out}}\\|_F$":[141],"then":[142],"hill-climb":[143],"zero":[145],"mean":[146],"squared":[147],"error.":[148]},"counts_by_year":[],"updated_date":"2026-02-26T06:34:08.959763","created_date":"2026-02-26T00:00:00"}