{"id":"https://openalex.org/W2964045956","doi":"https://doi.org/10.1109/globalsip.2013.6737088","title":"Regularized stochastic BFGS algorithm","display_name":"Regularized stochastic BFGS algorithm","publication_year":2013,"publication_date":"2013-12-01","ids":{"openalex":"https://openalex.org/W2964045956","doi":"https://doi.org/10.1109/globalsip.2013.6737088","mag":"2964045956"},"language":"en","primary_location":{"id":"doi:10.1109/globalsip.2013.6737088","is_oa":false,"landing_page_url":"https://doi.org/10.1109/globalsip.2013.6737088","pdf_url":null,"source":null,"license":null,"license_id":null,"version":"publishedVersion","is_accepted":true,"is_published":true,"raw_source_name":"2013 IEEE Global Conference on Signal and Information Processing","raw_type":"proceedings-article"},"type":"article","indexed_in":["crossref"],"open_access":{"is_oa":false,"oa_status":"closed","oa_url":null,"any_repository_has_fulltext":false},"authorships":[{"author_position":"first","author":{"id":"https://openalex.org/A5008417632","display_name":"Aryan Mokhtari","orcid":"https://orcid.org/0000-0001-6603-0091"},"institutions":[{"id":"https://openalex.org/I79576946","display_name":"University of Pennsylvania","ror":"https://ror.org/00b30xv10","country_code":"US","type":"education","lineage":["https://openalex.org/I79576946"]}],"countries":["US"],"is_corresponding":false,"raw_author_name":"Aryan Mokhtari","raw_affiliation_strings":["Dept. of Electrical and Systems Eng, University of Pennsylvania, Philadelphia, PA"],"raw_orcid":null,"affiliations":[{"raw_affiliation_string":"Dept. of Electrical and Systems Eng, University of Pennsylvania, Philadelphia, PA","institution_ids":["https://openalex.org/I79576946"]}]},{"author_position":"last","author":{"id":"https://openalex.org/A5078862959","display_name":"Alejandro Ribeiro","orcid":"https://orcid.org/0000-0003-4230-9906"},"institutions":[{"id":"https://openalex.org/I79576946","display_name":"University of Pennsylvania","ror":"https://ror.org/00b30xv10","country_code":"US","type":"education","lineage":["https://openalex.org/I79576946"]}],"countries":["US"],"is_corresponding":false,"raw_author_name":"Alejandro Ribeiro","raw_affiliation_strings":["Dept. of Electrical and Systems Eng, University of Pennsylvania, Philadelphia, PA"],"raw_orcid":null,"affiliations":[{"raw_affiliation_string":"Dept. of Electrical and Systems Eng, University of Pennsylvania, Philadelphia, PA","institution_ids":["https://openalex.org/I79576946"]}]}],"institutions":[],"countries_distinct_count":1,"institutions_distinct_count":2,"corresponding_author_ids":[],"corresponding_institution_ids":[],"apc_list":null,"apc_paid":null,"fwci":3.953,"has_fulltext":false,"cited_by_count":20,"citation_normalized_percentile":{"value":0.94057811,"is_in_top_1_percent":false,"is_in_top_10_percent":true},"cited_by_percentile_year":{"min":89,"max":98},"biblio":{"volume":null,"issue":null,"first_page":"1109","last_page":"1112"},"is_retracted":false,"is_paratext":false,"is_xpac":false,"primary_topic":{"id":"https://openalex.org/T11612","display_name":"Stochastic Gradient Optimization Techniques","score":1.0,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},"topics":[{"id":"https://openalex.org/T11612","display_name":"Stochastic Gradient Optimization Techniques","score":1.0,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T10500","display_name":"Sparse and Compressive Sensing Techniques","score":0.9991999864578247,"subfield":{"id":"https://openalex.org/subfields/2206","display_name":"Computational Mechanics"},"field":{"id":"https://openalex.org/fields/22","display_name":"Engineering"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T10792","display_name":"Matrix Theory and Algorithms","score":0.9898999929428101,"subfield":{"id":"https://openalex.org/subfields/1703","display_name":"Computational Theory and Mathematics"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}}],"keywords":[{"id":"https://openalex.org/keywords/broyden\u2013fletcher\u2013goldfarb\u2013shanno-algorithm","display_name":"Broyden\u2013Fletcher\u2013Goldfarb\u2013Shanno algorithm","score":0.9507369995117188},{"id":"https://openalex.org/keywords/hessian-matrix","display_name":"Hessian matrix","score":0.9228869080543518},{"id":"https://openalex.org/keywords/stochastic-gradient-descent","display_name":"Stochastic gradient descent","score":0.8287414312362671},{"id":"https://openalex.org/keywords/mathematical-optimization","display_name":"Mathematical optimization","score":0.5459562540054321},{"id":"https://openalex.org/keywords/stochastic-optimization","display_name":"Stochastic optimization","score":0.5401422381401062},{"id":"https://openalex.org/keywords/gradient-descent","display_name":"Gradient descent","score":0.5287957787513733},{"id":"https://openalex.org/keywords/mathematics","display_name":"Mathematics","score":0.5255438685417175},{"id":"https://openalex.org/keywords/convergence","display_name":"Convergence (economics)","score":0.5163308382034302},{"id":"https://openalex.org/keywords/applied-mathematics","display_name":"Applied mathematics","score":0.4824522137641907},{"id":"https://openalex.org/keywords/stochastic-approximation","display_name":"Stochastic approximation","score":0.4612850546836853},{"id":"https://openalex.org/keywords/quasi-newton-method","display_name":"Quasi-Newton method","score":0.446059912443161},{"id":"https://openalex.org/keywords/computer-science","display_name":"Computer science","score":0.4261252284049988},{"id":"https://openalex.org/keywords/matrix","display_name":"Matrix (chemical analysis)","score":0.4200756251811981},{"id":"https://openalex.org/keywords/algorithm","display_name":"Algorithm","score":0.34443074464797974},{"id":"https://openalex.org/keywords/newtons-method","display_name":"Newton's method","score":0.2731025516986847},{"id":"https://openalex.org/keywords/artificial-intelligence","display_name":"Artificial intelligence","score":0.10114184021949768},{"id":"https://openalex.org/keywords/nonlinear-system","display_name":"Nonlinear system","score":0.07309496402740479},{"id":"https://openalex.org/keywords/artificial-neural-network","display_name":"Artificial neural network","score":0.06918060779571533}],"concepts":[{"id":"https://openalex.org/C132721684","wikidata":"https://www.wikidata.org/wiki/Q2877013","display_name":"Broyden\u2013Fletcher\u2013Goldfarb\u2013Shanno algorithm","level":3,"score":0.9507369995117188},{"id":"https://openalex.org/C203616005","wikidata":"https://www.wikidata.org/wiki/Q620495","display_name":"Hessian matrix","level":2,"score":0.9228869080543518},{"id":"https://openalex.org/C206688291","wikidata":"https://www.wikidata.org/wiki/Q7617819","display_name":"Stochastic gradient descent","level":3,"score":0.8287414312362671},{"id":"https://openalex.org/C126255220","wikidata":"https://www.wikidata.org/wiki/Q141495","display_name":"Mathematical optimization","level":1,"score":0.5459562540054321},{"id":"https://openalex.org/C194387892","wikidata":"https://www.wikidata.org/wiki/Q1747770","display_name":"Stochastic optimization","level":2,"score":0.5401422381401062},{"id":"https://openalex.org/C153258448","wikidata":"https://www.wikidata.org/wiki/Q1199743","display_name":"Gradient descent","level":3,"score":0.5287957787513733},{"id":"https://openalex.org/C33923547","wikidata":"https://www.wikidata.org/wiki/Q395","display_name":"Mathematics","level":0,"score":0.5255438685417175},{"id":"https://openalex.org/C2777303404","wikidata":"https://www.wikidata.org/wiki/Q759757","display_name":"Convergence (economics)","level":2,"score":0.5163308382034302},{"id":"https://openalex.org/C28826006","wikidata":"https://www.wikidata.org/wiki/Q33521","display_name":"Applied mathematics","level":1,"score":0.4824522137641907},{"id":"https://openalex.org/C55479107","wikidata":"https://www.wikidata.org/wiki/Q97663916","display_name":"Stochastic approximation","level":3,"score":0.4612850546836853},{"id":"https://openalex.org/C114954040","wikidata":"https://www.wikidata.org/wiki/Q1476018","display_name":"Quasi-Newton method","level":4,"score":0.446059912443161},{"id":"https://openalex.org/C41008148","wikidata":"https://www.wikidata.org/wiki/Q21198","display_name":"Computer science","level":0,"score":0.4261252284049988},{"id":"https://openalex.org/C106487976","wikidata":"https://www.wikidata.org/wiki/Q685816","display_name":"Matrix (chemical analysis)","level":2,"score":0.4200756251811981},{"id":"https://openalex.org/C11413529","wikidata":"https://www.wikidata.org/wiki/Q8366","display_name":"Algorithm","level":1,"score":0.34443074464797974},{"id":"https://openalex.org/C85189116","wikidata":"https://www.wikidata.org/wiki/Q374195","display_name":"Newton's method","level":3,"score":0.2731025516986847},{"id":"https://openalex.org/C154945302","wikidata":"https://www.wikidata.org/wiki/Q11660","display_name":"Artificial intelligence","level":1,"score":0.10114184021949768},{"id":"https://openalex.org/C158622935","wikidata":"https://www.wikidata.org/wiki/Q660848","display_name":"Nonlinear system","level":2,"score":0.07309496402740479},{"id":"https://openalex.org/C50644808","wikidata":"https://www.wikidata.org/wiki/Q192776","display_name":"Artificial neural network","level":2,"score":0.06918060779571533},{"id":"https://openalex.org/C50522688","wikidata":"https://www.wikidata.org/wiki/Q189833","display_name":"Economic growth","level":1,"score":0.0},{"id":"https://openalex.org/C38652104","wikidata":"https://www.wikidata.org/wiki/Q3510521","display_name":"Computer security","level":1,"score":0.0},{"id":"https://openalex.org/C151319957","wikidata":"https://www.wikidata.org/wiki/Q752739","display_name":"Asynchronous communication","level":2,"score":0.0},{"id":"https://openalex.org/C31258907","wikidata":"https://www.wikidata.org/wiki/Q1301371","display_name":"Computer network","level":1,"score":0.0},{"id":"https://openalex.org/C192562407","wikidata":"https://www.wikidata.org/wiki/Q228736","display_name":"Materials science","level":0,"score":0.0},{"id":"https://openalex.org/C159985019","wikidata":"https://www.wikidata.org/wiki/Q181790","display_name":"Composite material","level":1,"score":0.0},{"id":"https://openalex.org/C26517878","wikidata":"https://www.wikidata.org/wiki/Q228039","display_name":"Key (lock)","level":2,"score":0.0},{"id":"https://openalex.org/C162324750","wikidata":"https://www.wikidata.org/wiki/Q8134","display_name":"Economics","level":0,"score":0.0},{"id":"https://openalex.org/C121332964","wikidata":"https://www.wikidata.org/wiki/Q413","display_name":"Physics","level":0,"score":0.0},{"id":"https://openalex.org/C62520636","wikidata":"https://www.wikidata.org/wiki/Q944","display_name":"Quantum mechanics","level":1,"score":0.0}],"mesh":[],"locations_count":1,"locations":[{"id":"doi:10.1109/globalsip.2013.6737088","is_oa":false,"landing_page_url":"https://doi.org/10.1109/globalsip.2013.6737088","pdf_url":null,"source":null,"license":null,"license_id":null,"version":"publishedVersion","is_accepted":true,"is_published":true,"raw_source_name":"2013 IEEE Global Conference on Signal and Information Processing","raw_type":"proceedings-article"}],"best_oa_location":null,"sustainable_development_goals":[],"awards":[],"funders":[],"has_content":{"grobid_xml":false,"pdf":false},"content_urls":null,"referenced_works_count":30,"referenced_works":["https://openalex.org/W114517082","https://openalex.org/W1491622225","https://openalex.org/W1523661875","https://openalex.org/W1992208280","https://openalex.org/W2009321323","https://openalex.org/W2020909452","https://openalex.org/W2030811966","https://openalex.org/W2042173174","https://openalex.org/W2045968916","https://openalex.org/W2045986262","https://openalex.org/W2060471940","https://openalex.org/W2077658674","https://openalex.org/W2084236346","https://openalex.org/W2086161653","https://openalex.org/W2087347434","https://openalex.org/W2091825929","https://openalex.org/W2098741260","https://openalex.org/W2101159990","https://openalex.org/W2112820497","https://openalex.org/W2116222104","https://openalex.org/W2120350480","https://openalex.org/W2125993116","https://openalex.org/W2137515395","https://openalex.org/W2142623206","https://openalex.org/W2156909104","https://openalex.org/W2951299667","https://openalex.org/W2964045956","https://openalex.org/W4230674625","https://openalex.org/W4293775970","https://openalex.org/W6629379589"],"related_works":["https://openalex.org/W3012383564","https://openalex.org/W4286899070","https://openalex.org/W4323366756","https://openalex.org/W3207830353","https://openalex.org/W4285259204","https://openalex.org/W3109737792","https://openalex.org/W3109198354","https://openalex.org/W937081240","https://openalex.org/W2760303966","https://openalex.org/W4401866412"],"abstract_inverted_index":{"A":[0],"regularized":[1,90],"stochastic":[2,18,71,91,107,119,125],"version":[3],"of":[4,39,105,127],"the":[5,31,37,81,106],"Broyden-Fletcher-":[6],"Goldfarb-Shanno":[7],"(BFGS)":[8],"quasi-Newton":[9],"method":[10,93],"is":[11,30,94],"proposed":[12],"to":[13,42,78,96,98,118],"solve":[14],"optimization":[15],"problems":[16],"with":[17],"objectives":[19],"that":[20,80],"arise":[21],"in":[22,49,114],"large":[23],"scale":[24],"machine":[25],"learning.":[26],"Stochastic":[27],"gradient":[28,55,66,72,108,120],"descent":[29,56,121],"currently":[32],"preferred":[33],"solution":[34],"methodology":[35],"but":[36],"number":[38],"iterations":[40],"required":[41],"approximate":[43],"optimal":[44,99],"arguments":[45,100],"can":[46],"be":[47],"prohibitive":[48],"high":[50],"dimensional":[51],"problems.":[52],"BFGS":[53,92],"modifies":[54],"by":[57],"introducing":[58],"a":[59,76],"Hessian":[60,82],"approximation":[61,83],"matrix":[62,84],"computed":[63],"from":[64],"finite":[65],"differences.":[67],"This":[68],"paper":[69],"utilizes":[70],"differences":[73],"and":[74,123],"introduces":[75],"regularization":[77],"ensure":[79],"remains":[85],"well":[86],"conditioned.":[87],"The":[88],"resulting":[89],"shown":[95],"converge":[97],"almost":[101],"surely":[102],"over":[103],"realizations":[104],"sequence.":[109],"Numerical":[110],"experiments":[111],"showcase":[112],"reductions":[113],"convergence":[115],"time":[116],"relative":[117],"algorithms":[122],"non-regularized":[124],"versions":[126],"BFGS.":[128]},"counts_by_year":[{"year":2025,"cited_by_count":2},{"year":2022,"cited_by_count":1},{"year":2021,"cited_by_count":2},{"year":2020,"cited_by_count":1},{"year":2019,"cited_by_count":1},{"year":2018,"cited_by_count":1},{"year":2017,"cited_by_count":4},{"year":2016,"cited_by_count":3},{"year":2015,"cited_by_count":2},{"year":2014,"cited_by_count":2},{"year":2013,"cited_by_count":1}],"updated_date":"2026-06-11T09:08:48.828518","created_date":"2025-10-10T00:00:00"}