{"id":"https://openalex.org/W7103144817","doi":"https://doi.org/10.48550/arxiv.2510.26722","title":"Non-Convex Over-the-Air Heterogeneous Federated Learning: A Bias-Variance Trade-off","display_name":"Non-Convex Over-the-Air Heterogeneous Federated Learning: A Bias-Variance Trade-off","publication_year":2025,"publication_date":"2025-10-30","ids":{"openalex":"https://openalex.org/W7103144817","doi":"https://doi.org/10.48550/arxiv.2510.26722"},"language":null,"primary_location":{"id":"pmh:doi:10.48550/arxiv.2510.26722","is_oa":true,"landing_page_url":null,"pdf_url":null,"source":{"id":"https://openalex.org/S4406922384","display_name":"Open MIND","issn_l":null,"issn":null,"is_oa":false,"is_in_doaj":false,"is_core":false,"host_organization":null,"host_organization_name":null,"host_organization_lineage":[],"host_organization_lineage_names":[],"type":"repository"},"license":"cc-by","license_id":"https://openalex.org/licenses/cc-by","version":"submittedVersion","is_accepted":false,"is_published":false,"raw_source_name":null,"raw_type":"Article"},"type":"preprint","indexed_in":["datacite"],"open_access":{"is_oa":true,"oa_status":"green","oa_url":null,"any_repository_has_fulltext":true},"authorships":[{"author_position":"first","author":{"id":null,"display_name":"Abrar, Muhammad Faraz Ul","orcid":null},"institutions":[],"countries":[],"is_corresponding":true,"raw_author_name":"Abrar, Muhammad Faraz Ul","raw_affiliation_strings":[],"affiliations":[]},{"author_position":"last","author":{"id":null,"display_name":"Michelusi, Nicol\u00f2","orcid":null},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Michelusi, Nicol\u00f2","raw_affiliation_strings":[],"affiliations":[]}],"institutions":[],"countries_distinct_count":0,"institutions_distinct_count":2,"corresponding_author_ids":[],"corresponding_institution_ids":[],"apc_list":null,"apc_paid":null,"fwci":null,"has_fulltext":false,"cited_by_count":0,"citation_normalized_percentile":null,"cited_by_percentile_year":null,"biblio":{"volume":null,"issue":null,"first_page":null,"last_page":null},"is_retracted":false,"is_paratext":false,"is_xpac":true,"primary_topic":{"id":"https://openalex.org/T10764","display_name":"Privacy-Preserving Technologies in Data","score":0.9359999895095825,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},"topics":[{"id":"https://openalex.org/T10764","display_name":"Privacy-Preserving Technologies in Data","score":0.9359999895095825,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T10326","display_name":"Indoor and Outdoor Localization Technologies","score":0.0071000000461936,"subfield":{"id":"https://openalex.org/subfields/2208","display_name":"Electrical and Electronic Engineering"},"field":{"id":"https://openalex.org/fields/22","display_name":"Engineering"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T10500","display_name":"Sparse and Compressive Sensing Techniques","score":0.0031999999191612005,"subfield":{"id":"https://openalex.org/subfields/2206","display_name":"Computational Mechanics"},"field":{"id":"https://openalex.org/fields/22","display_name":"Engineering"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}}],"keywords":[{"id":"https://openalex.org/keywords/scalability","display_name":"Scalability","score":0.5587000250816345},{"id":"https://openalex.org/keywords/stochastic-gradient-descent","display_name":"Stochastic gradient descent","score":0.5537999868392944},{"id":"https://openalex.org/keywords/wireless","display_name":"Wireless","score":0.525600016117096},{"id":"https://openalex.org/keywords/forcing","display_name":"Forcing (mathematics)","score":0.5015000104904175},{"id":"https://openalex.org/keywords/generalization","display_name":"Generalization","score":0.47690001130104065},{"id":"https://openalex.org/keywords/convergence","display_name":"Convergence (economics)","score":0.4763000011444092},{"id":"https://openalex.org/keywords/channel","display_name":"Channel (broadcasting)","score":0.45980000495910645},{"id":"https://openalex.org/keywords/variance","display_name":"Variance (accounting)","score":0.4350999891757965},{"id":"https://openalex.org/keywords/task","display_name":"Task (project management)","score":0.40720000863075256},{"id":"https://openalex.org/keywords/gradient-descent","display_name":"Gradient descent","score":0.39969998598098755}],"concepts":[{"id":"https://openalex.org/C41008148","wikidata":"https://www.wikidata.org/wiki/Q21198","display_name":"Computer science","level":0,"score":0.7597000002861023},{"id":"https://openalex.org/C48044578","wikidata":"https://www.wikidata.org/wiki/Q727490","display_name":"Scalability","level":2,"score":0.5587000250816345},{"id":"https://openalex.org/C206688291","wikidata":"https://www.wikidata.org/wiki/Q7617819","display_name":"Stochastic gradient descent","level":3,"score":0.5537999868392944},{"id":"https://openalex.org/C555944384","wikidata":"https://www.wikidata.org/wiki/Q249","display_name":"Wireless","level":2,"score":0.525600016117096},{"id":"https://openalex.org/C197115733","wikidata":"https://www.wikidata.org/wiki/Q1003136","display_name":"Forcing (mathematics)","level":2,"score":0.5015000104904175},{"id":"https://openalex.org/C177148314","wikidata":"https://www.wikidata.org/wiki/Q170084","display_name":"Generalization","level":2,"score":0.47690001130104065},{"id":"https://openalex.org/C2777303404","wikidata":"https://www.wikidata.org/wiki/Q759757","display_name":"Convergence (economics)","level":2,"score":0.4763000011444092},{"id":"https://openalex.org/C127162648","wikidata":"https://www.wikidata.org/wiki/Q16858953","display_name":"Channel (broadcasting)","level":2,"score":0.45980000495910645},{"id":"https://openalex.org/C196083921","wikidata":"https://www.wikidata.org/wiki/Q7915758","display_name":"Variance (accounting)","level":2,"score":0.4350999891757965},{"id":"https://openalex.org/C2780451532","wikidata":"https://www.wikidata.org/wiki/Q759676","display_name":"Task (project management)","level":2,"score":0.40720000863075256},{"id":"https://openalex.org/C153258448","wikidata":"https://www.wikidata.org/wiki/Q1199743","display_name":"Gradient descent","level":3,"score":0.39969998598098755},{"id":"https://openalex.org/C112972136","wikidata":"https://www.wikidata.org/wiki/Q7595718","display_name":"Stability (learning theory)","level":2,"score":0.3968999981880188},{"id":"https://openalex.org/C77553402","wikidata":"https://www.wikidata.org/wiki/Q13222579","display_name":"Upper and lower bounds","level":2,"score":0.39160001277923584},{"id":"https://openalex.org/C4679612","wikidata":"https://www.wikidata.org/wiki/Q866298","display_name":"Aggregate (composite)","level":2,"score":0.37279999256134033},{"id":"https://openalex.org/C11413529","wikidata":"https://www.wikidata.org/wiki/Q8366","display_name":"Algorithm","level":1,"score":0.36469998955726624},{"id":"https://openalex.org/C2777735758","wikidata":"https://www.wikidata.org/wiki/Q817765","display_name":"Path (computing)","level":2,"score":0.3626999855041504},{"id":"https://openalex.org/C27753989","wikidata":"https://www.wikidata.org/wiki/Q284885","display_name":"Superposition principle","level":2,"score":0.33820000290870667},{"id":"https://openalex.org/C2992525071","wikidata":"https://www.wikidata.org/wiki/Q50818671","display_name":"Federated learning","level":2,"score":0.31940001249313354},{"id":"https://openalex.org/C165696696","wikidata":"https://www.wikidata.org/wiki/Q11287","display_name":"Exploit","level":2,"score":0.3160000145435333},{"id":"https://openalex.org/C68649174","wikidata":"https://www.wikidata.org/wiki/Q1379116","display_name":"Base station","level":2,"score":0.31130000948905945},{"id":"https://openalex.org/C108037233","wikidata":"https://www.wikidata.org/wiki/Q11375","display_name":"Wireless network","level":3,"score":0.3086000084877014},{"id":"https://openalex.org/C42058472","wikidata":"https://www.wikidata.org/wiki/Q810214","display_name":"Base (topology)","level":2,"score":0.299699991941452},{"id":"https://openalex.org/C761482","wikidata":"https://www.wikidata.org/wiki/Q118093","display_name":"Transmission (telecommunications)","level":2,"score":0.2985000014305115},{"id":"https://openalex.org/C126255220","wikidata":"https://www.wikidata.org/wiki/Q141495","display_name":"Mathematical optimization","level":1,"score":0.29649999737739563},{"id":"https://openalex.org/C112680207","wikidata":"https://www.wikidata.org/wiki/Q714886","display_name":"Regular polygon","level":2,"score":0.2906000018119812},{"id":"https://openalex.org/C157972887","wikidata":"https://www.wikidata.org/wiki/Q463359","display_name":"Convex optimization","level":3,"score":0.2879999876022339},{"id":"https://openalex.org/C177264268","wikidata":"https://www.wikidata.org/wiki/Q1514741","display_name":"Set (abstract data type)","level":2,"score":0.27480000257492065},{"id":"https://openalex.org/C120314980","wikidata":"https://www.wikidata.org/wiki/Q180634","display_name":"Distributed computing","level":1,"score":0.2711000144481659},{"id":"https://openalex.org/C18555067","wikidata":"https://www.wikidata.org/wiki/Q8375051","display_name":"Joint (building)","level":2,"score":0.2703999876976013},{"id":"https://openalex.org/C114289077","wikidata":"https://www.wikidata.org/wiki/Q3284399","display_name":"Statistical model","level":2,"score":0.26980000734329224},{"id":"https://openalex.org/C154945302","wikidata":"https://www.wikidata.org/wiki/Q11660","display_name":"Artificial intelligence","level":1,"score":0.26739999651908875},{"id":"https://openalex.org/C124101348","wikidata":"https://www.wikidata.org/wiki/Q172491","display_name":"Data mining","level":1,"score":0.2639000117778778},{"id":"https://openalex.org/C179799912","wikidata":"https://www.wikidata.org/wiki/Q205084","display_name":"Computational complexity theory","level":2,"score":0.260699987411499},{"id":"https://openalex.org/C97931131","wikidata":"https://www.wikidata.org/wiki/Q5282087","display_name":"Discriminative model","level":2,"score":0.25450000166893005},{"id":"https://openalex.org/C126042441","wikidata":"https://www.wikidata.org/wiki/Q1324888","display_name":"Frame (networking)","level":2,"score":0.2529999911785126}],"mesh":[],"locations_count":2,"locations":[{"id":"pmh:doi:10.48550/arxiv.2510.26722","is_oa":true,"landing_page_url":null,"pdf_url":null,"source":{"id":"https://openalex.org/S4406922384","display_name":"Open MIND","issn_l":null,"issn":null,"is_oa":false,"is_in_doaj":false,"is_core":false,"host_organization":null,"host_organization_name":null,"host_organization_lineage":[],"host_organization_lineage_names":[],"type":"repository"},"license":"cc-by","license_id":"https://openalex.org/licenses/cc-by","version":"submittedVersion","is_accepted":false,"is_published":false,"raw_source_name":null,"raw_type":"Article"},{"id":"doi:10.48550/arxiv.2510.26722","is_oa":true,"landing_page_url":"https://doi.org/10.48550/arxiv.2510.26722","pdf_url":null,"source":{"id":"https://openalex.org/S4306400194","display_name":"arXiv (Cornell University)","issn_l":null,"issn":null,"is_oa":true,"is_in_doaj":false,"is_core":false,"host_organization":"https://openalex.org/I205783295","host_organization_name":"Cornell University","host_organization_lineage":["https://openalex.org/I205783295"],"host_organization_lineage_names":[],"type":"repository"},"license":"cc-by","license_id":"https://openalex.org/licenses/cc-by","version":null,"is_accepted":false,"is_published":null,"raw_source_name":null,"raw_type":"article"}],"best_oa_location":{"id":"pmh:doi:10.48550/arxiv.2510.26722","is_oa":true,"landing_page_url":null,"pdf_url":null,"source":{"id":"https://openalex.org/S4406922384","display_name":"Open MIND","issn_l":null,"issn":null,"is_oa":false,"is_in_doaj":false,"is_core":false,"host_organization":null,"host_organization_name":null,"host_organization_lineage":[],"host_organization_lineage_names":[],"type":"repository"},"license":"cc-by","license_id":"https://openalex.org/licenses/cc-by","version":"submittedVersion","is_accepted":false,"is_published":false,"raw_source_name":null,"raw_type":"Article"},"sustainable_development_goals":[],"awards":[],"funders":[],"has_content":{"grobid_xml":false,"pdf":false},"content_urls":null,"referenced_works_count":0,"referenced_works":[],"related_works":[],"abstract_inverted_index":{"Over-the-air":[0],"(OTA)":[1],"federated":[2],"learning":[3],"(FL)":[4],"has":[5],"been":[6],"well":[7],"recognized":[8],"as":[9],"a":[10,28,121,133,146,155,181],"scalable":[11],"paradigm":[12],"that":[13,119,143,170],"exploits":[14],"the":[15,19,67,72,176,187,189],"waveform":[16],"superposition":[17],"of":[18,78],"wireless":[20,43,59,111],"multiple-access":[21],"channel":[22],"to":[23,54],"aggregate":[24],"model":[25,37,124],"updates":[26,38,53,118],"in":[27],"single":[29],"use.":[30],"Existing":[31],"OTA-FL":[32,80,99,116,203],"designs":[33,63],"largely":[34,81],"enforce":[35],"zero-bias":[36,52],"by":[39,66,94],"either":[40],"assuming":[41],"\\emph{homogeneous}":[42],"conditions":[44],"(equal":[45],"path":[46],"loss":[47],"across":[48],"devices)":[49],"or":[50],"forcing":[51],"guarantee":[55],"convergence.":[56],"Under":[57],"\\emph{heterogeneous}":[58],"scenarios,":[60],"however,":[61],"such":[62],"are":[64,90],"constrained":[65],"weakest":[68],"device":[69],"and":[70,161,198],"inflate":[71],"update":[73],"variance.":[74],"Moreover,":[75],"prior":[76,202],"analyses":[77],"biased":[79],"address":[82],"convex":[83,166],"objectives,":[84],"while":[85,126],"most":[86],"modern":[87],"AI":[88],"models":[89],"highly":[91],"non-convex.":[92],"Motivated":[93],"these":[95],"gaps,":[96],"we":[97,153],"study":[98],"with":[100],"stochastic":[101],"gradient":[102,141],"descent":[103],"(SGD)":[104],"for":[105],"general":[106],"smooth":[107],"non-convex":[108,156,182],"objectives":[109],"under":[110],"heterogeneity.":[112],"We":[113,131],"develop":[114,162],"novel":[115],"SGD":[117],"allow":[120],"structured,":[122],"time-invariant":[123],"bias":[125,197],"facilitating":[127],"reduced":[128],"variance":[129],"updates.":[130],"derive":[132],"finite-time":[134],"stationarity":[135],"bound":[136],"(expected":[137],"time":[138],"average":[139],"squared":[140],"norm)":[142],"explicitly":[144],"reveals":[145],"bias-variance":[147],"trade-off.":[148],"To":[149],"optimize":[150],"this":[151],"trade-off,":[152],"pose":[154],"joint":[157],"OTA":[158],"power-control":[159],"design":[160,191],"an":[163,195],"efficient":[164],"successive":[165],"approximation":[167],"(SCA)":[168],"algorithm":[169],"requires":[171],"only":[172],"statistical":[173],"CSI":[174],"at":[175],"base":[177],"station.":[178],"Experiments":[179],"on":[180],"image":[183],"classification":[184],"task":[185],"validate":[186],"approach:":[188],"SCA-based":[190],"accelerates":[192],"convergence":[193],"via":[194],"optimized":[196],"improves":[199],"generalization":[200],"over":[201],"baselines.":[204]},"counts_by_year":[],"updated_date":"2026-04-04T16:13:02.066488","created_date":"2025-11-01T00:00:00"}