{"id":"https://openalex.org/W7161043008","doi":"https://doi.org/10.48550/arxiv.2605.11347","title":"Gradient-Free Noise Optimization for Reward Alignment in Generative Models","display_name":"Gradient-Free Noise Optimization for Reward Alignment in Generative Models","publication_year":2026,"publication_date":"2026-05-12","ids":{"openalex":"https://openalex.org/W7161043008","doi":"https://doi.org/10.48550/arxiv.2605.11347"},"language":null,"primary_location":{"id":"doi:10.48550/arxiv.2605.11347","is_oa":true,"landing_page_url":"https://doi.org/10.48550/arxiv.2605.11347","pdf_url":null,"source":{"id":"https://openalex.org/S4306400194","display_name":"arXiv (Cornell University)","issn_l":null,"issn":null,"is_oa":true,"is_in_doaj":false,"is_core":false,"host_organization":"https://openalex.org/I205783295","host_organization_name":"Cornell University","host_organization_lineage":["https://openalex.org/I205783295"],"host_organization_lineage_names":[],"type":"repository"},"license":"cc-by","license_id":"https://openalex.org/licenses/cc-by","version":null,"is_accepted":false,"is_published":false,"raw_source_name":null,"raw_type":"article"},"type":"preprint","indexed_in":["datacite"],"open_access":{"is_oa":true,"oa_status":"green","oa_url":"https://doi.org/10.48550/arxiv.2605.11347","any_repository_has_fulltext":true},"authorships":[{"author_position":"first","author":{"id":"https://openalex.org/A5136059952","display_name":"Jeongsol Kim","orcid":null},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Kim, Jeongsol","raw_affiliation_strings":[],"raw_orcid":null,"affiliations":[]},{"author_position":"middle","author":{"id":"https://openalex.org/A5136059902","display_name":"Hongeun Kim","orcid":null},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Kim, Hongeun","raw_affiliation_strings":[],"raw_orcid":null,"affiliations":[]},{"author_position":"middle","author":{"id":"https://openalex.org/A5136042386","display_name":"Jian Wang","orcid":null},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Wang, Jian","raw_affiliation_strings":[],"raw_orcid":null,"affiliations":[]},{"author_position":"last","author":{"id":"https://openalex.org/A5136062622","display_name":"Jong Chul Ye","orcid":null},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Ye, Jong Chul","raw_affiliation_strings":[],"raw_orcid":null,"affiliations":[]}],"institutions":[],"countries_distinct_count":0,"institutions_distinct_count":4,"corresponding_author_ids":[],"corresponding_institution_ids":[],"apc_list":null,"apc_paid":null,"fwci":null,"has_fulltext":false,"cited_by_count":0,"citation_normalized_percentile":null,"cited_by_percentile_year":null,"biblio":{"volume":null,"issue":null,"first_page":null,"last_page":null},"is_retracted":false,"is_paratext":false,"is_xpac":false,"primary_topic":{"id":"https://openalex.org/T12814","display_name":"Gaussian Processes and Bayesian Inference","score":0.1712999939918518,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},"topics":[{"id":"https://openalex.org/T12814","display_name":"Gaussian Processes and Bayesian Inference","score":0.1712999939918518,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T10044","display_name":"Protein Structure and Dynamics","score":0.11010000109672546,"subfield":{"id":"https://openalex.org/subfields/1312","display_name":"Molecular Biology"},"field":{"id":"https://openalex.org/fields/13","display_name":"Biochemistry, Genetics and Molecular Biology"},"domain":{"id":"https://openalex.org/domains/1","display_name":"Life Sciences"}},{"id":"https://openalex.org/T11206","display_name":"Model Reduction and Neural Networks","score":0.09210000187158585,"subfield":{"id":"https://openalex.org/subfields/3109","display_name":"Statistical and Nonlinear Physics"},"field":{"id":"https://openalex.org/fields/31","display_name":"Physics and Astronomy"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}}],"keywords":[{"id":"https://openalex.org/keywords/noise","display_name":"Noise (video)","score":0.6486999988555908},{"id":"https://openalex.org/keywords/backpropagation","display_name":"Backpropagation","score":0.5544000267982483},{"id":"https://openalex.org/keywords/generator","display_name":"Generator (circuit theory)","score":0.5164999961853027},{"id":"https://openalex.org/keywords/task","display_name":"Task (project management)","score":0.4438999891281128},{"id":"https://openalex.org/keywords/differentiable-function","display_name":"Differentiable function","score":0.43549999594688416},{"id":"https://openalex.org/keywords/benchmark","display_name":"Benchmark (surveying)","score":0.3898000121116638},{"id":"https://openalex.org/keywords/generative-model","display_name":"Generative model","score":0.3752000033855438},{"id":"https://openalex.org/keywords/limiting","display_name":"Limiting","score":0.3596000075340271}],"concepts":[{"id":"https://openalex.org/C41008148","wikidata":"https://www.wikidata.org/wiki/Q21198","display_name":"Computer science","level":0,"score":0.7024000287055969},{"id":"https://openalex.org/C99498987","wikidata":"https://www.wikidata.org/wiki/Q2210247","display_name":"Noise (video)","level":3,"score":0.6486999988555908},{"id":"https://openalex.org/C155032097","wikidata":"https://www.wikidata.org/wiki/Q798503","display_name":"Backpropagation","level":3,"score":0.5544000267982483},{"id":"https://openalex.org/C2780992000","wikidata":"https://www.wikidata.org/wiki/Q17016113","display_name":"Generator (circuit theory)","level":3,"score":0.5164999961853027},{"id":"https://openalex.org/C2780451532","wikidata":"https://www.wikidata.org/wiki/Q759676","display_name":"Task (project management)","level":2,"score":0.4438999891281128},{"id":"https://openalex.org/C154945302","wikidata":"https://www.wikidata.org/wiki/Q11660","display_name":"Artificial intelligence","level":1,"score":0.4426000118255615},{"id":"https://openalex.org/C202615002","wikidata":"https://www.wikidata.org/wiki/Q783507","display_name":"Differentiable function","level":2,"score":0.43549999594688416},{"id":"https://openalex.org/C185798385","wikidata":"https://www.wikidata.org/wiki/Q1161707","display_name":"Benchmark (surveying)","level":2,"score":0.3898000121116638},{"id":"https://openalex.org/C167966045","wikidata":"https://www.wikidata.org/wiki/Q5532625","display_name":"Generative model","level":3,"score":0.3752000033855438},{"id":"https://openalex.org/C188198153","wikidata":"https://www.wikidata.org/wiki/Q1613840","display_name":"Limiting","level":2,"score":0.3596000075340271},{"id":"https://openalex.org/C99844830","wikidata":"https://www.wikidata.org/wiki/Q102441924","display_name":"Scaling","level":2,"score":0.35260000824928284},{"id":"https://openalex.org/C163294075","wikidata":"https://www.wikidata.org/wiki/Q581861","display_name":"Noise reduction","level":2,"score":0.349700003862381},{"id":"https://openalex.org/C2775924081","wikidata":"https://www.wikidata.org/wiki/Q55608371","display_name":"Control (management)","level":2,"score":0.3319000005722046},{"id":"https://openalex.org/C119857082","wikidata":"https://www.wikidata.org/wiki/Q2539","display_name":"Machine learning","level":1,"score":0.33160001039505005},{"id":"https://openalex.org/C2778112365","wikidata":"https://www.wikidata.org/wiki/Q3511065","display_name":"Sequence (biology)","level":2,"score":0.3181999921798706},{"id":"https://openalex.org/C11413529","wikidata":"https://www.wikidata.org/wiki/Q8366","display_name":"Algorithm","level":1,"score":0.2906999886035919},{"id":"https://openalex.org/C2986577269","wikidata":"https://www.wikidata.org/wiki/Q11306265","display_name":"Random noise","level":2,"score":0.2892000079154968},{"id":"https://openalex.org/C49937458","wikidata":"https://www.wikidata.org/wiki/Q2599292","display_name":"Probabilistic logic","level":2,"score":0.28780001401901245},{"id":"https://openalex.org/C203479927","wikidata":"https://www.wikidata.org/wiki/Q5165939","display_name":"Controller (irrigation)","level":2,"score":0.28600001335144043},{"id":"https://openalex.org/C50644808","wikidata":"https://www.wikidata.org/wiki/Q192776","display_name":"Artificial neural network","level":2,"score":0.2858000099658966},{"id":"https://openalex.org/C207658827","wikidata":"https://www.wikidata.org/wiki/Q1999781","display_name":"Stochastic resonance","level":4,"score":0.28119999170303345},{"id":"https://openalex.org/C91575142","wikidata":"https://www.wikidata.org/wiki/Q1971426","display_name":"Optimal control","level":2,"score":0.25200000405311584}],"mesh":[],"locations_count":1,"locations":[{"id":"doi:10.48550/arxiv.2605.11347","is_oa":true,"landing_page_url":"https://doi.org/10.48550/arxiv.2605.11347","pdf_url":null,"source":{"id":"https://openalex.org/S4306400194","display_name":"arXiv (Cornell University)","issn_l":null,"issn":null,"is_oa":true,"is_in_doaj":false,"is_core":false,"host_organization":"https://openalex.org/I205783295","host_organization_name":"Cornell University","host_organization_lineage":["https://openalex.org/I205783295"],"host_organization_lineage_names":[],"type":"repository"},"license":"cc-by","license_id":"https://openalex.org/licenses/cc-by","version":null,"is_accepted":false,"is_published":null,"raw_source_name":null,"raw_type":"article"}],"best_oa_location":{"id":"doi:10.48550/arxiv.2605.11347","is_oa":true,"landing_page_url":"https://doi.org/10.48550/arxiv.2605.11347","pdf_url":null,"source":{"id":"https://openalex.org/S4306400194","display_name":"arXiv (Cornell University)","issn_l":null,"issn":null,"is_oa":true,"is_in_doaj":false,"is_core":false,"host_organization":"https://openalex.org/I205783295","host_organization_name":"Cornell University","host_organization_lineage":["https://openalex.org/I205783295"],"host_organization_lineage_names":[],"type":"repository"},"license":"cc-by","license_id":"https://openalex.org/licenses/cc-by","version":null,"is_accepted":false,"is_published":false,"raw_source_name":null,"raw_type":"article"},"sustainable_development_goals":[],"awards":[],"funders":[],"has_content":{"grobid_xml":false,"pdf":false},"content_urls":null,"referenced_works_count":0,"referenced_works":[],"related_works":[],"abstract_inverted_index":{"Existing":[0],"reward":[1,37,69,103],"alignment":[2],"methods":[3],"for":[4],"diffusion":[5],"and":[6,36,95,102],"flow":[7],"models":[8],"rely":[9],"on":[10],"multi-step":[11],"stochastic":[12],"trajectories,":[13],"making":[14],"them":[15],"difficult":[16],"to":[17,19,41,82],"extend":[18],"deterministic":[20],"generators.":[21],"A":[22],"natural":[23],"alternative":[24],"is":[25,113],"noise-space":[26],"optimization,":[27],"but":[28],"existing":[29],"approaches":[30],"require":[31],"backpropagation":[32,112],"through":[33],"the":[34,79],"generator":[35],"pipeline,":[38],"limiting":[39],"applicability":[40],"differentiable":[42],"settings.":[43],"To":[44],"address":[45],"this,":[46],"here":[47],"we":[48],"present":[49],"ZeNO":[50,90],"(Zeroth-order":[51],"Noise":[52],"Optimization),":[53],"a":[54,62,87,106],"gradient-free":[55],"framework":[56],"that":[57],"formulates":[58],"noise":[59],"optimization":[60],"as":[61],"path-integral":[63],"control":[64],"problem,":[65],"estimable":[66],"from":[67],"zeroth-order":[68],"evaluations":[70],"alone.":[71],"When":[72],"instantiated":[73],"with":[74],"an":[75],"Ornstein--Uhlenbeck":[76],"reference":[77],"process,":[78],"update":[80],"connects":[81],"Langevin":[83],"dynamics":[84],"implicitly":[85],"targeting":[86],"reward-tilted":[88],"distribution.":[89],"enables":[91],"effective":[92],"inference-time":[93],"scaling":[94],"demonstrates":[96],"strong":[97],"performance":[98],"across":[99],"diverse":[100],"generators":[101],"functions,":[104],"including":[105],"protein":[107],"structure":[108],"generation":[109],"task":[110],"where":[111],"infeasible.":[114]},"counts_by_year":[],"updated_date":"2026-06-11T09:08:48.828518","created_date":"2026-05-14T00:00:00"}