{"id":"https://openalex.org/W7138926524","doi":"https://doi.org/10.48550/arxiv.2603.17301","title":"WINFlowNets: Warm-up Integrated Networks Training of Generative Flow Networks for Robotics and Machine Fault Adaptation","display_name":"WINFlowNets: Warm-up Integrated Networks Training of Generative Flow Networks for Robotics and Machine Fault Adaptation","publication_year":2026,"publication_date":"2026-03-18","ids":{"openalex":"https://openalex.org/W7138926524","doi":"https://doi.org/10.48550/arxiv.2603.17301"},"language":null,"primary_location":{"id":"doi:10.48550/arxiv.2603.17301","is_oa":true,"landing_page_url":"https://doi.org/10.48550/arxiv.2603.17301","pdf_url":null,"source":{"id":"https://openalex.org/S4306400194","display_name":"arXiv (Cornell University)","issn_l":null,"issn":null,"is_oa":true,"is_in_doaj":false,"is_core":false,"host_organization":"https://openalex.org/I205783295","host_organization_name":"Cornell University","host_organization_lineage":["https://openalex.org/I205783295"],"host_organization_lineage_names":[],"type":"repository"},"license":"cc-by","license_id":"https://openalex.org/licenses/cc-by","version":null,"is_accepted":false,"is_published":false,"raw_source_name":null,"raw_type":"article"},"type":"preprint","indexed_in":["datacite"],"open_access":{"is_oa":true,"oa_status":"green","oa_url":"https://doi.org/10.48550/arxiv.2603.17301","any_repository_has_fulltext":true},"authorships":[{"author_position":"first","author":{"id":"https://openalex.org/A5028789420","display_name":"Zahin Sufiyan","orcid":null},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Sufiyan, Zahin","raw_affiliation_strings":[],"raw_orcid":null,"affiliations":[]},{"author_position":"middle","author":{"id":"https://openalex.org/A5003674260","display_name":"Shadan Golestan","orcid":"https://orcid.org/0000-0001-7906-2287"},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Golestan, Shadan","raw_affiliation_strings":[],"raw_orcid":null,"affiliations":[]},{"author_position":"middle","author":{"id":"https://openalex.org/A5065328118","display_name":"Yoshihiro Mitsuka","orcid":null},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Mitsuka, Yoshihiro","raw_affiliation_strings":[],"raw_orcid":null,"affiliations":[]},{"author_position":"middle","author":{"id":"https://openalex.org/A5129953197","display_name":"Shotaro Miwa","orcid":null},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Miwa, Shotaro","raw_affiliation_strings":[],"raw_orcid":null,"affiliations":[]},{"author_position":"last","author":{"id":"https://openalex.org/A5123924308","display_name":"Osmar R Za\u00efane","orcid":null},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Zaiane, Osmar","raw_affiliation_strings":[],"raw_orcid":null,"affiliations":[]}],"institutions":[],"countries_distinct_count":0,"institutions_distinct_count":5,"corresponding_author_ids":[],"corresponding_institution_ids":[],"apc_list":null,"apc_paid":null,"fwci":null,"has_fulltext":false,"cited_by_count":0,"citation_normalized_percentile":null,"cited_by_percentile_year":null,"biblio":{"volume":null,"issue":null,"first_page":null,"last_page":null},"is_retracted":false,"is_paratext":false,"is_xpac":false,"primary_topic":{"id":"https://openalex.org/T10462","display_name":"Reinforcement Learning in Robotics","score":0.8504999876022339,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},"topics":[{"id":"https://openalex.org/T10462","display_name":"Reinforcement Learning in Robotics","score":0.8504999876022339,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T11689","display_name":"Adversarial Robustness in Machine Learning","score":0.017100000753998756,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T13553","display_name":"Age of Information Optimization","score":0.010499999858438969,"subfield":{"id":"https://openalex.org/subfields/1705","display_name":"Computer Networks and Communications"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}}],"keywords":[{"id":"https://openalex.org/keywords/robotics","display_name":"Robotics","score":0.5950000286102295},{"id":"https://openalex.org/keywords/reinforcement-learning","display_name":"Reinforcement learning","score":0.5813999772071838},{"id":"https://openalex.org/keywords/adaptation","display_name":"Adaptation (eye)","score":0.5514000058174133},{"id":"https://openalex.org/keywords/sample","display_name":"Sample (material)","score":0.5149000287055969},{"id":"https://openalex.org/keywords/training","display_name":"Training (meteorology)","score":0.47350001335144043},{"id":"https://openalex.org/keywords/robot","display_name":"Robot","score":0.4553999900817871},{"id":"https://openalex.org/keywords/dependency","display_name":"Dependency (UML)","score":0.44620001316070557},{"id":"https://openalex.org/keywords/generative-grammar","display_name":"Generative grammar","score":0.3772999942302704}],"concepts":[{"id":"https://openalex.org/C41008148","wikidata":"https://www.wikidata.org/wiki/Q21198","display_name":"Computer science","level":0,"score":0.7003999948501587},{"id":"https://openalex.org/C154945302","wikidata":"https://www.wikidata.org/wiki/Q11660","display_name":"Artificial intelligence","level":1,"score":0.6693000197410583},{"id":"https://openalex.org/C34413123","wikidata":"https://www.wikidata.org/wiki/Q170978","display_name":"Robotics","level":3,"score":0.5950000286102295},{"id":"https://openalex.org/C97541855","wikidata":"https://www.wikidata.org/wiki/Q830687","display_name":"Reinforcement learning","level":2,"score":0.5813999772071838},{"id":"https://openalex.org/C139807058","wikidata":"https://www.wikidata.org/wiki/Q352374","display_name":"Adaptation (eye)","level":2,"score":0.5514000058174133},{"id":"https://openalex.org/C119857082","wikidata":"https://www.wikidata.org/wiki/Q2539","display_name":"Machine learning","level":1,"score":0.5275999903678894},{"id":"https://openalex.org/C198531522","wikidata":"https://www.wikidata.org/wiki/Q485146","display_name":"Sample (material)","level":2,"score":0.5149000287055969},{"id":"https://openalex.org/C2777211547","wikidata":"https://www.wikidata.org/wiki/Q17141490","display_name":"Training (meteorology)","level":2,"score":0.47350001335144043},{"id":"https://openalex.org/C90509273","wikidata":"https://www.wikidata.org/wiki/Q11012","display_name":"Robot","level":2,"score":0.4553999900817871},{"id":"https://openalex.org/C19768560","wikidata":"https://www.wikidata.org/wiki/Q320727","display_name":"Dependency (UML)","level":2,"score":0.44620001316070557},{"id":"https://openalex.org/C39890363","wikidata":"https://www.wikidata.org/wiki/Q36108","display_name":"Generative grammar","level":2,"score":0.3772999942302704},{"id":"https://openalex.org/C175551986","wikidata":"https://www.wikidata.org/wiki/Q47089","display_name":"Fault (geology)","level":2,"score":0.3741999864578247},{"id":"https://openalex.org/C105339364","wikidata":"https://www.wikidata.org/wiki/Q2297740","display_name":"Software deployment","level":2,"score":0.36800000071525574},{"id":"https://openalex.org/C50644808","wikidata":"https://www.wikidata.org/wiki/Q192776","display_name":"Artificial neural network","level":2,"score":0.3368000090122223},{"id":"https://openalex.org/C63540848","wikidata":"https://www.wikidata.org/wiki/Q3140932","display_name":"Fault tolerance","level":2,"score":0.3366999924182892},{"id":"https://openalex.org/C120314980","wikidata":"https://www.wikidata.org/wiki/Q180634","display_name":"Distributed computing","level":1,"score":0.33559998869895935},{"id":"https://openalex.org/C157764524","wikidata":"https://www.wikidata.org/wiki/Q1383412","display_name":"Throughput","level":3,"score":0.29269999265670776},{"id":"https://openalex.org/C2775924081","wikidata":"https://www.wikidata.org/wiki/Q55608371","display_name":"Control (management)","level":2,"score":0.28619998693466187},{"id":"https://openalex.org/C489000","wikidata":"https://www.wikidata.org/wiki/Q747385","display_name":"Data flow diagram","level":2,"score":0.28299999237060547},{"id":"https://openalex.org/C38349280","wikidata":"https://www.wikidata.org/wiki/Q1434290","display_name":"Flow (mathematics)","level":2,"score":0.27559998631477356},{"id":"https://openalex.org/C26517878","wikidata":"https://www.wikidata.org/wiki/Q228039","display_name":"Key (lock)","level":2,"score":0.2741999924182892},{"id":"https://openalex.org/C107464732","wikidata":"https://www.wikidata.org/wiki/Q235781","display_name":"Adaptive control","level":3,"score":0.2718000113964081},{"id":"https://openalex.org/C2780440489","wikidata":"https://www.wikidata.org/wiki/Q5227278","display_name":"Data-driven","level":2,"score":0.2612999975681305},{"id":"https://openalex.org/C186766456","wikidata":"https://www.wikidata.org/wiki/Q612457","display_name":"Flow control (data)","level":2,"score":0.2517000138759613}],"mesh":[],"locations_count":1,"locations":[{"id":"doi:10.48550/arxiv.2603.17301","is_oa":true,"landing_page_url":"https://doi.org/10.48550/arxiv.2603.17301","pdf_url":null,"source":{"id":"https://openalex.org/S4306400194","display_name":"arXiv (Cornell University)","issn_l":null,"issn":null,"is_oa":true,"is_in_doaj":false,"is_core":false,"host_organization":"https://openalex.org/I205783295","host_organization_name":"Cornell University","host_organization_lineage":["https://openalex.org/I205783295"],"host_organization_lineage_names":[],"type":"repository"},"license":"cc-by","license_id":"https://openalex.org/licenses/cc-by","version":null,"is_accepted":false,"is_published":null,"raw_source_name":null,"raw_type":"article"}],"best_oa_location":{"id":"doi:10.48550/arxiv.2603.17301","is_oa":true,"landing_page_url":"https://doi.org/10.48550/arxiv.2603.17301","pdf_url":null,"source":{"id":"https://openalex.org/S4306400194","display_name":"arXiv (Cornell University)","issn_l":null,"issn":null,"is_oa":true,"is_in_doaj":false,"is_core":false,"host_organization":"https://openalex.org/I205783295","host_organization_name":"Cornell University","host_organization_lineage":["https://openalex.org/I205783295"],"host_organization_lineage_names":[],"type":"repository"},"license":"cc-by","license_id":"https://openalex.org/licenses/cc-by","version":null,"is_accepted":false,"is_published":false,"raw_source_name":null,"raw_type":"article"},"sustainable_development_goals":[{"id":"https://metadata.un.org/sdg/16","display_name":"Peace, Justice and strong institutions","score":0.5912715792655945}],"awards":[],"funders":[],"has_content":{"grobid_xml":false,"pdf":false},"content_urls":null,"referenced_works_count":0,"referenced_works":[],"related_works":[],"abstract_inverted_index":{"Generative":[0],"Flow":[1],"Networks":[2],"for":[3,99,118,156,171],"continuous":[4],"scenarios":[5],"(CFlowNets)":[6],"have":[7],"shown":[8],"promise":[9],"in":[10,40,58,123,136,150,173],"solving":[11],"sequential":[12],"decision-making":[13],"tasks":[14,43,157],"by":[15,46,108],"learning":[16],"stochastic":[17],"policies":[18],"using":[19],"a":[20,23,80,96,109,114],"flow":[21,89],"and":[22,90,113,132,141,175],"retrieval":[24,52,91,101],"network.":[25,53],"Despite":[26],"their":[27,37],"demonstrated":[28],"efficiency":[29],"compared":[30],"to":[31,103],"state-of-the-art":[32,133],"Reinforcement":[33],"Learning":[34],"(RL)":[35],"algorithms,":[36],"practical":[38],"application":[39],"robotic":[41,60,125,177],"control":[42],"is":[44],"constrained":[45],"the":[47,51,73,86,100],"reliance":[48],"on":[49],"pre-training":[50,63,181],"This":[54,76],"dependency":[55],"poses":[56],"challenges":[57],"dynamic":[59,174],"environments,":[61,152],"where":[62,179],"data":[64,185],"may":[65,187],"not":[66],"be":[67,188],"readily":[68],"available":[69],"or":[70,182],"representative":[71],"of":[72,88,138],"current":[74],"environment.":[75],"paper":[77],"introduces":[78],"WINFlowNets,":[79],"novel":[81],"CFlowNets":[82,131],"framework":[83],"that":[84,128,158],"enables":[85],"co-training":[87,119],"networks.":[92,121],"WINFlowNets":[93,129,145],"begins":[94],"with":[95,162],"warm-up":[97],"phase":[98],"network":[102],"bootstrap":[104],"its":[105],"policy,":[106],"followed":[107],"shared":[110,115],"training":[111,142],"architecture":[112],"replay":[116],"buffer":[117],"both":[120],"Experiments":[122],"simulated":[124],"environments":[126],"demonstrate":[127],"surpasses":[130],"RL":[134],"algorithms":[135],"terms":[137],"average":[139],"reward":[140],"stability.":[143],"Furthermore,":[144],"exhibits":[146],"strong":[147],"adaptive":[148],"capability":[149],"fault":[151],"making":[153],"it":[154],"suitable":[155],"demand":[159],"quick":[160],"adaptation":[161],"limited":[163],"sample":[164,183],"data.":[165],"These":[166],"findings":[167],"highlight":[168],"WINFlowNets'":[169],"potential":[170],"deployment":[172],"malfunction-prone":[176],"systems,":[178],"traditional":[180],"inefficient":[184],"collection":[186],"impractical.":[189]},"counts_by_year":[],"updated_date":"2026-06-11T09:08:48.828518","created_date":"2026-03-20T00:00:00"}