{"id":"https://openalex.org/W7161049531","doi":"https://doi.org/10.48550/arxiv.2605.11666","title":"Evolutionary Task Discovery: Advancing Reasoning Frontiers via Skill Composition and Complexity Scaling","display_name":"Evolutionary Task Discovery: Advancing Reasoning Frontiers via Skill Composition and Complexity Scaling","publication_year":2026,"publication_date":"2026-05-12","ids":{"openalex":"https://openalex.org/W7161049531","doi":"https://doi.org/10.48550/arxiv.2605.11666"},"language":null,"primary_location":{"id":"doi:10.48550/arxiv.2605.11666","is_oa":true,"landing_page_url":"https://doi.org/10.48550/arxiv.2605.11666","pdf_url":null,"source":{"id":"https://openalex.org/S4306400194","display_name":"arXiv (Cornell University)","issn_l":null,"issn":null,"is_oa":true,"is_in_doaj":false,"is_core":false,"host_organization":"https://openalex.org/I205783295","host_organization_name":"Cornell University","host_organization_lineage":["https://openalex.org/I205783295"],"host_organization_lineage_names":[],"type":"repository"},"license":"cc-by","license_id":"https://openalex.org/licenses/cc-by","version":null,"is_accepted":false,"is_published":false,"raw_source_name":null,"raw_type":"article"},"type":"preprint","indexed_in":["datacite"],"open_access":{"is_oa":true,"oa_status":"green","oa_url":"https://doi.org/10.48550/arxiv.2605.11666","any_repository_has_fulltext":true},"authorships":[{"author_position":"first","author":{"id":"https://openalex.org/A5015193833","display_name":"Liqin Ye","orcid":null},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Ye, Liqin","raw_affiliation_strings":[],"raw_orcid":null,"affiliations":[]},{"author_position":"middle","author":{"id":"https://openalex.org/A5090843422","display_name":"Yanbin Yin","orcid":"https://orcid.org/0000-0001-7667-881X"},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Yin, Yanbin","raw_affiliation_strings":[],"raw_orcid":null,"affiliations":[]},{"author_position":"middle","author":{"id":"https://openalex.org/A5107099335","display_name":"Michael Galarnyk","orcid":null},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Galarnyk, Michael","raw_affiliation_strings":[],"raw_orcid":null,"affiliations":[]},{"author_position":"middle","author":{"id":"https://openalex.org/A5102694087","display_name":"Yuzhao Heng","orcid":null},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Heng, Yuzhao","raw_affiliation_strings":[],"raw_orcid":null,"affiliations":[]},{"author_position":"middle","author":{"id":"https://openalex.org/A5136036582","display_name":"Sudheer Chava","orcid":null},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Chava, Sudheer","raw_affiliation_strings":[],"raw_orcid":null,"affiliations":[]},{"author_position":"last","author":{"id":"https://openalex.org/A5136058510","display_name":"Chao Zhang","orcid":null},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Zhang, Chao","raw_affiliation_strings":[],"raw_orcid":null,"affiliations":[]}],"institutions":[],"countries_distinct_count":0,"institutions_distinct_count":6,"corresponding_author_ids":[],"corresponding_institution_ids":[],"apc_list":null,"apc_paid":null,"fwci":null,"has_fulltext":false,"cited_by_count":0,"citation_normalized_percentile":null,"cited_by_percentile_year":null,"biblio":{"volume":null,"issue":null,"first_page":null,"last_page":null},"is_retracted":false,"is_paratext":false,"is_xpac":false,"primary_topic":{"id":"https://openalex.org/T10028","display_name":"Topic Modeling","score":0.2102999985218048,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},"topics":[{"id":"https://openalex.org/T10028","display_name":"Topic Modeling","score":0.2102999985218048,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T11714","display_name":"Multimodal Machine Learning Applications","score":0.13050000369548798,"subfield":{"id":"https://openalex.org/subfields/1707","display_name":"Computer Vision and Pattern Recognition"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T13629","display_name":"Text Readability and Simplification","score":0.08510000258684158,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}}],"keywords":[{"id":"https://openalex.org/keywords/reinforcement-learning","display_name":"Reinforcement learning","score":0.47290000319480896},{"id":"https://openalex.org/keywords/task","display_name":"Task (project management)","score":0.43799999356269836},{"id":"https://openalex.org/keywords/evolutionary-algorithm","display_name":"Evolutionary algorithm","score":0.376800000667572},{"id":"https://openalex.org/keywords/operator","display_name":"Operator (biology)","score":0.37139999866485596},{"id":"https://openalex.org/keywords/task-analysis","display_name":"Task analysis","score":0.33869999647140503},{"id":"https://openalex.org/keywords/evolutionary-computation","display_name":"Evolutionary computation","score":0.328900009393692}],"concepts":[{"id":"https://openalex.org/C41008148","wikidata":"https://www.wikidata.org/wiki/Q21198","display_name":"Computer science","level":0,"score":0.6151000261306763},{"id":"https://openalex.org/C154945302","wikidata":"https://www.wikidata.org/wiki/Q11660","display_name":"Artificial intelligence","level":1,"score":0.5145999789237976},{"id":"https://openalex.org/C97541855","wikidata":"https://www.wikidata.org/wiki/Q830687","display_name":"Reinforcement learning","level":2,"score":0.47290000319480896},{"id":"https://openalex.org/C2780451532","wikidata":"https://www.wikidata.org/wiki/Q759676","display_name":"Task (project management)","level":2,"score":0.43799999356269836},{"id":"https://openalex.org/C119857082","wikidata":"https://www.wikidata.org/wiki/Q2539","display_name":"Machine learning","level":1,"score":0.38019999861717224},{"id":"https://openalex.org/C159149176","wikidata":"https://www.wikidata.org/wiki/Q14489129","display_name":"Evolutionary algorithm","level":2,"score":0.376800000667572},{"id":"https://openalex.org/C17020691","wikidata":"https://www.wikidata.org/wiki/Q139677","display_name":"Operator (biology)","level":5,"score":0.37139999866485596},{"id":"https://openalex.org/C175154964","wikidata":"https://www.wikidata.org/wiki/Q380077","display_name":"Task analysis","level":3,"score":0.33869999647140503},{"id":"https://openalex.org/C105902424","wikidata":"https://www.wikidata.org/wiki/Q1197129","display_name":"Evolutionary computation","level":2,"score":0.328900009393692},{"id":"https://openalex.org/C80444323","wikidata":"https://www.wikidata.org/wiki/Q2878974","display_name":"Theoretical computer science","level":1,"score":0.3257000148296356},{"id":"https://openalex.org/C85847156","wikidata":"https://www.wikidata.org/wiki/Q59015987","display_name":"Verifiable secret sharing","level":3,"score":0.3140000104904175},{"id":"https://openalex.org/C117251300","wikidata":"https://www.wikidata.org/wiki/Q1849855","display_name":"Parametric statistics","level":2,"score":0.30230000615119934},{"id":"https://openalex.org/C122507166","wikidata":"https://www.wikidata.org/wiki/Q628906","display_name":"Crossover","level":2,"score":0.2955999970436096},{"id":"https://openalex.org/C165064840","wikidata":"https://www.wikidata.org/wiki/Q1321061","display_name":"Matching (statistics)","level":2,"score":0.29319998621940613},{"id":"https://openalex.org/C110332635","wikidata":"https://www.wikidata.org/wiki/Q629498","display_name":"Genetic programming","level":2,"score":0.2802000045776367},{"id":"https://openalex.org/C115086926","wikidata":"https://www.wikidata.org/wiki/Q17004651","display_name":"Causal reasoning","level":3,"score":0.26750001311302185}],"mesh":[],"locations_count":1,"locations":[{"id":"doi:10.48550/arxiv.2605.11666","is_oa":true,"landing_page_url":"https://doi.org/10.48550/arxiv.2605.11666","pdf_url":null,"source":{"id":"https://openalex.org/S4306400194","display_name":"arXiv (Cornell University)","issn_l":null,"issn":null,"is_oa":true,"is_in_doaj":false,"is_core":false,"host_organization":"https://openalex.org/I205783295","host_organization_name":"Cornell University","host_organization_lineage":["https://openalex.org/I205783295"],"host_organization_lineage_names":[],"type":"repository"},"license":"cc-by","license_id":"https://openalex.org/licenses/cc-by","version":null,"is_accepted":false,"is_published":null,"raw_source_name":null,"raw_type":"article"}],"best_oa_location":{"id":"doi:10.48550/arxiv.2605.11666","is_oa":true,"landing_page_url":"https://doi.org/10.48550/arxiv.2605.11666","pdf_url":null,"source":{"id":"https://openalex.org/S4306400194","display_name":"arXiv (Cornell University)","issn_l":null,"issn":null,"is_oa":true,"is_in_doaj":false,"is_core":false,"host_organization":"https://openalex.org/I205783295","host_organization_name":"Cornell University","host_organization_lineage":["https://openalex.org/I205783295"],"host_organization_lineage_names":[],"type":"repository"},"license":"cc-by","license_id":"https://openalex.org/licenses/cc-by","version":null,"is_accepted":false,"is_published":false,"raw_source_name":null,"raw_type":"article"},"sustainable_development_goals":[{"score":0.818444550037384,"id":"https://metadata.un.org/sdg/4","display_name":"Quality Education"}],"awards":[],"funders":[],"has_content":{"grobid_xml":false,"pdf":false},"content_urls":null,"referenced_works_count":0,"referenced_works":[],"related_works":[],"abstract_inverted_index":{"The":[0],"reasoning":[1,64,157,177],"frontier":[2],"of":[3,25,36,89,139,150],"Large":[4],"Language":[5],"Models":[6],"(LLMs)":[7],"has":[8],"advanced":[9],"significantly":[10],"through":[11],"modern":[12],"post-training":[13],"paradigms":[14],"(e.g.,":[15,124],"Reinforcement":[16],"Learning":[17],"from":[18,56],"Verifiable":[19],"Rewards":[20],"(RLVR)).":[21],"However,":[22],"the":[23,32,37,63,147,151],"efficacy":[24],"these":[26],"methods":[27,48],"remains":[28],"fundamentally":[29],"constrained":[30],"by":[31],"diversity":[33],"and":[34,92,115,167],"complexity":[35],"training":[38],"data.":[39],"One":[40],"practical":[41],"solution":[42],"is":[43],"data":[44,79],"synthesis;":[45],"yet,":[46],"prevalent":[47],"relying":[49],"on":[50,183],"unstructured":[51],"mutation":[52],"or":[53],"exploration":[54],"suffer":[55],"homogeneity":[57],"collapse,":[58],"failing":[59],"to":[60,100,112,129],"systematically":[61],"expand":[62],"frontier.":[65],"To":[66],"overcome":[67],"this,":[68],"we":[69,134],"propose":[70],"Evoutionary":[71],"Task":[72],"Discovery":[73],"(EvoTD),":[74],"a":[75,82,86,104,116,136],"framework":[76],"that":[77,107,120,159,170],"treats":[78],"synthesis":[80],"as":[81],"directed":[83],"search":[84],"over":[85],"dual-axis":[87],"manifold":[88],"Algorithmic":[90],"Skills":[91],"Complexity":[93],"Attributes.":[94],"We":[95,179],"introduce":[96],"structured":[97,171],"evolutionary":[98,172],"operators":[99],"navigate":[101],"this":[102],"space:":[103],"Crossover":[105],"operator":[106,119],"synthesizes":[108],"novel":[109],"skill":[110],"compositions":[111],"enhance":[113],"diversity,":[114],"Parametric":[117],"Mutation":[118],"scales":[121],"structural":[122],"constraints":[123],"input":[125],"size,":[126],"tree":[127],"depth)":[128],"drive":[130],"robust":[131],"generalization.":[132],"Crucially,":[133],"integrate":[135],"dynamic":[137],"Zone":[138],"Proximal":[140],"Development":[141],"filter,":[142],"ensuring":[143],"tasks":[144],"lie":[145],"within":[146],"learnable":[148],"region":[149],"model.":[152],"Empirically,":[153],"EvoTD":[154],"delivers":[155],"substantial":[156],"gains":[158],"generalize":[160],"consistently":[161],"across":[162],"model":[163],"architectures,":[164],"pretraining":[165],"regimes,":[166],"scales,":[168],"demonstrating":[169],"curricula":[173],"can":[174],"effectively":[175],"support":[176],"improvement.":[178],"release":[180],"our":[181],"code":[182],"https://github.com/liqinye/EvoTD.":[184]},"counts_by_year":[],"updated_date":"2026-06-11T09:08:48.828518","created_date":"2026-05-14T00:00:00"}