{"id":"https://openalex.org/W7134899697","doi":"https://doi.org/10.48550/arxiv.2603.09882","title":"Emerging Extrinsic Dexterity in Cluttered Scenes via Dynamics-aware Policy Learning","display_name":"Emerging Extrinsic Dexterity in Cluttered Scenes via Dynamics-aware Policy Learning","publication_year":2026,"publication_date":"2026-03-10","ids":{"openalex":"https://openalex.org/W7134899697","doi":"https://doi.org/10.48550/arxiv.2603.09882"},"language":null,"primary_location":{"id":"doi:10.48550/arxiv.2603.09882","is_oa":true,"landing_page_url":"https://doi.org/10.48550/arxiv.2603.09882","pdf_url":null,"source":{"id":"https://openalex.org/S4306400194","display_name":"arXiv (Cornell University)","issn_l":null,"issn":null,"is_oa":true,"is_in_doaj":false,"is_core":false,"host_organization":"https://openalex.org/I205783295","host_organization_name":"Cornell University","host_organization_lineage":["https://openalex.org/I205783295"],"host_organization_lineage_names":[],"type":"repository"},"license":null,"license_id":null,"version":null,"is_accepted":false,"is_published":false,"raw_source_name":null,"raw_type":"article"},"type":"preprint","indexed_in":["datacite"],"open_access":{"is_oa":true,"oa_status":"green","oa_url":"https://doi.org/10.48550/arxiv.2603.09882","any_repository_has_fulltext":true},"authorships":[{"author_position":"first","author":{"id":"https://openalex.org/A5121598855","display_name":"Yixin Zheng","orcid":null},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Zheng, Yixin","raw_affiliation_strings":[],"raw_orcid":null,"affiliations":[]},{"author_position":"middle","author":{"id":"https://openalex.org/A5128717965","display_name":"Jiangran Lyu","orcid":null},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Lyu, Jiangran","raw_affiliation_strings":[],"raw_orcid":null,"affiliations":[]},{"author_position":"middle","author":{"id":"https://openalex.org/A5128768904","display_name":"Yifan Zhang","orcid":null},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Zhang, Yifan","raw_affiliation_strings":[],"raw_orcid":null,"affiliations":[]},{"author_position":"middle","author":{"id":"https://openalex.org/A5128785034","display_name":"Jiayi Chen","orcid":null},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Chen, Jiayi","raw_affiliation_strings":[],"raw_orcid":null,"affiliations":[]},{"author_position":"middle","author":{"id":"https://openalex.org/A5121558897","display_name":"Mi Yan","orcid":null},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Yan, Mi","raw_affiliation_strings":[],"raw_orcid":null,"affiliations":[]},{"author_position":"middle","author":{"id":"https://openalex.org/A5128708260","display_name":"Yuntian Deng","orcid":null},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Deng, Yuntian","raw_affiliation_strings":[],"raw_orcid":null,"affiliations":[]},{"author_position":"middle","author":{"id":"https://openalex.org/A5128725868","display_name":"Xuesong Shi","orcid":null},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Shi, Xuesong","raw_affiliation_strings":[],"raw_orcid":null,"affiliations":[]},{"author_position":"middle","author":{"id":"https://openalex.org/A5128758372","display_name":"Xiaoguang Zhao","orcid":null},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Zhao, Xiaoguang","raw_affiliation_strings":[],"raw_orcid":null,"affiliations":[]},{"author_position":"middle","author":{"id":"https://openalex.org/A5128704865","display_name":"Yizhou Wang","orcid":null},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Wang, Yizhou","raw_affiliation_strings":[],"raw_orcid":null,"affiliations":[]},{"author_position":"middle","author":{"id":"https://openalex.org/A5128787595","display_name":"Zhizheng Zhang","orcid":null},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Zhang, Zhizheng","raw_affiliation_strings":[],"raw_orcid":null,"affiliations":[]},{"author_position":"last","author":{"id":"https://openalex.org/A5128703993","display_name":"He Wang","orcid":null},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Wang, He","raw_affiliation_strings":[],"raw_orcid":null,"affiliations":[]}],"institutions":[],"countries_distinct_count":0,"institutions_distinct_count":11,"corresponding_author_ids":[],"corresponding_institution_ids":[],"apc_list":null,"apc_paid":null,"fwci":null,"has_fulltext":false,"cited_by_count":0,"citation_normalized_percentile":null,"cited_by_percentile_year":null,"biblio":{"volume":null,"issue":null,"first_page":null,"last_page":null},"is_retracted":false,"is_paratext":false,"is_xpac":false,"primary_topic":{"id":"https://openalex.org/T10653","display_name":"Robot Manipulation and Learning","score":0.6348000168800354,"subfield":{"id":"https://openalex.org/subfields/2207","display_name":"Control and Systems Engineering"},"field":{"id":"https://openalex.org/fields/22","display_name":"Engineering"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},"topics":[{"id":"https://openalex.org/T10653","display_name":"Robot Manipulation and Learning","score":0.6348000168800354,"subfield":{"id":"https://openalex.org/subfields/2207","display_name":"Control and Systems Engineering"},"field":{"id":"https://openalex.org/fields/22","display_name":"Engineering"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T11687","display_name":"Teleoperation and Haptic Systems","score":0.05260000005364418,"subfield":{"id":"https://openalex.org/subfields/2210","display_name":"Mechanical Engineering"},"field":{"id":"https://openalex.org/fields/22","display_name":"Engineering"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T10789","display_name":"Interactive and Immersive Displays","score":0.05119999870657921,"subfield":{"id":"https://openalex.org/subfields/1709","display_name":"Human-Computer Interaction"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}}],"keywords":[{"id":"https://openalex.org/keywords/representation","display_name":"Representation (politics)","score":0.6363999843597412},{"id":"https://openalex.org/keywords/heuristics","display_name":"Heuristics","score":0.6043000221252441},{"id":"https://openalex.org/keywords/reinforcement-learning","display_name":"Reinforcement learning","score":0.5498999953269958},{"id":"https://openalex.org/keywords/object","display_name":"Object (grammar)","score":0.5267000198364258},{"id":"https://openalex.org/keywords/prehensile-tail","display_name":"Prehensile tail","score":0.5223000049591064},{"id":"https://openalex.org/keywords/software-deployment","display_name":"Software deployment","score":0.43230000138282776},{"id":"https://openalex.org/keywords/field","display_name":"Field (mathematics)","score":0.35569998621940613},{"id":"https://openalex.org/keywords/policy-learning","display_name":"Policy learning","score":0.35269999504089355}],"concepts":[{"id":"https://openalex.org/C41008148","wikidata":"https://www.wikidata.org/wiki/Q21198","display_name":"Computer science","level":0,"score":0.6901999711990356},{"id":"https://openalex.org/C154945302","wikidata":"https://www.wikidata.org/wiki/Q11660","display_name":"Artificial intelligence","level":1,"score":0.6722000241279602},{"id":"https://openalex.org/C2776359362","wikidata":"https://www.wikidata.org/wiki/Q2145286","display_name":"Representation (politics)","level":3,"score":0.6363999843597412},{"id":"https://openalex.org/C127705205","wikidata":"https://www.wikidata.org/wiki/Q5748245","display_name":"Heuristics","level":2,"score":0.6043000221252441},{"id":"https://openalex.org/C97541855","wikidata":"https://www.wikidata.org/wiki/Q830687","display_name":"Reinforcement learning","level":2,"score":0.5498999953269958},{"id":"https://openalex.org/C2781238097","wikidata":"https://www.wikidata.org/wiki/Q175026","display_name":"Object (grammar)","level":2,"score":0.5267000198364258},{"id":"https://openalex.org/C136380597","wikidata":"https://www.wikidata.org/wiki/Q10508905","display_name":"Prehensile tail","level":2,"score":0.5223000049591064},{"id":"https://openalex.org/C31972630","wikidata":"https://www.wikidata.org/wiki/Q844240","display_name":"Computer vision","level":1,"score":0.4401000142097473},{"id":"https://openalex.org/C105339364","wikidata":"https://www.wikidata.org/wiki/Q2297740","display_name":"Software deployment","level":2,"score":0.43230000138282776},{"id":"https://openalex.org/C107457646","wikidata":"https://www.wikidata.org/wiki/Q207434","display_name":"Human\u2013computer interaction","level":1,"score":0.41679999232292175},{"id":"https://openalex.org/C9652623","wikidata":"https://www.wikidata.org/wiki/Q190109","display_name":"Field (mathematics)","level":2,"score":0.35569998621940613},{"id":"https://openalex.org/C2779436431","wikidata":"https://www.wikidata.org/wiki/Q30672407","display_name":"Policy learning","level":2,"score":0.35269999504089355},{"id":"https://openalex.org/C150899416","wikidata":"https://www.wikidata.org/wiki/Q1820378","display_name":"Transfer of learning","level":2,"score":0.35120001435279846},{"id":"https://openalex.org/C104114177","wikidata":"https://www.wikidata.org/wiki/Q79782","display_name":"Motion (physics)","level":2,"score":0.3402000069618225},{"id":"https://openalex.org/C119857082","wikidata":"https://www.wikidata.org/wiki/Q2539","display_name":"Machine learning","level":1,"score":0.3264000117778778},{"id":"https://openalex.org/C2780451532","wikidata":"https://www.wikidata.org/wiki/Q759676","display_name":"Task (project management)","level":2,"score":0.3041999936103821},{"id":"https://openalex.org/C34585555","wikidata":"https://www.wikidata.org/wiki/Q1368723","display_name":"Learning curve","level":2,"score":0.2919999957084656},{"id":"https://openalex.org/C90509273","wikidata":"https://www.wikidata.org/wiki/Q11012","display_name":"Robot","level":2,"score":0.289000004529953},{"id":"https://openalex.org/C64876066","wikidata":"https://www.wikidata.org/wiki/Q5141226","display_name":"Cognitive neuroscience of visual object recognition","level":3,"score":0.28850001096725464},{"id":"https://openalex.org/C26517878","wikidata":"https://www.wikidata.org/wiki/Q228039","display_name":"Key (lock)","level":2,"score":0.28200000524520874},{"id":"https://openalex.org/C145912823","wikidata":"https://www.wikidata.org/wiki/Q113558","display_name":"Dynamics (music)","level":2,"score":0.2727000117301941},{"id":"https://openalex.org/C175154964","wikidata":"https://www.wikidata.org/wiki/Q380077","display_name":"Task analysis","level":3,"score":0.27149999141693115},{"id":"https://openalex.org/C59404180","wikidata":"https://www.wikidata.org/wiki/Q17013334","display_name":"Feature learning","level":2,"score":0.26980000734329224},{"id":"https://openalex.org/C2780791683","wikidata":"https://www.wikidata.org/wiki/Q846785","display_name":"Action (physics)","level":2,"score":0.2680000066757202}],"mesh":[],"locations_count":1,"locations":[{"id":"doi:10.48550/arxiv.2603.09882","is_oa":true,"landing_page_url":"https://doi.org/10.48550/arxiv.2603.09882","pdf_url":null,"source":{"id":"https://openalex.org/S4306400194","display_name":"arXiv (Cornell University)","issn_l":null,"issn":null,"is_oa":true,"is_in_doaj":false,"is_core":false,"host_organization":"https://openalex.org/I205783295","host_organization_name":"Cornell University","host_organization_lineage":["https://openalex.org/I205783295"],"host_organization_lineage_names":[],"type":"repository"},"license":null,"license_id":null,"version":null,"is_accepted":false,"is_published":null,"raw_source_name":null,"raw_type":"article"}],"best_oa_location":{"id":"doi:10.48550/arxiv.2603.09882","is_oa":true,"landing_page_url":"https://doi.org/10.48550/arxiv.2603.09882","pdf_url":null,"source":{"id":"https://openalex.org/S4306400194","display_name":"arXiv (Cornell University)","issn_l":null,"issn":null,"is_oa":true,"is_in_doaj":false,"is_core":false,"host_organization":"https://openalex.org/I205783295","host_organization_name":"Cornell University","host_organization_lineage":["https://openalex.org/I205783295"],"host_organization_lineage_names":[],"type":"repository"},"license":null,"license_id":null,"version":null,"is_accepted":false,"is_published":false,"raw_source_name":null,"raw_type":"article"},"sustainable_development_goals":[],"awards":[],"funders":[],"has_content":{"pdf":false,"grobid_xml":false},"content_urls":null,"referenced_works_count":0,"referenced_works":[],"related_works":[],"abstract_inverted_index":{"Extrinsic":[0],"dexterity":[1,15,109],"leverages":[2],"environmental":[3],"contact":[4,28,114],"to":[5,103,110],"overcome":[6],"the":[7,128],"limitations":[8],"of":[9,42,86],"prehensile":[10,134],"manipulation.":[11],"However,":[12],"achieving":[13],"such":[14,43],"in":[16,50,53,57,63,90,124,145],"cluttered":[17,54,91,151,165],"scenes":[18,152],"remains":[19],"challenging":[20],"and":[21,46,101,127,138,177],"underexplored,":[22],"as":[23],"it":[24],"requires":[25],"selectively":[26],"exploiting":[27],"among":[29],"multiple":[30],"interacting":[31],"objects":[32],"with":[33,82,153],"inherently":[34],"coupled":[35],"dynamics.":[36],"Existing":[37],"approaches":[38],"lack":[39],"explicit":[40,98],"modeling":[41,100],"complex":[44,117],"dynamics":[45,89],"therefore":[47],"fall":[48],"short":[49],"non-prehensile":[51],"manipulation":[52],"environments,":[55],"which":[56],"turn":[58],"limits":[59],"their":[60],"practical":[61,169],"applicability":[62],"real-world":[64,157],"environments.":[65,92],"In":[66],"this":[67],"paper,":[68],"we":[69],"introduce":[70],"a":[71,83,168],"Dynamics-Aware":[72],"Policy":[73],"Learning":[74],"(DAPL)":[75],"framework":[76],"that":[77],"can":[78],"facilitate":[79],"policy":[80],"learning":[81],"learned":[84,96],"representation":[85,94],"contact-induced":[87],"object":[88],"This":[93],"is":[95],"through":[97],"world":[99],"used":[102],"condition":[104],"reinforcement":[105],"learning,":[106],"enabling":[107],"extrinsic":[108],"emerge":[111],"without":[112],"hand-crafted":[113],"heuristics":[115],"or":[116],"reward":[118],"shaping.":[119],"We":[120],"evaluate":[121],"our":[122],"approach":[123],"both":[125],"simulation":[126],"real":[129],"world.":[130],"Our":[131],"method":[132],"outperforms":[133],"manipulation,":[135],"human":[136],"teleoperation,":[137],"prior":[139],"representation-based":[140],"policies":[141],"by":[142],"over":[143],"25%":[144],"success":[146,158],"rate":[147,159],"on":[148],"unseen":[149],"simulated":[150],"varying":[154],"densities.":[155],"The":[156],"reaches":[160],"around":[161],"50%":[162],"across":[163],"10":[164],"scenes,":[166],"while":[167],"grocery":[170],"deployment":[171],"further":[172],"demonstrates":[173],"robust":[174],"sim-to-real":[175],"transfer":[176],"applicability.":[178]},"counts_by_year":[],"updated_date":"2026-06-11T09:08:48.828518","created_date":"2026-03-12T00:00:00"}