{"id":"https://openalex.org/W7133227605","doi":"https://doi.org/10.48550/arxiv.2602.24235","title":"SafeGen-LLM: Enhancing Safety Generalization in Task Planning for Robotic Systems","display_name":"SafeGen-LLM: Enhancing Safety Generalization in Task Planning for Robotic Systems","publication_year":2026,"publication_date":"2026-02-27","ids":{"openalex":"https://openalex.org/W7133227605","doi":"https://doi.org/10.48550/arxiv.2602.24235"},"language":null,"primary_location":{"id":"pmh:doi:10.48550/arxiv.2602.24235","is_oa":true,"landing_page_url":null,"pdf_url":null,"source":{"id":"https://openalex.org/S4406922384","display_name":"Open MIND","issn_l":null,"issn":null,"is_oa":false,"is_in_doaj":false,"is_core":false,"host_organization":null,"host_organization_name":null,"host_organization_lineage":[],"host_organization_lineage_names":[],"type":"repository"},"license":"publisher-specific-oa","license_id":"https://openalex.org/licenses/publisher-specific-oa","version":"submittedVersion","is_accepted":false,"is_published":false,"raw_source_name":null,"raw_type":"Article"},"type":"preprint","indexed_in":["datacite"],"open_access":{"is_oa":true,"oa_status":"green","oa_url":null,"any_repository_has_fulltext":true},"authorships":[{"author_position":"first","author":{"id":"https://openalex.org/A5047269850","display_name":"Jialiang Fan","orcid":"https://orcid.org/0000-0001-5554-672X"},"institutions":[],"countries":[],"is_corresponding":true,"raw_author_name":"Fan, Jialiang","raw_affiliation_strings":[],"affiliations":[]},{"author_position":"middle","author":{"id":"https://openalex.org/A5127850917","display_name":"Weizhe Xu","orcid":null},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Xu, Weizhe","raw_affiliation_strings":[],"affiliations":[]},{"author_position":"middle","author":{"id":"https://openalex.org/A5123311193","display_name":"Mengyu Liu","orcid":null},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Liu, Mengyu","raw_affiliation_strings":[],"affiliations":[]},{"author_position":"middle","author":{"id":"https://openalex.org/A5126390443","display_name":"Oleg Sokolsky","orcid":null},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Sokolsky, Oleg","raw_affiliation_strings":[],"affiliations":[]},{"author_position":"middle","author":{"id":"https://openalex.org/A5127787421","display_name":"Insup Lee","orcid":null},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Lee, Insup","raw_affiliation_strings":[],"affiliations":[]},{"author_position":"last","author":{"id":null,"display_name":"Kong, Fanxin","orcid":null},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Kong, Fanxin","raw_affiliation_strings":[],"affiliations":[]}],"institutions":[],"countries_distinct_count":0,"institutions_distinct_count":6,"corresponding_author_ids":["https://openalex.org/A5047269850"],"corresponding_institution_ids":[],"apc_list":null,"apc_paid":null,"fwci":null,"has_fulltext":false,"cited_by_count":0,"citation_normalized_percentile":null,"cited_by_percentile_year":null,"biblio":{"volume":null,"issue":null,"first_page":null,"last_page":null},"is_retracted":false,"is_paratext":false,"is_xpac":false,"primary_topic":{"id":"https://openalex.org/T10462","display_name":"Reinforcement Learning in Robotics","score":0.320499986410141,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},"topics":[{"id":"https://openalex.org/T10462","display_name":"Reinforcement Learning in Robotics","score":0.320499986410141,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T11689","display_name":"Adversarial Robustness in Machine Learning","score":0.22509999573230743,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T10906","display_name":"AI-based Problem Solving and Planning","score":0.06080000102519989,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}}],"keywords":[{"id":"https://openalex.org/keywords/task","display_name":"Task (project management)","score":0.6625000238418579},{"id":"https://openalex.org/keywords/generalization","display_name":"Generalization","score":0.6394000053405762},{"id":"https://openalex.org/keywords/reinforcement-learning","display_name":"Reinforcement learning","score":0.605400025844574},{"id":"https://openalex.org/keywords/benchmark","display_name":"Benchmark (surveying)","score":0.5699999928474426},{"id":"https://openalex.org/keywords/domain","display_name":"Domain (mathematical analysis)","score":0.5271000266075134},{"id":"https://openalex.org/keywords/construct","display_name":"Construct (python library)","score":0.5037999749183655},{"id":"https://openalex.org/keywords/natural-language","display_name":"Natural language","score":0.4708999991416931},{"id":"https://openalex.org/keywords/syntax","display_name":"Syntax","score":0.45489999651908875}],"concepts":[{"id":"https://openalex.org/C41008148","wikidata":"https://www.wikidata.org/wiki/Q21198","display_name":"Computer science","level":0,"score":0.7506999969482422},{"id":"https://openalex.org/C2780451532","wikidata":"https://www.wikidata.org/wiki/Q759676","display_name":"Task (project management)","level":2,"score":0.6625000238418579},{"id":"https://openalex.org/C177148314","wikidata":"https://www.wikidata.org/wiki/Q170084","display_name":"Generalization","level":2,"score":0.6394000053405762},{"id":"https://openalex.org/C154945302","wikidata":"https://www.wikidata.org/wiki/Q11660","display_name":"Artificial intelligence","level":1,"score":0.6087999939918518},{"id":"https://openalex.org/C97541855","wikidata":"https://www.wikidata.org/wiki/Q830687","display_name":"Reinforcement learning","level":2,"score":0.605400025844574},{"id":"https://openalex.org/C185798385","wikidata":"https://www.wikidata.org/wiki/Q1161707","display_name":"Benchmark (surveying)","level":2,"score":0.5699999928474426},{"id":"https://openalex.org/C36503486","wikidata":"https://www.wikidata.org/wiki/Q11235244","display_name":"Domain (mathematical analysis)","level":2,"score":0.5271000266075134},{"id":"https://openalex.org/C119857082","wikidata":"https://www.wikidata.org/wiki/Q2539","display_name":"Machine learning","level":1,"score":0.5223000049591064},{"id":"https://openalex.org/C2780801425","wikidata":"https://www.wikidata.org/wiki/Q5164392","display_name":"Construct (python library)","level":2,"score":0.5037999749183655},{"id":"https://openalex.org/C195324797","wikidata":"https://www.wikidata.org/wiki/Q33742","display_name":"Natural language","level":2,"score":0.4708999991416931},{"id":"https://openalex.org/C60048249","wikidata":"https://www.wikidata.org/wiki/Q37437","display_name":"Syntax","level":2,"score":0.45489999651908875},{"id":"https://openalex.org/C175154964","wikidata":"https://www.wikidata.org/wiki/Q380077","display_name":"Task analysis","level":3,"score":0.4074000120162964},{"id":"https://openalex.org/C114073186","wikidata":"https://www.wikidata.org/wiki/Q2631895","display_name":"Automated planning and scheduling","level":2,"score":0.38519999384880066},{"id":"https://openalex.org/C2779439875","wikidata":"https://www.wikidata.org/wiki/Q1078276","display_name":"Natural language understanding","level":3,"score":0.3849000036716461},{"id":"https://openalex.org/C90509273","wikidata":"https://www.wikidata.org/wiki/Q11012","display_name":"Robot","level":2,"score":0.382099986076355},{"id":"https://openalex.org/C2776505523","wikidata":"https://www.wikidata.org/wiki/Q4785468","display_name":"Plan (archaeology)","level":2,"score":0.37049999833106995},{"id":"https://openalex.org/C34413123","wikidata":"https://www.wikidata.org/wiki/Q170978","display_name":"Robotics","level":3,"score":0.32839998602867126},{"id":"https://openalex.org/C207685749","wikidata":"https://www.wikidata.org/wiki/Q2088941","display_name":"Domain knowledge","level":2,"score":0.28349998593330383},{"id":"https://openalex.org/C4554734","wikidata":"https://www.wikidata.org/wiki/Q593744","display_name":"Knowledge base","level":2,"score":0.27790001034736633},{"id":"https://openalex.org/C2779038628","wikidata":"https://www.wikidata.org/wiki/Q7248497","display_name":"Programming by demonstration","level":3,"score":0.2671999931335449},{"id":"https://openalex.org/C115903868","wikidata":"https://www.wikidata.org/wiki/Q80993","display_name":"Software engineering","level":1,"score":0.2581999897956848},{"id":"https://openalex.org/C136389625","wikidata":"https://www.wikidata.org/wiki/Q334384","display_name":"Supervised learning","level":3,"score":0.25619998574256897}],"mesh":[],"locations_count":2,"locations":[{"id":"pmh:doi:10.48550/arxiv.2602.24235","is_oa":true,"landing_page_url":null,"pdf_url":null,"source":{"id":"https://openalex.org/S4406922384","display_name":"Open MIND","issn_l":null,"issn":null,"is_oa":false,"is_in_doaj":false,"is_core":false,"host_organization":null,"host_organization_name":null,"host_organization_lineage":[],"host_organization_lineage_names":[],"type":"repository"},"license":"publisher-specific-oa","license_id":"https://openalex.org/licenses/publisher-specific-oa","version":"submittedVersion","is_accepted":false,"is_published":false,"raw_source_name":null,"raw_type":"Article"},{"id":"doi:10.48550/arxiv.2602.24235","is_oa":true,"landing_page_url":"https://doi.org/10.48550/arxiv.2602.24235","pdf_url":null,"source":{"id":"https://openalex.org/S4306400194","display_name":"arXiv (Cornell University)","issn_l":null,"issn":null,"is_oa":true,"is_in_doaj":false,"is_core":false,"host_organization":"https://openalex.org/I205783295","host_organization_name":"Cornell University","host_organization_lineage":["https://openalex.org/I205783295"],"host_organization_lineage_names":[],"type":"repository"},"license":null,"license_id":null,"version":null,"is_accepted":false,"is_published":null,"raw_source_name":null,"raw_type":"article"}],"best_oa_location":{"id":"pmh:doi:10.48550/arxiv.2602.24235","is_oa":true,"landing_page_url":null,"pdf_url":null,"source":{"id":"https://openalex.org/S4406922384","display_name":"Open MIND","issn_l":null,"issn":null,"is_oa":false,"is_in_doaj":false,"is_core":false,"host_organization":null,"host_organization_name":null,"host_organization_lineage":[],"host_organization_lineage_names":[],"type":"repository"},"license":"publisher-specific-oa","license_id":"https://openalex.org/licenses/publisher-specific-oa","version":"submittedVersion","is_accepted":false,"is_published":false,"raw_source_name":null,"raw_type":"Article"},"sustainable_development_goals":[],"awards":[],"funders":[],"has_content":{"pdf":false,"grobid_xml":false},"content_urls":null,"referenced_works_count":0,"referenced_works":[],"related_works":[],"abstract_inverted_index":{"Safety-critical":[0],"task":[1,50],"planning":[2,92,96,144],"in":[3,60],"robotic":[4],"systems":[5],"remains":[6],"challenging:":[7],"classical":[8],"planners":[9],"suffer":[10],"from":[11,112],"poor":[12],"scalability,":[13],"Reinforcement":[14],"Learning":[15],"(RL)-based":[16],"methods":[17],"generalize":[18,54],"poorly,":[19],"and":[20,98,100,119,137,146,152],"base":[21],"Large":[22],"Language":[23,71],"Models":[24],"(LLMs)":[25],"cannot":[26],"guarantee":[27],"safety.":[28],"To":[29],"address":[30],"this":[31],"gap,":[32],"we":[33,80],"propose":[34],"safety-generalizable":[35],"large":[36],"language":[37],"models,":[38],"named":[39],"SafeGen-LLM.":[40],"SafeGen-LLM":[41,132],"can":[42],"not":[43],"only":[44],"enhance":[45],"the":[46],"safety":[47,58,77,117,135],"satisfaction":[48],"of":[49],"plans":[51],"but":[52],"also":[53],"well":[55],"to":[56,94,115,123],"novel":[57],"properties":[59],"various":[61],"domains.":[62],"We":[63],"first":[64],"construct":[65],"a":[66,82,90],"multi-domain":[67,143],"Planning":[68],"Domain":[69],"Definition":[70],"3":[72],"(PDDL3)":[73],"benchmark":[74],"with":[75],"explicit":[76],"constraints.":[78],"Then,":[79],"introduce":[81],"two-stage":[83],"post-training":[84],"framework:":[85],"Supervised":[86],"Fine-Tuning":[87],"(SFT)":[88],"on":[89],"constraint-compliant":[91],"dataset":[93],"learn":[95],"syntax":[97],"semantics,":[99],"Group":[101],"Relative":[102],"Policy":[103],"Optimization":[104],"(GRPO)":[105],"guided":[106],"by":[107,120],"fine-grained":[108],"reward":[109],"machines":[110],"derived":[111],"formal":[113],"verification":[114],"enforce":[116],"alignment":[118],"curriculum":[121],"learning":[122],"better":[124],"handle":[125],"complex":[126],"tasks.":[127],"Extensive":[128],"experiments":[129],"show":[130],"that":[131],"achieves":[133],"strong":[134],"generalization":[136],"outperforms":[138],"frontier":[139],"proprietary":[140],"baselines":[141],"across":[142],"tasks":[145],"multiple":[147],"input":[148],"formats":[149],"(e.g.,":[150],"PDDLs":[151],"natural":[153],"language).":[154]},"counts_by_year":[],"updated_date":"2026-04-04T16:13:02.066488","created_date":"2026-03-03T00:00:00"}