{"id":"https://openalex.org/W6944356386","doi":"https://doi.org/10.21227/bnwk-hy87","title":"Context-guided Ground Truth Sampling for Multi-Modality Data Augmentation in Autonomous Driving","display_name":"Context-guided Ground Truth Sampling for Multi-Modality Data Augmentation in Autonomous Driving","publication_year":2022,"publication_date":"2022-04-24","ids":{"openalex":"https://openalex.org/W6944356386","doi":"https://doi.org/10.21227/bnwk-hy87"},"language":"en","primary_location":{"id":"doi:10.21227/bnwk-hy87","is_oa":true,"landing_page_url":"https://doi.org/10.21227/bnwk-hy87","pdf_url":null,"source":{"id":"https://openalex.org/S7407051695","display_name":"IEEE DataPort","issn_l":null,"issn":null,"is_oa":false,"is_in_doaj":false,"is_core":false,"host_organization":null,"host_organization_name":null,"host_organization_lineage":[],"host_organization_lineage_names":[],"type":"repository"},"license":"cc-by","license_id":"https://openalex.org/licenses/cc-by","version":null,"is_accepted":false,"is_published":false,"raw_source_name":null,"raw_type":"Dataset"},"type":"dataset","indexed_in":["datacite"],"open_access":{"is_oa":true,"oa_status":"green","oa_url":"https://doi.org/10.21227/bnwk-hy87","any_repository_has_fulltext":true},"authorships":[{"author_position":"first","author":{"id":null,"display_name":"Qi, Heng","orcid":null},"institutions":[],"countries":[],"is_corresponding":true,"raw_author_name":"Qi, Heng","raw_affiliation_strings":[],"raw_orcid":null,"affiliations":[]}],"institutions":[],"countries_distinct_count":0,"institutions_distinct_count":0,"corresponding_author_ids":[],"corresponding_institution_ids":[],"apc_list":null,"apc_paid":null,"fwci":null,"has_fulltext":false,"cited_by_count":0,"citation_normalized_percentile":null,"cited_by_percentile_year":null,"biblio":{"volume":null,"issue":null,"first_page":null,"last_page":null},"is_retracted":false,"is_paratext":false,"is_xpac":true,"primary_topic":null,"topics":[],"keywords":[{"id":"https://openalex.org/keywords/ground-truth","display_name":"Ground truth","score":0.7038000226020813},{"id":"https://openalex.org/keywords/raw-data","display_name":"Raw data","score":0.633899986743927},{"id":"https://openalex.org/keywords/point-cloud","display_name":"Point cloud","score":0.6182000041007996},{"id":"https://openalex.org/keywords/context","display_name":"Context (archaeology)","score":0.5533999800682068},{"id":"https://openalex.org/keywords/benchmark","display_name":"Benchmark (surveying)","score":0.5},{"id":"https://openalex.org/keywords/sampling","display_name":"Sampling (signal processing)","score":0.4941999912261963},{"id":"https://openalex.org/keywords/object-detection","display_name":"Object detection","score":0.4810999929904938},{"id":"https://openalex.org/keywords/object","display_name":"Object (grammar)","score":0.4480000138282776},{"id":"https://openalex.org/keywords/consistency","display_name":"Consistency (knowledge bases)","score":0.4375}],"concepts":[{"id":"https://openalex.org/C41008148","wikidata":"https://www.wikidata.org/wiki/Q21198","display_name":"Computer science","level":0,"score":0.7541000247001648},{"id":"https://openalex.org/C146849305","wikidata":"https://www.wikidata.org/wiki/Q370766","display_name":"Ground truth","level":2,"score":0.7038000226020813},{"id":"https://openalex.org/C132964779","wikidata":"https://www.wikidata.org/wiki/Q2110223","display_name":"Raw data","level":2,"score":0.633899986743927},{"id":"https://openalex.org/C131979681","wikidata":"https://www.wikidata.org/wiki/Q1899648","display_name":"Point cloud","level":2,"score":0.6182000041007996},{"id":"https://openalex.org/C154945302","wikidata":"https://www.wikidata.org/wiki/Q11660","display_name":"Artificial intelligence","level":1,"score":0.6082000136375427},{"id":"https://openalex.org/C31972630","wikidata":"https://www.wikidata.org/wiki/Q844240","display_name":"Computer vision","level":1,"score":0.5766000151634216},{"id":"https://openalex.org/C2779343474","wikidata":"https://www.wikidata.org/wiki/Q3109175","display_name":"Context (archaeology)","level":2,"score":0.5533999800682068},{"id":"https://openalex.org/C185798385","wikidata":"https://www.wikidata.org/wiki/Q1161707","display_name":"Benchmark (surveying)","level":2,"score":0.5},{"id":"https://openalex.org/C140779682","wikidata":"https://www.wikidata.org/wiki/Q210868","display_name":"Sampling (signal processing)","level":3,"score":0.4941999912261963},{"id":"https://openalex.org/C2776151529","wikidata":"https://www.wikidata.org/wiki/Q3045304","display_name":"Object detection","level":3,"score":0.4810999929904938},{"id":"https://openalex.org/C2781238097","wikidata":"https://www.wikidata.org/wiki/Q175026","display_name":"Object (grammar)","level":2,"score":0.4480000138282776},{"id":"https://openalex.org/C2776436953","wikidata":"https://www.wikidata.org/wiki/Q5163215","display_name":"Consistency (knowledge bases)","level":2,"score":0.4375},{"id":"https://openalex.org/C64754055","wikidata":"https://www.wikidata.org/wiki/Q7574053","display_name":"Spatial contextual awareness","level":2,"score":0.4162999987602234},{"id":"https://openalex.org/C124101348","wikidata":"https://www.wikidata.org/wiki/Q172491","display_name":"Data mining","level":1,"score":0.4032000005245209},{"id":"https://openalex.org/C115961682","wikidata":"https://www.wikidata.org/wiki/Q860623","display_name":"Image (mathematics)","level":2,"score":0.39959999918937683},{"id":"https://openalex.org/C28719098","wikidata":"https://www.wikidata.org/wiki/Q44946","display_name":"Point (geometry)","level":2,"score":0.3944999873638153},{"id":"https://openalex.org/C198531522","wikidata":"https://www.wikidata.org/wiki/Q485146","display_name":"Sample (material)","level":2,"score":0.375},{"id":"https://openalex.org/C115051666","wikidata":"https://www.wikidata.org/wiki/Q6522493","display_name":"Ranging","level":2,"score":0.3587000072002411},{"id":"https://openalex.org/C197513456","wikidata":"https://www.wikidata.org/wiki/Q5610972","display_name":"Ground sample distance","level":3,"score":0.32010000944137573},{"id":"https://openalex.org/C79974875","wikidata":"https://www.wikidata.org/wiki/Q483639","display_name":"Cloud computing","level":2,"score":0.3133000135421753},{"id":"https://openalex.org/C64876066","wikidata":"https://www.wikidata.org/wiki/Q5141226","display_name":"Cognitive neuroscience of visual object recognition","level":3,"score":0.27480000257492065},{"id":"https://openalex.org/C99498987","wikidata":"https://www.wikidata.org/wiki/Q2210247","display_name":"Noise (video)","level":3,"score":0.2632000148296356},{"id":"https://openalex.org/C184337299","wikidata":"https://www.wikidata.org/wiki/Q1437428","display_name":"Semantics (computer science)","level":2,"score":0.26190000772476196},{"id":"https://openalex.org/C67186912","wikidata":"https://www.wikidata.org/wiki/Q367664","display_name":"Data modeling","level":2,"score":0.25839999318122864},{"id":"https://openalex.org/C119857082","wikidata":"https://www.wikidata.org/wiki/Q2539","display_name":"Machine learning","level":1,"score":0.25360000133514404},{"id":"https://openalex.org/C1667742","wikidata":"https://www.wikidata.org/wiki/Q10927554","display_name":"Image retrieval","level":3,"score":0.2524000108242035}],"mesh":[],"locations_count":1,"locations":[{"id":"doi:10.21227/bnwk-hy87","is_oa":true,"landing_page_url":"https://doi.org/10.21227/bnwk-hy87","pdf_url":null,"source":{"id":"https://openalex.org/S7407051695","display_name":"IEEE DataPort","issn_l":null,"issn":null,"is_oa":false,"is_in_doaj":false,"is_core":false,"host_organization":null,"host_organization_name":null,"host_organization_lineage":[],"host_organization_lineage_names":[],"type":"repository"},"license":"cc-by","license_id":"https://openalex.org/licenses/cc-by","version":null,"is_accepted":false,"is_published":null,"raw_source_name":null,"raw_type":"Dataset"}],"best_oa_location":{"id":"doi:10.21227/bnwk-hy87","is_oa":true,"landing_page_url":"https://doi.org/10.21227/bnwk-hy87","pdf_url":null,"source":{"id":"https://openalex.org/S7407051695","display_name":"IEEE DataPort","issn_l":null,"issn":null,"is_oa":false,"is_in_doaj":false,"is_core":false,"host_organization":null,"host_organization_name":null,"host_organization_lineage":[],"host_organization_lineage_names":[],"type":"repository"},"license":"cc-by","license_id":"https://openalex.org/licenses/cc-by","version":null,"is_accepted":false,"is_published":false,"raw_source_name":null,"raw_type":"Dataset"},"sustainable_development_goals":[],"awards":[],"funders":[],"has_content":{"grobid_xml":false,"pdf":false},"content_urls":null,"referenced_works_count":0,"referenced_works":[],"related_works":[],"abstract_inverted_index":{"Data":[0],"augmentation":[1,20,53],"has":[2],"been":[3],"widely":[4],"adopted":[5],"for":[6,62,195],"object":[7,113],"detection":[8],"in":[9,134,147,198],"2D":[10],"image":[11,42,90],"and":[12,29,37,43,73,91,99,145],"3D":[13,112],"point":[14,44,92],"clouds.":[15],"However,":[16],"existing":[17,154],"multimodal":[18,51,111,188],"data":[19,52],"is":[21,32,193],"only":[22],"a":[23,49,70,74],"brief":[24],"reference":[25],"to":[26,33,94,140,179],"single-modal":[27],"work,":[28,181],"the":[30,35,40,80,86,89,96,103,107,118,138,182,187,199],"challenge":[31],"ensure":[34],"consistency":[36],"rationality":[38],"of":[39,88,102,109,190],"augmented":[41],"cloud":[45,93],"simultaneously.":[46],"We":[47,67,105],"propose":[48],"novel":[50],"method":[54,152],"based":[55,78],"on":[56,79,117,165],"ground":[57,76],"truth":[58],"sampling":[59,133,156],"(GT":[60],"sampling)":[61],"generating":[63],"content-rich":[64],"synthetic":[65],"scenes.&nbsp;":[66],"first":[68],"built":[69],"GT":[71,132,155],"database":[72,77],"scene":[75],"raw":[81,135],"training":[82,115,149],"set,":[83],"then":[84],"used":[85],"context":[87,189],"guide":[95],"paste":[97],"location":[98],"filtering":[100,146],"strategy":[101,116,174],"samples.":[104],"demonstrate":[106],"effectiveness":[108],"this":[110],"detector":[114],"publicly":[119],"available":[120],"KITTI":[121],"dataset.":[122],"Our":[123,151],"experiments":[124],"evaluated":[125],"different":[126],"superimposition":[127],"strategies":[128],"ranging":[129],"from":[130],"context-free":[131],"scenes,":[136],"all":[137],"way":[139],"context-guided":[141],"semantics":[142],"informed":[143],"positioning":[144],"new":[148],"scenes.":[150],"outperforms":[153],"methods":[157],"with":[158],"more":[159],"than":[160],"15%":[161],"relative":[162],"performance":[163,184],"improvement":[164],"benchmark":[166],"datasets.":[167],"In":[168],"ablation":[169],"studies,":[170],"our":[171],"sample":[172],"pasting":[173],"brings":[175],"+2.81%":[176],"gain":[177],"compared":[178],"previous":[180],"superior":[183],"demonstrates":[185],"that":[186],"modeled":[191],"objects":[192],"crucial":[194],"placing":[196],"them":[197],"correct":[200],"environment.":[201]},"counts_by_year":[],"updated_date":"2026-07-01T06:00:48.157686","created_date":"2025-10-10T00:00:00"}