{"id":"https://openalex.org/W2584749081","doi":"https://doi.org/10.1142/s0218001417550138","title":"Scene Categorization Through Using Objects Represented by Deep Features","display_name":"Scene Categorization Through Using Objects Represented by Deep Features","publication_year":2017,"publication_date":"2017-02-01","ids":{"openalex":"https://openalex.org/W2584749081","doi":"https://doi.org/10.1142/s0218001417550138","mag":"2584749081"},"language":"en","primary_location":{"id":"doi:10.1142/s0218001417550138","is_oa":false,"landing_page_url":"https://doi.org/10.1142/s0218001417550138","pdf_url":null,"source":{"id":"https://openalex.org/S41486457","display_name":"International Journal of Pattern Recognition and Artificial Intelligence","issn_l":"0218-0014","issn":["0218-0014","1793-6381"],"is_oa":false,"is_in_doaj":false,"is_core":true,"host_organization":"https://openalex.org/P4310319815","host_organization_name":"World Scientific","host_organization_lineage":["https://openalex.org/P4310319815"],"host_organization_lineage_names":["World Scientific"],"type":"journal"},"license":null,"license_id":null,"version":"publishedVersion","is_accepted":true,"is_published":true,"raw_source_name":"International Journal of Pattern Recognition and Artificial Intelligence","raw_type":"journal-article"},"type":"article","indexed_in":["crossref"],"open_access":{"is_oa":false,"oa_status":"closed","oa_url":null,"any_repository_has_fulltext":false},"authorships":[{"author_position":"first","author":{"id":"https://openalex.org/A5100955332","display_name":"Shuang Bai","orcid":"https://orcid.org/0009-0003-8376-5964"},"institutions":[{"id":"https://openalex.org/I21193070","display_name":"Beijing Jiaotong University","ror":"https://ror.org/01yj56c84","country_code":"CN","type":"education","lineage":["https://openalex.org/I21193070"]}],"countries":["CN"],"is_corresponding":true,"raw_author_name":"Shuang Bai","raw_affiliation_strings":["School of Electronic and Information Engineering, Beijing Jiaotong University, No.3 Shang Yuan Cun, Hai Dian District, Beijing, P. R. China"],"affiliations":[{"raw_affiliation_string":"School of Electronic and Information Engineering, Beijing Jiaotong University, No.3 Shang Yuan Cun, Hai Dian District, Beijing, P. R. China","institution_ids":["https://openalex.org/I21193070"]}]}],"institutions":[],"countries_distinct_count":1,"institutions_distinct_count":1,"corresponding_author_ids":["https://openalex.org/A5100955332"],"corresponding_institution_ids":["https://openalex.org/I21193070"],"apc_list":null,"apc_paid":null,"fwci":0.6372,"has_fulltext":false,"cited_by_count":16,"citation_normalized_percentile":{"value":0.77347756,"is_in_top_1_percent":false,"is_in_top_10_percent":false},"cited_by_percentile_year":{"min":89,"max":97},"biblio":{"volume":"31","issue":"09","first_page":"1755013","last_page":"1755013"},"is_retracted":false,"is_paratext":false,"is_xpac":false,"primary_topic":{"id":"https://openalex.org/T10627","display_name":"Advanced Image and Video Retrieval Techniques","score":0.9997000098228455,"subfield":{"id":"https://openalex.org/subfields/1707","display_name":"Computer Vision and Pattern Recognition"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},"topics":[{"id":"https://openalex.org/T10627","display_name":"Advanced Image and Video Retrieval Techniques","score":0.9997000098228455,"subfield":{"id":"https://openalex.org/subfields/1707","display_name":"Computer Vision and Pattern Recognition"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T10036","display_name":"Advanced Neural Network Applications","score":0.9983000159263611,"subfield":{"id":"https://openalex.org/subfields/1707","display_name":"Computer Vision and Pattern Recognition"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T10331","display_name":"Video Surveillance and Tracking Methods","score":0.9969000220298767,"subfield":{"id":"https://openalex.org/subfields/1707","display_name":"Computer Vision and Pattern Recognition"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}}],"keywords":[{"id":"https://openalex.org/keywords/artificial-intelligence","display_name":"Artificial intelligence","score":0.8304345607757568},{"id":"https://openalex.org/keywords/discriminative-model","display_name":"Discriminative model","score":0.8263900279998779},{"id":"https://openalex.org/keywords/computer-science","display_name":"Computer science","score":0.7626072764396667},{"id":"https://openalex.org/keywords/categorization","display_name":"Categorization","score":0.7548336386680603},{"id":"https://openalex.org/keywords/convolutional-neural-network","display_name":"Convolutional neural network","score":0.6762644052505493},{"id":"https://openalex.org/keywords/object","display_name":"Object (grammar)","score":0.655515193939209},{"id":"https://openalex.org/keywords/initialization","display_name":"Initialization","score":0.6509644985198975},{"id":"https://openalex.org/keywords/pattern-recognition","display_name":"Pattern recognition (psychology)","score":0.5708993673324585},{"id":"https://openalex.org/keywords/support-vector-machine","display_name":"Support vector machine","score":0.5392031073570251},{"id":"https://openalex.org/keywords/scene-statistics","display_name":"Scene statistics","score":0.5380216836929321},{"id":"https://openalex.org/keywords/set","display_name":"Set (abstract data type)","score":0.5289649367332458},{"id":"https://openalex.org/keywords/cognitive-neuroscience-of-visual-object-recognition","display_name":"Cognitive neuroscience of visual object recognition","score":0.47718942165374756},{"id":"https://openalex.org/keywords/computer-vision","display_name":"Computer vision","score":0.46233201026916504},{"id":"https://openalex.org/keywords/deep-learning","display_name":"Deep learning","score":0.4458671808242798},{"id":"https://openalex.org/keywords/object-detection","display_name":"Object detection","score":0.4323594570159912}],"concepts":[{"id":"https://openalex.org/C154945302","wikidata":"https://www.wikidata.org/wiki/Q11660","display_name":"Artificial intelligence","level":1,"score":0.8304345607757568},{"id":"https://openalex.org/C97931131","wikidata":"https://www.wikidata.org/wiki/Q5282087","display_name":"Discriminative model","level":2,"score":0.8263900279998779},{"id":"https://openalex.org/C41008148","wikidata":"https://www.wikidata.org/wiki/Q21198","display_name":"Computer science","level":0,"score":0.7626072764396667},{"id":"https://openalex.org/C94124525","wikidata":"https://www.wikidata.org/wiki/Q912550","display_name":"Categorization","level":2,"score":0.7548336386680603},{"id":"https://openalex.org/C81363708","wikidata":"https://www.wikidata.org/wiki/Q17084460","display_name":"Convolutional neural network","level":2,"score":0.6762644052505493},{"id":"https://openalex.org/C2781238097","wikidata":"https://www.wikidata.org/wiki/Q175026","display_name":"Object (grammar)","level":2,"score":0.655515193939209},{"id":"https://openalex.org/C114466953","wikidata":"https://www.wikidata.org/wiki/Q6034165","display_name":"Initialization","level":2,"score":0.6509644985198975},{"id":"https://openalex.org/C153180895","wikidata":"https://www.wikidata.org/wiki/Q7148389","display_name":"Pattern recognition (psychology)","level":2,"score":0.5708993673324585},{"id":"https://openalex.org/C12267149","wikidata":"https://www.wikidata.org/wiki/Q282453","display_name":"Support vector machine","level":2,"score":0.5392031073570251},{"id":"https://openalex.org/C197654239","wikidata":"https://www.wikidata.org/wiki/Q7430757","display_name":"Scene statistics","level":3,"score":0.5380216836929321},{"id":"https://openalex.org/C177264268","wikidata":"https://www.wikidata.org/wiki/Q1514741","display_name":"Set (abstract data type)","level":2,"score":0.5289649367332458},{"id":"https://openalex.org/C64876066","wikidata":"https://www.wikidata.org/wiki/Q5141226","display_name":"Cognitive neuroscience of visual object recognition","level":3,"score":0.47718942165374756},{"id":"https://openalex.org/C31972630","wikidata":"https://www.wikidata.org/wiki/Q844240","display_name":"Computer vision","level":1,"score":0.46233201026916504},{"id":"https://openalex.org/C108583219","wikidata":"https://www.wikidata.org/wiki/Q197536","display_name":"Deep learning","level":2,"score":0.4458671808242798},{"id":"https://openalex.org/C2776151529","wikidata":"https://www.wikidata.org/wiki/Q3045304","display_name":"Object detection","level":3,"score":0.4323594570159912},{"id":"https://openalex.org/C26760741","wikidata":"https://www.wikidata.org/wiki/Q160402","display_name":"Perception","level":2,"score":0.0},{"id":"https://openalex.org/C86803240","wikidata":"https://www.wikidata.org/wiki/Q420","display_name":"Biology","level":0,"score":0.0},{"id":"https://openalex.org/C169760540","wikidata":"https://www.wikidata.org/wiki/Q207011","display_name":"Neuroscience","level":1,"score":0.0},{"id":"https://openalex.org/C199360897","wikidata":"https://www.wikidata.org/wiki/Q9143","display_name":"Programming language","level":1,"score":0.0}],"mesh":[],"locations_count":1,"locations":[{"id":"doi:10.1142/s0218001417550138","is_oa":false,"landing_page_url":"https://doi.org/10.1142/s0218001417550138","pdf_url":null,"source":{"id":"https://openalex.org/S41486457","display_name":"International Journal of Pattern Recognition and Artificial Intelligence","issn_l":"0218-0014","issn":["0218-0014","1793-6381"],"is_oa":false,"is_in_doaj":false,"is_core":true,"host_organization":"https://openalex.org/P4310319815","host_organization_name":"World Scientific","host_organization_lineage":["https://openalex.org/P4310319815"],"host_organization_lineage_names":["World Scientific"],"type":"journal"},"license":null,"license_id":null,"version":"publishedVersion","is_accepted":true,"is_published":true,"raw_source_name":"International Journal of Pattern Recognition and Artificial Intelligence","raw_type":"journal-article"}],"best_oa_location":null,"sustainable_development_goals":[{"score":0.75,"display_name":"Reduced inequalities","id":"https://metadata.un.org/sdg/10"}],"awards":[{"id":"https://openalex.org/G1895760391","display_name":null,"funder_award_id":"61602027","funder_id":"https://openalex.org/F4320321001","funder_display_name":"National Natural Science Foundation of China"}],"funders":[{"id":"https://openalex.org/F4320321001","display_name":"National Natural Science Foundation of China","ror":"https://ror.org/01h0zpd94"}],"has_content":{"pdf":false,"grobid_xml":false},"content_urls":null,"referenced_works_count":45,"referenced_works":["https://openalex.org/W1423339008","https://openalex.org/W1566135517","https://openalex.org/W1686810756","https://openalex.org/W1789705271","https://openalex.org/W1964491636","https://openalex.org/W1966385142","https://openalex.org/W2015861736","https://openalex.org/W2017814585","https://openalex.org/W2022508996","https://openalex.org/W2028930140","https://openalex.org/W2048852482","https://openalex.org/W2063756240","https://openalex.org/W2084435358","https://openalex.org/W2090042335","https://openalex.org/W2094618318","https://openalex.org/W2097117768","https://openalex.org/W2099528205","https://openalex.org/W2100495367","https://openalex.org/W2102605133","https://openalex.org/W2107698128","https://openalex.org/W2108598243","https://openalex.org/W2113855951","https://openalex.org/W2115628259","https://openalex.org/W2118585731","https://openalex.org/W2119853387","https://openalex.org/W2130306094","https://openalex.org/W2130325614","https://openalex.org/W2133014420","https://openalex.org/W2134670479","https://openalex.org/W2136922672","https://openalex.org/W2137880010","https://openalex.org/W2139427956","https://openalex.org/W2145406111","https://openalex.org/W2147196093","https://openalex.org/W2147625498","https://openalex.org/W2147800946","https://openalex.org/W2152161678","https://openalex.org/W2155284717","https://openalex.org/W2155541015","https://openalex.org/W2160815625","https://openalex.org/W2162915993","https://openalex.org/W2167828171","https://openalex.org/W2168356304","https://openalex.org/W2169177311","https://openalex.org/W4231109964"],"related_works":["https://openalex.org/W3204184292","https://openalex.org/W3176564347","https://openalex.org/W1985458517","https://openalex.org/W2355833770","https://openalex.org/W3031039437","https://openalex.org/W3095877357","https://openalex.org/W4387272257","https://openalex.org/W2573606541","https://openalex.org/W3044455866","https://openalex.org/W2053410789"],"abstract_inverted_index":{"Objects":[0],"in":[1,93,130],"scenes":[2],"are":[3,115,157],"thought":[4],"to":[5,16,40,69,88,167,173,191,211],"be":[6,162],"important":[7],"for":[8,24,48,105,147,204],"scene":[9,25,50,107,149,169,196,205],"recognition.":[10],"In":[11,171],"this":[12],"paper,":[13],"we":[14,53,180,207],"propose":[15],"utilize":[17,174],"scene-specific":[18,45,102,112],"objects":[19,200],"represented":[20],"by":[21,117],"deep":[22,32,56],"features":[23,73,90],"categorization.":[26,170],"Our":[27],"approach":[28],"combines":[29],"benefits":[30],"of":[31,44,78,101,128,153,178,195,228],"learning":[33,100],"and":[34,74,97,125,134,159,201,221],"Latent":[35],"Support":[36],"Vector":[37],"Machine":[38],"(LSVM)":[39],"train":[41],"a":[42,75,145,151],"set":[43,152],"object":[46,72,80,103,113,154],"models":[47,104,114,155],"each":[49,106,148],"category.":[51,108],"Specifically,":[52],"first":[54],"use":[55,165,181],"Convolutional":[57],"Neural":[58],"Networks":[59],"(CNNs)":[60],"pre-trained":[61,84,184],"on":[62,140,185,214],"the":[63,83,94,99,111,122,131,186,226,229],"large-scale":[64,187],"object-centric":[65],"image":[66],"database":[67,189],"ImageNet":[68],"learn":[70],"rich":[71],"large":[76],"number":[77],"general":[79],"concepts.":[81],"Then,":[82],"CNNs":[85,183],"is":[86],"adopted":[87],"extract":[89],"from":[91],"images":[92,129],"target":[95,132],"dataset,":[96],"initialize":[98],"After":[109],"initialization,":[110],"obtained":[116,141],"alternating":[118],"between":[119],"searching":[120],"over":[121],"most":[123],"representative":[124,158],"discriminative":[126,160],"regions":[127],"dataset":[133],"training":[135],"linear":[136],"SVM":[137],"classifiers":[138],"based":[139],"region":[142],"features.":[143],"As":[144],"result,":[146],"category":[150],"that":[156],"can":[161],"acquired.":[163],"We":[164],"them":[166],"perform":[168],"addition,":[172],"global":[175],"structure":[176,193,202],"information":[177,194,203],"scenes,":[179],"another":[182],"scene-centric":[188],"Places":[190],"capture":[192],"images.":[197],"By":[198],"combining":[199],"categorization,":[206],"show":[208],"superior":[209],"performances":[210],"state-of-the-art":[212],"approaches":[213],"three":[215],"public":[216],"datasets,":[217],"i.e.":[218],"MIT-indoor,":[219],"UIUC-sports":[220],"SUN.":[222],"Experiment":[223],"results":[224],"demonstrated":[225],"effectiveness":[227],"proposed":[230],"method.":[231]},"counts_by_year":[{"year":2024,"cited_by_count":2},{"year":2023,"cited_by_count":1},{"year":2022,"cited_by_count":4},{"year":2021,"cited_by_count":2},{"year":2020,"cited_by_count":3},{"year":2019,"cited_by_count":1},{"year":2018,"cited_by_count":3}],"updated_date":"2025-11-06T03:46:38.306776","created_date":"2025-10-10T00:00:00"}