{"id":"https://openalex.org/W7134965909","doi":"https://doi.org/10.1109/icdmw69685.2025.00205","title":"Attribution Quality in AI-Generated Content: Benchmarking Style Embeddings and LLM Judges","display_name":"Attribution Quality in AI-Generated Content: Benchmarking Style Embeddings and LLM Judges","publication_year":2025,"publication_date":"2025-11-12","ids":{"openalex":"https://openalex.org/W7134965909","doi":"https://doi.org/10.1109/icdmw69685.2025.00205"},"language":null,"primary_location":{"id":"doi:10.1109/icdmw69685.2025.00205","is_oa":false,"landing_page_url":"https://doi.org/10.1109/icdmw69685.2025.00205","pdf_url":null,"source":null,"license":null,"license_id":null,"version":"publishedVersion","is_accepted":true,"is_published":true,"raw_source_name":"2025 IEEE International Conference on Data Mining Workshops (ICDMW)","raw_type":"proceedings-article"},"type":"article","indexed_in":["arxiv","crossref"],"open_access":{"is_oa":true,"oa_status":"green","oa_url":"https://arxiv.org/pdf/2510.13898","any_repository_has_fulltext":true},"authorships":[{"author_position":"first","author":{"id":"https://openalex.org/A5128698227","display_name":"Misam Abbas","orcid":null},"institutions":[],"countries":[],"is_corresponding":true,"raw_author_name":"Misam Abbas","raw_affiliation_strings":[],"affiliations":[]}],"institutions":[],"countries_distinct_count":0,"institutions_distinct_count":1,"corresponding_author_ids":["https://openalex.org/A5128698227"],"corresponding_institution_ids":[],"apc_list":null,"apc_paid":null,"fwci":0.0,"has_fulltext":true,"cited_by_count":0,"citation_normalized_percentile":{"value":0.87752043,"is_in_top_1_percent":false,"is_in_top_10_percent":false},"cited_by_percentile_year":null,"biblio":{"volume":null,"issue":null,"first_page":"1713","last_page":"1720"},"is_retracted":false,"is_paratext":false,"is_xpac":false,"primary_topic":{"id":"https://openalex.org/T10028","display_name":"Topic Modeling","score":0.5511999726295471,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},"topics":[{"id":"https://openalex.org/T10028","display_name":"Topic Modeling","score":0.5511999726295471,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T12380","display_name":"Authorship Attribution and Profiling","score":0.10840000212192535,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T13910","display_name":"Computational and Text Analysis Methods","score":0.026900000870227814,"subfield":{"id":"https://openalex.org/subfields/3300","display_name":"General Social Sciences"},"field":{"id":"https://openalex.org/fields/33","display_name":"Social Sciences"},"domain":{"id":"https://openalex.org/domains/2","display_name":"Social Sciences"}}],"keywords":[{"id":"https://openalex.org/keywords/quality","display_name":"Quality (philosophy)","score":0.6452999711036682},{"id":"https://openalex.org/keywords/attribution","display_name":"Attribution","score":0.6349999904632568},{"id":"https://openalex.org/keywords/benchmarking","display_name":"Benchmarking","score":0.6262999773025513},{"id":"https://openalex.org/keywords/style","display_name":"Style (visual arts)","score":0.6261000037193298},{"id":"https://openalex.org/keywords/measure","display_name":"Measure (data warehouse)","score":0.3287999927997589}],"concepts":[{"id":"https://openalex.org/C2779530757","wikidata":"https://www.wikidata.org/wiki/Q1207505","display_name":"Quality (philosophy)","level":2,"score":0.6452999711036682},{"id":"https://openalex.org/C143299363","wikidata":"https://www.wikidata.org/wiki/Q900584","display_name":"Attribution","level":2,"score":0.6349999904632568},{"id":"https://openalex.org/C86251818","wikidata":"https://www.wikidata.org/wiki/Q816754","display_name":"Benchmarking","level":2,"score":0.6262999773025513},{"id":"https://openalex.org/C2776445246","wikidata":"https://www.wikidata.org/wiki/Q1792644","display_name":"Style (visual arts)","level":2,"score":0.6261000037193298},{"id":"https://openalex.org/C15744967","wikidata":"https://www.wikidata.org/wiki/Q9418","display_name":"Psychology","level":0,"score":0.5174999833106995},{"id":"https://openalex.org/C77805123","wikidata":"https://www.wikidata.org/wiki/Q161272","display_name":"Social psychology","level":1,"score":0.4300999939441681},{"id":"https://openalex.org/C41008148","wikidata":"https://www.wikidata.org/wiki/Q21198","display_name":"Computer science","level":0,"score":0.398499995470047},{"id":"https://openalex.org/C2780009758","wikidata":"https://www.wikidata.org/wiki/Q6804172","display_name":"Measure (data warehouse)","level":2,"score":0.3287999927997589},{"id":"https://openalex.org/C180747234","wikidata":"https://www.wikidata.org/wiki/Q23373","display_name":"Cognitive psychology","level":1,"score":0.31619998812675476},{"id":"https://openalex.org/C154945302","wikidata":"https://www.wikidata.org/wiki/Q11660","display_name":"Artificial intelligence","level":1,"score":0.31380000710487366},{"id":"https://openalex.org/C204321447","wikidata":"https://www.wikidata.org/wiki/Q30642","display_name":"Natural language processing","level":1,"score":0.26660001277923584},{"id":"https://openalex.org/C2777146004","wikidata":"https://www.wikidata.org/wiki/Q14949826","display_name":"CLARITY","level":2,"score":0.2621000111103058},{"id":"https://openalex.org/C2779332521","wikidata":"https://www.wikidata.org/wiki/Q1820694","display_name":"Legibility","level":2,"score":0.258899986743927},{"id":"https://openalex.org/C61797465","wikidata":"https://www.wikidata.org/wiki/Q1188986","display_name":"Term (time)","level":2,"score":0.2572000026702881},{"id":"https://openalex.org/C75630572","wikidata":"https://www.wikidata.org/wiki/Q538904","display_name":"Applied psychology","level":1,"score":0.2502000033855438}],"mesh":[],"locations_count":2,"locations":[{"id":"doi:10.1109/icdmw69685.2025.00205","is_oa":false,"landing_page_url":"https://doi.org/10.1109/icdmw69685.2025.00205","pdf_url":null,"source":null,"license":null,"license_id":null,"version":"publishedVersion","is_accepted":true,"is_published":true,"raw_source_name":"2025 IEEE International Conference on Data Mining Workshops (ICDMW)","raw_type":"proceedings-article"},{"id":"pmh:oai:arXiv.org:2510.13898","is_oa":true,"landing_page_url":"http://arxiv.org/abs/2510.13898","pdf_url":"https://arxiv.org/pdf/2510.13898","source":{"id":"https://openalex.org/S4393918464","display_name":"ArXiv.org","issn_l":"2331-8422","issn":["2331-8422"],"is_oa":true,"is_in_doaj":false,"is_core":false,"host_organization":null,"host_organization_name":null,"host_organization_lineage":[],"host_organization_lineage_names":[],"type":"repository"},"license":"public-domain","license_id":"https://openalex.org/licenses/public-domain","version":"submittedVersion","is_accepted":false,"is_published":false,"raw_source_name":null,"raw_type":"text"}],"best_oa_location":{"id":"pmh:oai:arXiv.org:2510.13898","is_oa":true,"landing_page_url":"http://arxiv.org/abs/2510.13898","pdf_url":"https://arxiv.org/pdf/2510.13898","source":{"id":"https://openalex.org/S4393918464","display_name":"ArXiv.org","issn_l":"2331-8422","issn":["2331-8422"],"is_oa":true,"is_in_doaj":false,"is_core":false,"host_organization":null,"host_organization_name":null,"host_organization_lineage":[],"host_organization_lineage_names":[],"type":"repository"},"license":"public-domain","license_id":"https://openalex.org/licenses/public-domain","version":"submittedVersion","is_accepted":false,"is_published":false,"raw_source_name":null,"raw_type":"text"},"sustainable_development_goals":[],"awards":[],"funders":[],"has_content":{"pdf":true,"grobid_xml":true},"content_urls":{"pdf":"https://content.openalex.org/works/W7134965909.pdf","grobid_xml":"https://content.openalex.org/works/W7134965909.grobid-xml"},"referenced_works_count":9,"referenced_works":["https://openalex.org/W2093585241","https://openalex.org/W2167277498","https://openalex.org/W2170505850","https://openalex.org/W2171590421","https://openalex.org/W3121596465","https://openalex.org/W4223992738","https://openalex.org/W4324046518","https://openalex.org/W4407695356","https://openalex.org/W7126413578"],"related_works":[],"abstract_inverted_index":{"Attributing":[0],"authorship":[1],"in":[2,126,137,163,194,216],"the":[3,33,102,114,121,174,180,207,212],"era":[4],"of":[5,203],"large":[6],"language":[7],"models":[8],"(LLMs)":[9],"is":[10,98],"increasingly":[11],"challenging":[12],"as":[13,150],"machine-generated":[14],"prose":[15],"rivals":[16],"human":[17,63],"writing.":[18],"We":[19,171,197],"benchmark":[20,189],"two":[21],"complementary":[22,146],"attribution":[23,149,191],"mechanisms\u2014fixed":[24],"Style":[25,80,103],"Embeddings":[26],"and":[27,56,70,128,139,166,176,214],"an":[28,37,71],"instruction-tuned":[29],"LLM":[30,96,122],"judge":[31,123],"(GPT-40)\u2014on":[32],"Human-AI":[34],"Parallel":[35],"Corpus,":[36],"open":[38,184],"dataset":[39,175],"from":[40,74],"which":[41],"we":[42,160],"choose":[43],"600":[44],"balanced":[45],"instances":[46],"spanning":[47],"six":[48],"domains":[49],"(academic,":[50],"news,":[51],"fiction,":[52],"blogs,":[53],"spoken":[54,138],"transcripts,":[55],"TV/movie":[57],"scripts).":[58],"Each":[59],"instance":[60],"contains":[61],"a":[62,67,151,187,200],"prompt":[64],"with":[65],"both":[66,173],"gold":[68],"continuation":[69,73],"LLM-generated":[72],"either":[75],"GPT-40":[76],"or":[77],"LLAMA-70B-Instruct.":[78],"The":[79,95],"Embedding":[81],"baseline":[82],"achieves":[83],"stronger":[84],"aggregate":[85],"accuracy":[86],"on":[87,105,169],"GPT":[88],"continuations":[89,107],"(82":[90],"%":[91,109],"vs.":[92,110],"68":[93],"%).":[94],"Judge":[97],"slightly":[99],"better":[100],"than":[101],"embeddings":[104,135],"LLaMA":[106],"(85":[108],"81":[111],"%)":[112],"but":[113],"results":[115,215],"are":[116],"not":[117],"statistically":[118],"significant.":[119],"Crucially,":[120],"significantly":[124],"outperforms":[125],"fiction":[127],"academic":[129],"prose,":[130],"indicating":[131],"semantic":[132],"sensitivity,":[133],"whereas":[134],"dominate":[136],"scripted":[140],"dialogue,":[141],"reflecting":[142],"structural":[143],"strengths.":[144],"These":[145],"patterns":[147],"highlight":[148],"multidimensional":[152],"problem":[153],"requiring":[154],"hybrid":[155],"strategies.":[156],"To":[157],"support":[158],"reproducibility":[159],"provide":[161,199],"code":[162,178],"GitHub":[164],"repositories":[165],"derived":[167],"data":[168],"Huggingface.":[170],"release":[172],"source":[177],"under":[179],"MIT":[181],"license.":[182],"This":[183],"framework":[185,213],"provides":[186],"reproducible":[188],"for":[190],"quality":[192],"assessment":[193],"AI-generated":[195],"content.":[196],"also":[198],"thorough":[201],"review":[202],"prior":[204],"literature":[205],"particularly":[206],"papers":[208],"that":[209],"directly":[210],"influenced":[211],"this":[217],"paper.":[218]},"counts_by_year":[],"updated_date":"2026-03-22T08:09:32.410652","created_date":"2026-03-12T00:00:00"}