Modelos de grafos para la detección de datos de texto no estructurados como el sarcasmo
Palabras clave:
Datos no estructurados, lenguaje de procesamiento natural (NLP), sarcasmo, modelo de grafoResumen
El sarcasmo se define a menudo como una ironía verbal para expresar desprecio, un lenguaje matizado con el que los individuos expresan lo contrario de lo que está implícito. Uno de los mayores retos en la construcción de sistemas para detectar los datos no estructurados como el sarcasmo, es la falta de grandes conjuntos de datos anotados. Proponemos un método basado en grafos para la construcción de modelos de lenguaje compacto para la detección del sarcasmo. Este método está diseñado para usar pocos datos, y podría ayudar a detectar fake news, hate speech, etc. Permite además a los investigadores analizar otros aspectos del NLP sin tener que obtener un conjunto de datos gigante. Hoy en día, sigue siendo un desafío identificar claramente los sentimientos y emociones humanos mediante el uso de Inteligencia Artificial. Una exploración detallada de nuestra investigación elevaría las aplicaciones actuales de minería de textos y podría ayudar a comprender mejor el impacto del sarcasmo de los clientes y las partes interesadas, expresado en un entorno de redes sociales. Demostramos que los clasificadores simples construidos a partir del modelo pueden detectar bastante bien el sarcasmo, que generalizan un 5% mejor que los del estado del arte.
Descargas
Referencias
E. Riloff, A. Qadir, P. Surve, L. De Silva, N. Gilbert, and R. Huang, “Sarcasm as contrast between a positive sentiment and negative situation,” in Proceedings of the 2013 conference on empirical methods in natural language processing, pp. 704–714, 2013.
D. Davidov, O. Tsur, and A. Rappoport, “Semi-supervised recognition of sarcasm in twitter and amazon,” in Proceedings of the fourteenth conference on computational natural language learning, pp. 107–116, 2010.
A. Reyes, P. Rosso, and D. Buscaldi, “From humor recognition to irony detection: The figurative language of social media,” Data & Knowledge Engineering, vol. 74, pp. 1–12, 2012.
A. Ghosh, G. Li, T. Veale, P. Rosso, E. Shutova, J. Barnden, and A. Reyes, “Semeval-2015 task 11: Sentiment analysis of figurative language in twitter,” in Proceedings of the 9th international workshop on semantic evaluation (SemEval 2015), pp. 470–478, 2015.
C. Liebrecht, F. Kunneman, and A. van Den Bosch, “The perfect solution for detecting sarcasm in tweets# not,” 2013.
F. Barbieri, H. Saggion, and F. Ronzano, “Modelling sarcasm in twitter, a novel approach,” in Proceedings of the 5th Workshop on Computatio- nal Approaches to Subjectivity, Sentiment and Social Media Analysis, pp. 50–58, 2014.
G. Abercrombie and D. Hovy, “Putting sarcasm detection into context: The effects of class imbalance and manual labelling on supervised machine classification of twitter conversations,” in Proceedings of the ACL 2016 student research workshop, pp. 107–113, 2016.
F. Barbieri, F. Ronzano, and H. Saggion, “Italian irony detection in twit- ter: a first approach,” in The First Italian Conference on Computational Linguistics CLiC-it, vol. 28, 2014.
S. K. Bharti, K. S. Babu, and S. K. Jena, “Parsing-based sarcasm sentiment recognition in twitter data,” in 2015 IEEE/ACM International Conference on Advances in Social Networks Analysis and Mining (ASONAM), pp. 1373–1380, IEEE, 2015.
S. Lukin and M. Walker, “Really? well. apparently bootstrapping im- proves the performance of sarcasm and nastiness classifiers for online dialogue,” arXiv preprint arXiv:1708.08572, 2017.
A. Reyes and P. Rosso, “On the difficulty of automatically detecting irony: beyond a simple case of negation,” Knowledge and Information Systems, vol. 40, no. 3, pp. 595–614, 2014.
E. Filatova, “Irony and sarcasm: Corpus generation and analysis using crowdsourcing.,” in Lrec, pp. 392–398, Citeseer, 2012.
K. Buschmeier, P. Cimiano, and R. Klinger, “An impact analysis of fea- tures in a classification approach to irony detection in product reviews,” in Proceedings of the 5th Workshop on Computational Approaches to Subjectivity, Sentiment and Social Media Analysis, pp. 42–49, 2014.
O. Tsur, D. Davidov, and A. Rappoport, “Icwsm—a great catchy name: Semi-supervised recognition of sarcastic sentences in online product reviews,” in fourth international AAAI conference on weblogs and social media, 2010.
P. Liu, W. Chen, G. Ou, T. Wang, D. Yang, and K. Lei, “Sarcasm detection in social media based on imbalanced classification,” in Interna- tional Conference on Web-Age Information Management, pp. 459–471, Springer, 2014.
J. Tepperman, D. Traum, and S. Narayanan, “” yeah right”: Sarcasm recognition for spoken dialogue systems,” in Ninth international confe- rence on spoken language processing, 2006.
R. Rakov and A. Rosenberg, “” sure, i did the right thing”: a system for sarcasm detection in speech.,” in Interspeech, pp. 842–846, 2013.
A. Joshi, V. Tripathi, P. Bhattacharyya, and M. Carman, “Harnessing sequence labeling for sarcasm detection in dialogue from tv series ‘friends’,” in Proceedings of The 20th SIGNLL Conference on Compu- tational Natural Language Learning, pp. 146–155, 2016.
A. Rajadesingan, R. Zafarani, and H. Liu, “Sarcasm detection on twitter: A behavioral modeling approach,” in Proceedings of the eighth ACM international conference on web search and data mining, pp. 97–106, 2015.
D. Hazarika, S. Poria, S. Gorantla, E. Cambria, R. Zimmermann, and R. Mihalcea, “Cascade: Contextual sarcasm detection in online discussion forums,” arXiv preprint arXiv:1805.06413, 2018.
D. Bamman and N. A. Smith, “Contextualized sarcasm detection on twitter,” in Ninth International AAAI Conference on Web and Social Media, 2015.
A. Joshi, V. Sharma, and P. Bhattacharyya, “Harnessing context in- congruity for sarcasm detection,” in Proceedings of the 53rd Annual Meeting of the Association for Computational Linguistics and the 7th International Joint Conference on Natural Language Processing (Volume 2: Short Papers), pp. 757–762, 2015.
B. C. Wallace, E. Charniak, et al., “Sparse, contextually informed models for irony detection: Exploiting user communities, entities and sentiment,” in Proceedings of the 53rd Annual Meeting of the Association for Computational Linguistics and the 7th International Joint Conference on Natural Language Processing (Volume 1: Long Papers), pp. 1035– 1044, 2015.
Z. Wang, Z. Wu, R. Wang, and Y. Ren, “Twitter sarcasm detection exploiting a context-based model,” in international conference on web information systems engineering, pp. 77–91, Springer, 2015.
A. Joshi, P. Jain, P. Bhattacharyya, and M. Carman, “Who would have thought of that!’: A hierarchical topic model for extraction of sarcasm-prevalent topics and sarcasm detection,” arXiv preprint ar- Xiv:1611.04326, 2016.
R. Gonza´lez-Ibánez, S. Muresan, and N. Wacholder, “Identifying sarcasm in twitter: a closer look,” in Proceedings of the 49th Annual Meeting of the Association for Computational Linguistics: Human Language Technologies, pp. 581–586, 2011.
A. Reyes and P. Rosso, “Making objective decisions from subjective data: Detecting irony in customer reviews,” Decision support systems, vol. 53, no. 4, pp. 754–760, 2012.
R. Kreuz and G. Caucci, “Lexical influences on the perception of sarcasm,” in Proceedings of the Workshop on computational approaches to Figurative Language, pp. 1–4, 2007.
A. M. Founta, D. Chatzakou, N. Kourtellis, J. Blackburn, A. Vakali, and I. Leontiadis, “A unified deep learning architecture for abuse detection,” in Proceedings of the 10th ACM Conference on Web Science, pp. 105– 114, 2019.
B. Felbo, A. Mislove, A. Søgaard, I. Rahwan, and S. Lehmann, “Using millions of emoji occurrences to learn any-domain represen- tations for detecting sentiment, emotion and sarcasm,” arXiv preprint arXiv:1708.00524, 2017.
A. Joshi, V. Tripathi, K. Patel, P. Bhattacharyya, and M. Carman, “Are word embedding-based features useful for sarcasm detection?,” arXiv preprint arXiv:1610.00883, 2016.
D. Paranyushkin, “Identifying the pathways for meaning circulation using text network analysis,” Nodus Labs, vol. 26, 2011.
C. Argueta, E. Saravia, and Y.-S. Chen, “Unsupervised graph-based pat- terns extraction for emotion classification,” in Proceedings of the 2015 IEEE/ACM International Conference on Advances in Social Networks Analysis and Mining 2015, pp. 336–341, 2015.
B. Perozzi, R. Al-Rfou, and S. Skiena, “Deepwalk: Online learning of social representations,” in Proceedings of the 20th ACM SIGKDD international conference on Knowledge discovery and data mining, pp. 701–710, 2014.
T. Mikolov, K. Chen, G. Corrado, and J. Dean, “Efficient estimation of word representations in vector space,” arXiv preprint arXiv:1301.3781, 2013.
Y. Liu, M. Ott, N. Goyal, J. Du, M. Joshi, D. Chen, O. Levy, M. Lewis, L. Zettlemoyer, and V. Stoyanov, “Roberta: A robustly optimized bert pretraining approach,” arXiv preprint arXiv:1907.11692, 2019.
Descargas
Publicado
Número
Sección
Licencia
Aviso de derechos de autor/a
Los autores/as que publiquen en esta revista aceptan las siguientes condiciones:
- Los autores conservan los derechos de autor y ceden a la revista el derecho de la primera publicación, con el trabajo registrado con la Creative Commons Attribution-Non-Commercial-Share-Alike 4.0 International, que permite a terceros utilizar lo publicado siempre que mencionen la autoría del trabajo y a la primera publicación en esta revista.
- Los autores pueden realizar otros acuerdos contractuales independientes y adicionales para la distribución no exclusiva de la versión del artículo publicado en esta revista (p. ej., incluirlo en un repositorio institucional o publicarlo en un libro) siempre que indiquen claramente que el trabajo se publicó por primera vez en esta revista.
- Se permite y recomienda a los autores a compartir su trabajo en línea (por ejemplo: en repositorios institucionales o páginas web personales) antes y durante el proceso de envío del manuscrito, ya que puede conducir a intercambios productivos, a una mayor y más rápida citación del trabajo publicado.
Descargo de Responsabilidad
LAJC en ningún caso será responsable de cualquier reclamo directo, indirecto, incidental, punitivo o consecuente de infracción de derechos de autor relacionado con artículos que han sido presentados para evaluación o publicados en cualquier número de esta revista. Más Información en nuestro Aviso de Descargo de Responsabilidad.