Signa_Lab trabajará en la selección de preguntas para el primer debate presidencial 2024

Electoral
  • El laboratorio de innovación tecnológica y estudios interdisciplinarios aplicados del ITESO fue elegido por el Instituto Nacional Electoral (INE) para realizar el proceso de elección de las preguntas provenientes de redes sociales para el primer Debate Presidencial, que tendrá lugar el domingo 7 de abril de 2024. 

Signa_Lab del ITESO llevará a cabo un proceso público, verificable y con rigor metodológico,  luego de ser elegido por el Instituto Nacional Electoral (INE) para realizar el proceso de selección de preguntas de redes sociales para el Debate Presidencial del domingo 7 de abril de 2024.

Desde 2016, Signa_Lab trabaja como laboratorio de innovación tecnológica y estudios interdisciplinarios aplicados. En 2018 colaboró con el INE para seleccionar las preguntas que se harían en el último Debate Presidencial del proceso electoral de ese año.

El INE reconoció mediante oficio que el laboratorio cuenta con la experiencia, el equipo humano, las herramientas de procesamiento de grandes volúmenes de datos, así como de análisis y procesamiento de lenguaje natural a través de distintos algoritmos, para atender los requerimientos que el Instituto planteó en su metodología.

El pasado 8 de febrero, el Consejo General del INE, luego de que la propuesta pasara por la Comisión Temporal de Debates del mismo Instituto, aprobó por unanimidad que Signa_Lab trabaje con la base de datos y la selección final de un universo de 108 reactivos que surgirán luego de la convocatoria abierta a mayores de 13 años, a fin de que propongan preguntas para el debate en el que participarán los candidatos presidenciales.

Los ciudadanos podrán participar en este proceso a través de las distintas redes sociales oficiales del INE y en plataformas digitales a través un vínculo que redirigirá a un formulario en línea alojado en un micrositio oficial de debates dentro de la página del Instituto (www.ine.mx).

Ahí se completará el método de autenticación digital mediante CAPTCHA y las personas participantes proporcionarán la información requerida en los siguientes campos: “Entidad de residencia”, “Edad”, “Tema de tu interés”, “Género” (opcional) y “Pertenencia a un Grupo en Situación de Discriminación” (opcional).

En el formulario se podrán redactar desde una hasta seis preguntas en torno a los siguientes temas: Educación, Salud, Transparencia, Combate a la Corrupción, No Discriminación y Grupos Vulnerables y Violencia contra las Mujeres.

Las preguntas deben cumplir los siguientes criterios:

o   Apegarse a los temas definidos para el debate.

o   La redacción no debe incluir lenguaje ofensivo, discursos de odio, inclinación partidista, ideológica, religiosa o cualquier manifestación de violencia o discriminación; tampoco podrá referirse a algún logro de gobierno o propaganda gubernamental.

o   Las preguntas deben redactarse de forma general y abierta, y no estar dirigidas a una candidatura específica.

El plazo de recepción de preguntas comenzará a las 07:00 horas del martes 20 de febrero, y concluirá a las 23:59 horas del jueves 21 de marzo de 2024.

Una vez concluida la convocatoria abierta, el INE entregará una base de datos consolidada por las categorías definidas por el Instituto: edad, género, región del país y tema de la pregunta. La depuración y la ponderación inicial se harán de acuerdo con los criterios de elegibilidad de las preguntas y la representatividad de éstas. A partir de ahí se realizará un análisis inicial de rutas semánticas y se hará clusterización de las preguntas, es decir, se agruparán por familias semánticas, nivel de frecuencia, similitudes y discrepancias.

Lo anterior permitirá llegar a una identificación de agrupación de tópicos comunes, a partir del análisis y el procesamiento del lenguaje natural. La tercera parte de la metodología consistirá en la sistematización y la elaboración de la selección muestral estratificada de las preguntas, a través de la ponderación que pide el propio INE.

Posteriormente, vendrá un análisis cualitativo que permita cotejar que no se esté cometiendo ningún tipo de error derivado de algún sesgo algorítmico.  Se hará una revisión manual, con criterios como frecuencia de los adverbios.  Con los criterios perfectamente delineados reducirá el universo de preguntas hasta contar con 108, que es el número definido por el INE. Dichas preguntas se entregarán al Instituto, que finalmente elegirá de ese universo las que se plantearán en el Debate Presidencial.

Signa_Lab ITESO entregará un informe detallado que permita la trazabilidad de todas las herramientas y de los pasos seguidos, para que cualquier persona interesada pueda replicar el ejercicio después del Debate, y también para que se observe que no hay ningún tipo de sesgo ni de manipulación de la información.

Signa_Lab es un equipo multidisciplinario que cuenta con habilidades en programación con lenguajes para la aplicación de técnicas de Ciencia de Datos (Python) y desarrollo de interfaces interactivas (JavaScript, HTML y CSS). Son expertos en procesamiento de lenguaje natural (PNL) y análisis semántico basadas en aprendizaje automático, en procesamiento, limpieza, transformación y análisis de datos masivos con librerías especializadas. También realiza análisis crítico, contextual y multicapa de grandes volúmenes de datos.