AP
Trabajo final · Ciencia de Datos · Sociología USAL

Fe, Razón y Algoritmos

El debate religioso en el ecosistema anglófono de YouTube
Alejandro Panera Pascual · Angel Boza Jareno
15canales
9.746vídeos
141.935comentarios
1 / 18
AB

La pregunta

¿Existe una prima de conflicto en el sub-ecosistema religioso de YouTube?

Es decir: dentro del mismo canal, ¿reciben los vídeos cuyos títulos llevan marcadores combativos (destroys, debunks, refutes, vs…) más interacción relativa que los que no los llevan?

La idea viene de la literatura sobre outrage media y de la economía de la atención. La plataforma premia retención y confrontación; nuestra hipótesis es que el encuadre combativo es un recurso usado deliberadamente para capturar interacción.

Una pregunta correlacional, no causal: los canales eligen sus propios títulos. Estimaremos una mezcla del efecto del encuadre y del efecto de la selección editorial. Lo declaramos desde el principio.

Miniatura 25 Christians vs 25 Atheists
2 / 18
AB

Los 15 canales del corpus

Cuatro familias temáticas, muestreo intencional con criterios preregistrados.

Apologética cristiana
Capturing Christianity
Capturing Christianity
Cross Examined
Cross Examined
InspiringPhilosophy
InspiringPhilosophy
Pints With Aquinas / Matt Fradd
Pints With Aquinas / Matt Fradd
The Counsel of Trent
The Counsel of Trent
Ateísmo / filosofía
Alex O'Connor / Cosmic Skeptic
Alex O'Connor / Cosmic Skeptic
Genetically Modified Skeptic
Genetically Modified Skeptic
Paulogia
Paulogia
Rationality Rules
Rationality Rules
The Atheist Experience
The Atheist Experience
Divulgación / comentario
Dan McClellan
Dan McClellan
Professor Dave Explains
Professor Dave Explains
ReligionForBreakfast
ReligionForBreakfast
Religión / política
Allie Beth Stuckey
Allie Beth Stuckey
Michael Knowles
Michael Knowles

Criterios: foco temático estable, +100k suscriptores, actividad continuada, referencias cruzadas entre canales. Las miniaturas se descargaron vía API de YouTube en el momento del snapshot.

3 / 18
AP

La recolección y un detalle técnico

YouTube Data API v3 desde R con el paquete tuber. Cuota: 10.000 unidades/día.

Data API v3 Proyecto en Google Cloud, servicio habilitado y cuota diaria controlada.
1Canaluploads playlist
2IDspaginación barata
3Detallesviews, likes, duración
4Comentariostop-50 por vídeo
5Corpus9.746 vídeos

Ruta barata

  1. Para cada canal, su uploads playlist.
  2. playlistItems.list paginado → IDs y fechas (1 ud/página de 50).
  3. videos.list → detalles (1 ud/vídeo).
  4. commentThreads.list → top-50 comentarios (1 ud/vídeo).

Total: ≈ 3.000 unidades. Coste descartado: search.list, 100 ud/llamada.

Consola de Google Cloud con YouTube Data API v3 habilitada
Servicio habilitado en Google Cloud: youtube.googleapis.com.

El bug que tuvimos que rodear

tuber::get_playlist_items() en la versión 1.4.0 ignora silenciosamente page_token: siempre devuelve la primera página.

Solución: bajar al endpoint REST con httr::GET(). Mismo coste, paginación real.

4 / 18
AP

Ventana y muestreo

Ventana: 2022-2025

La propuesta pedía 2020-2025. Al paginar descubrimos:

  • Michael Knowles: solo 2025.
  • Dan McClellan: desde feb-2024.
  • Allie Beth Stuckey: desde abr-2022.

Tres canales sin presencia en la mitad del periodo. Acortamos.

Sin muestreo: el universo

Universo en ventana: 11.940 vídeos. Bajamos los detalles de todos en lotes de 50 (videos.list, ~240 unidades).

  • Nada de muestrear: trabajamos con la población completa.
  • Prohibidos los Shorts (< 60 s): fuera de todo el análisis.
  • Corpus final tras limpieza: 9.746 vídeos.
Distribución temporal del corpus
La ventana real se concentra en 2022-2025.
Duración de los vídeos por canal
Sin Shorts: toda la distribución arranca en 1 minuto.
5 / 18
AB

Cómo es el corpus: interacción por familia

Comentarios y likes no miden lo mismo: los comentarios capturan discusión; los likes, aprobación ligera.

Ratio comentarios/views por categoría
Comentarios. Ateísmo / filosofía y apologética concentran más debate por visualización.
Ratio likes/views por categoría
Likes. La distribución es más plana: la aprobación no replica exactamente la discusión.

Lectura: el ateísmo / filosofía genera más del doble de comentarios por visualización (0,020) que la apologética o la divulgación (~0,009). La religión política queda más abajo (0,006): mucha producción, audiencia que comenta menos por vídeo.

6 / 18
AP

El marcador combativo (y el problema con "vs")

Diccionario: destroys, debunks, owns, refutes, exposes, dismantles, schools, demolishes, concedes, vs.

Detección por palabra completa, insensible a mayúsculas. 256 vídeos (2,6 %) llevan al menos un marcador.

Pero 178 de los 256 son la palabra "vs" (70 %). Y muchos son simplemente debates formales:

Contraste metodológico: DESTROYS (28 casos) suele codificar ataque; vs muchas veces solo etiqueta un debate.

Decisión: reportar siempre dos versiones, con y sin vs. La segunda es más limpia y aún deja 78 casos.

Proporción combativo por canal
Miniatura de debate ateísmo vs cristianismo
Debate presentado como enfrentamiento visual.
Captura de YouTube: 1 Atheist vs 25 Christians
El "vs" como formato de programa.
Captura de YouTube: Matan vs Alex OConnor
Marcador de duelo, no siempre insulto.
7 / 18
AB

Regresión H1: cuatro modelos

Efectos fijos por canal, errores estándar agrupados por canal.

log1p(ratio) = αcanal + β · combativo + γ · log(duración) + δ · antigüedad + ε
+Comentarios2 / 2 positivos (marginal)
Likes2 / 2 negativos; base significativo
256Casos78 sin vs
YModeloβpnc
coment/viewsCon vs+0,00350,062256
Sin vs+0,00200,21578
likes/viewsCon vs−0,00400,038256
Sin vs−0,00390,16978
Comentarios por vista: títulos combativos vs resto
Diferencia cruda: antes de controlar canal y duración ya aparece la señal en comentarios.
8 / 18
AP

Lectura honesta: no es una prima, es un trueque

Los cuatro signos cuentan la misma historia: comentarios arriba, likes abajo.

Likes: negativo y significativo.

β < 0 con p = 0,038 en el modelo base. El encuadre combativo se asocia a menos aprobación por visualización.

Comentarios: positivo pero frágil.

β > 0 pero marginal (p = 0,062) y se debilita al quitar vs (p = 0,22): la señal en comentarios vive sobre todo en el formato-duelo.

Comentarios / views
+
+
con y sin vs — más comentarios
Likes / views
con y sin vs — menos likes

El conflicto genera discusión, no aprobación.

No es la «prima de conflicto» uniforme que predecía H1 (más de todo): es un trueque. El encuadre combativo compra comentarios —controversia— a costa de likes —aprobación. Y con 256 combativos (78 sin vs) sobre el universo completo, no una muestra, ya hay potencia para verlo.

9 / 18
AB

Clustering: ¿reproducen los datos las familias?

K-medias sobre 5 variables a nivel de canal, estandarizadas.

Variables del perfil de cada canal:

  • Mediana de log(ratio comentarios)
  • Mediana de log(ratio likes)
  • Mediana de log(duración)
  • Proporción de títulos combativos
  • Dispersión temporal

k elegido: 3 (codo + alineación con las familias originales). Estabilidad: 1,0 en 10 semillas.

Diagnóstico k clustering
C1Largo / templado6 canales, vídeos largos, interacción menor
C2Intermedio6 canales, métricas medias
C3Combativo3 canales, más combativo, comentarios altos
10 / 18
AP

El cluster combativo: el hallazgo clave

Tres clusters. El tercero es el bombazo.

Apologética Capturing Christianity cluster 3: el más combativo
+
Ateísmo Rationality Rules & Paulogia cluster 3: el más combativo
Cluster 3
(n=3)
Capturing Christianity, Rationality Rules y Paulogia: la mayor proporción combativa (7-9 %) y la mediana más alta de comentarios.
Cluster 1
(n=6)
Vídeos largos, interacción menor. Mezcla las cuatro familias.
Cluster 2
(n=6)
Métricas intermedias. Familias otra vez mezcladas.

El encuadre combativo une más que la posición religiosa.

PCA de los clusters de canales
Apologética cristiana y ateísmo militante caen en el mismo cluster: comparten estilo, no doctrina.
11 / 18
AB

El ecosistema como red

Detectamos menciones cruzadas en los 9.746 títulos.

Red de interlocución

Dos diccionarios

  • Alias para los 15 canales del corpus (nombres, handles).
  • 18 figuras externas frecuentes (W.L. Craig, Dawkins, Peterson, Trump, Shapiro…).

El resultado

  • 54 aristas canal ↔ canal
  • 105 aristas canal ↔ figura externa
  • Visualización interactiva con netCoin (el paquete del profesor).
12 / 18
AP

Hubs y figuras-pegamento

Centralidad: PageRank

RankCanalPR
1The Counsel of Trent0,140
2Alex O'Connor0,122
3Michael Knowles0,112
4Allie Beth Stuckey0,106
5Pints With Aquinas0,082

Paulogia: cita a varios canales del corpus pero recibe pocas menciones de vuelta. Francotirador contraapologético que dispara hacia fuera.

Trenthub citado por las 4 familias
Paulogiamuchas salidas, pocas entradas
Petersonfigura externa transversal

Figura-pegamento

Jordan Peterson aparece en títulos de 13 de los 15 canales, de las cuatro familias.

Captura de YouTube: Jordan Peterson vs 20 Atheists
FiguraNº canales
Jordan Peterson13
Joe Rogan12
Donald Trump11
Bart Ehrman10
13 / 18
AB

El ADN léxico de cada familia

TF-IDF sobre los títulos: qué palabras son distintivas de cada categoría.

TF-IDF por categoría
Apologética
orthodox, protestants, akin, heschmeyer, dilemma
Ateísmo
william lane craig, bowen, faith, evolution
Divulgación
origin, earth, language, ancient, satan
Religión política
trump, media, riley, funding, meghan
14 / 18
AB

Nubes de palabras: el mismo retrato, en imagen

El mismo ejercicio del TF-IDF en formato visual: una nube por familia con las 80 palabras más frecuentes en sus títulos.

Nubes de palabras por familia

Cómo se han hecho

  • Tokenizamos los 9.746 títulos con tidytext.
  • Quitamos stopwords inglés, números, palabras cortas y los nombres de los propios canales (si no, "Knowles" o "Paulogia" dominaban su nube).
  • Las 80 palabras más frecuentes por familia → wordcloud con paleta propia de cada categoría.

Las versiones interactivas (wordcloud2) están en output/nubes/.

Lectura rápida

  • Apologética: god, jesus, bible, christianity, catholic.
  • Ateísmo: god, bible, christian, religion, evidence.
  • Divulgación: bible, jesus, biblical, claims, ancient.
  • Religión política: trump, christian, kids, people, charlie.
15 / 18
AP

Cómo escribe el público: 141.935 comentarios

Bajamos hasta 50 comentarios (por relevancia) de 3.500 vídeos. Tres métricas a nivel comentario:

Longitudpalabras
Shoutingmayúsculas / !!
Léxico calientelying, idiot, cope...
MétricaCombativoNormalp
% con shouting14,5 %13,2 %<0,001
% con léxico caliente8,0 %7,3 %0,010
Longitud (palabras)algo mayor3·10−5
Lectura final La diferencia cruda es pequeña pero significativa; con efectos fijos por canal + cluster por vídeo se disuelve (palabras p = 0,40; shouting p = 0,60). El canal pesa más que el encuadre.
Longitud de comentarios por categoría
La longitud del comentario cambia mucho entre familias: el canal pesa más que el encuadre puro.
16 / 18
AB

Dos formas de calor

Las diferencias entre canales sí son rotundas y sociológicamente interpretables.

Comentarios calientes por canal

Calor léxico

Gen. Modified Skeptic 24 %
The Atheist Experience 11,7 %
Paulogia 10 %

El léxico más agresivo se concentra en el ateísmo contraapologético.

Calor visual

Allie Beth Stuckey: shouting 23,4 %
0,65 signos ! por comentario
Michael Knowles: 17,1 %

Religión política: intensidad por MAYÚSCULAS y exclamaciones, no por léxico.

Templanza

ReligionForBreakfast 2,0 %
Professor Dave 5,8 %

Divulgación académica: la templanza es del público, no del autor (Prof. Dave es muy contraapologético).

17 / 18
AP

Lo que nos llevamos

YouTube no solo ordena contenidos: ordena estilos de confrontación.
1

No es una prima, es un trueque

El conflicto sube comentarios (marginal) y baja likes (significativo): discusión, no aprobación.

2

El encuadre une más que la posición

Capturing Christianity, Rationality Rules y Paulogia —apologética y ateísmo— caen en el mismo cluster combativo.

3

Los comentarios añaden una capa

Dos formas de calor: léxico y visual.

4

Formato > etiqueta temática

La categoría no predice tan bien como el estilo de producción.

Repositorio público, reproducible desde data/raw/:

github.com/GalexY3/fe_razon_y_algoritmos

Ecosistema digital de debate y comentarios
18 / 18