AP

Trabajo final · Ciencia de Datos · Sociología USAL

Fe, Razón y Algoritmos

El debate religioso en el ecosistema anglófono de YouTube

Alejandro Panera Pascual · Angel Boza Jareno

15canales

9.746vídeos

141.935comentarios

1 / 18

AB

La pregunta

¿Existe una prima de conflicto en el sub-ecosistema religioso de YouTube?

Es decir: dentro del mismo canal, ¿reciben los vídeos cuyos títulos llevan marcadores combativos (destroys, debunks, refutes, vs…) más interacción relativa que los que no los llevan?

La idea viene de la literatura sobre outrage media y de la economía de la atención. La plataforma premia retención y confrontación; nuestra hipótesis es que el encuadre combativo es un recurso usado deliberadamente para capturar interacción.

Una pregunta correlacional, no causal: los canales eligen sus propios títulos. Estimaremos una mezcla del efecto del encuadre y del efecto de la selección editorial. Lo declaramos desde el principio.

2 / 18

AB

Los 15 canales del corpus

Cuatro familias temáticas, muestreo intencional con criterios preregistrados.

Apologética cristiana

Capturing Christianity

Cross Examined

InspiringPhilosophy

Pints With Aquinas / Matt Fradd

The Counsel of Trent

Ateísmo / filosofía

Alex O'Connor / Cosmic Skeptic

Genetically Modified Skeptic

Paulogia

Rationality Rules

The Atheist Experience

Divulgación / comentario

Dan McClellan

Professor Dave Explains

ReligionForBreakfast

Religión / política

Allie Beth Stuckey

Michael Knowles

Criterios: foco temático estable, +100k suscriptores, actividad continuada, referencias cruzadas entre canales. Las miniaturas se descargaron vía API de YouTube en el momento del snapshot.

3 / 18

AP

La recolección y un detalle técnico

YouTube Data API v3 desde R con el paquete tuber. Cuota: 10.000 unidades/día.

YouTube

Data API v3 Proyecto en Google Cloud, servicio habilitado y cuota diaria controlada.

1Canaluploads playlist

2IDspaginación barata

3Detallesviews, likes, duración

4Comentariostop-50 por vídeo

5Corpus9.746 vídeos

Ruta barata

Para cada canal, su uploads playlist.
playlistItems.list paginado → IDs y fechas (1 ud/página de 50).
videos.list → detalles (1 ud/vídeo).
commentThreads.list → top-50 comentarios (1 ud/vídeo).

Total: ≈ 3.000 unidades. Coste descartado: search.list, 100 ud/llamada.

Consola de Google Cloud con YouTube Data API v3 habilitada — Servicio habilitado en Google Cloud: `youtube.googleapis.com`.

El bug que tuvimos que rodear

tuber::get_playlist_items() en la versión 1.4.0 ignora silenciosamente page_token: siempre devuelve la primera página.

Solución: bajar al endpoint REST con httr::GET(). Mismo coste, paginación real.

4 / 18

AP

Ventana y muestreo

Ventana: 2022-2025

La propuesta pedía 2020-2025. Al paginar descubrimos:

Michael Knowles: solo 2025.
Dan McClellan: desde feb-2024.
Allie Beth Stuckey: desde abr-2022.

Tres canales sin presencia en la mitad del periodo. Acortamos.

Sin muestreo: el universo

Universo en ventana: 11.940 vídeos. Bajamos los detalles de todos en lotes de 50 (videos.list, ~240 unidades).

Nada de muestrear: trabajamos con la población completa.
Prohibidos los Shorts (< 60 s): fuera de todo el análisis.
Corpus final tras limpieza: 9.746 vídeos.

Distribución temporal del corpus — La ventana real se concentra en 2022-2025.

Duración de los vídeos por canal — Sin Shorts: toda la distribución arranca en 1 minuto.

5 / 18

AB

Cómo es el corpus: interacción por familia

Comentarios y likes no miden lo mismo: los comentarios capturan discusión; los likes, aprobación ligera.

Ratio comentarios/views por categoría — **Comentarios.** Ateísmo / filosofía y apologética concentran más debate por visualización.

Ratio likes/views por categoría — **Likes.** La distribución es más plana: la aprobación no replica exactamente la discusión.

Lectura: el ateísmo / filosofía genera más del doble de comentarios por visualización (0,020) que la apologética o la divulgación (~0,009). La religión política queda más abajo (0,006): mucha producción, audiencia que comenta menos por vídeo.

6 / 18

AP

El marcador combativo (y el problema con "vs")

Diccionario: destroys, debunks, owns, refutes, exposes, dismantles, schools, demolishes, concedes, vs.

Detección por palabra completa, insensible a mayúsculas. 256 vídeos (2,6 %) llevan al menos un marcador.

Pero 178 de los 256 son la palabra "vs" (70 %). Y muchos son simplemente debates formales:

Contraste metodológico: DESTROYS (28 casos) suele codificar ataque; vs muchas veces solo etiqueta un debate.

Decisión: reportar siempre dos versiones, con y sin vs. La segunda es más limpia y aún deja 78 casos.

Miniatura de debate ateísmo vs cristianismo — Debate presentado como enfrentamiento visual.

Captura de YouTube: 1 Atheist vs 25 Christians — El "vs" como formato de programa.

Captura de YouTube: Matan vs Alex OConnor — Marcador de duelo, no siempre insulto.

7 / 18

AB

Regresión H1: cuatro modelos

Efectos fijos por canal, errores estándar agrupados por canal.

log1p(ratio) = α_canal + β · combativo + γ · log(duración) + δ · antigüedad + ε

+Comentarios2 / 2 positivos (marginal)

−Likes2 / 2 negativos; base significativo

256Casos78 sin vs

Y	Modelo	β	p	n_c
coment/views	Con vs	+0,0035	0,062	256
coment/views	Sin vs	+0,0020	0,215	78
likes/views	Con vs	−0,0040	0,038	256
likes/views	Sin vs	−0,0039	0,169	78

Comentarios por vista: títulos combativos vs resto — Diferencia cruda: antes de controlar canal y duración ya aparece la señal en comentarios.

8 / 18

AP

Lectura honesta: no es una prima, es un trueque

Los cuatro signos cuentan la misma historia: comentarios arriba, likes abajo.

Likes: negativo y significativo.

β < 0 con p = 0,038 en el modelo base. El encuadre combativo se asocia a menos aprobación por visualización.

Comentarios: positivo pero frágil.

β > 0 pero marginal (p = 0,062) y se debilita al quitar vs (p = 0,22): la señal en comentarios vive sobre todo en el formato-duelo.

Comentarios / views

+

con y sin vs — más comentarios

Likes / views

−

con y sin vs — menos likes

El conflicto genera discusión, no aprobación.

No es la «prima de conflicto» uniforme que predecía H1 (más de todo): es un trueque. El encuadre combativo compra comentarios —controversia— a costa de likes —aprobación. Y con 256 combativos (78 sin vs) sobre el universo completo, no una muestra, ya hay potencia para verlo.

9 / 18

AB

Clustering: ¿reproducen los datos las familias?

K-medias sobre 5 variables a nivel de canal, estandarizadas.

Variables del perfil de cada canal:

Mediana de log(ratio comentarios)
Mediana de log(ratio likes)
Mediana de log(duración)
Proporción de títulos combativos
Dispersión temporal

k elegido: 3 (codo + alineación con las familias originales). Estabilidad: 1,0 en 10 semillas.

C1Largo / templado6 canales, vídeos largos, interacción menor

C2Intermedio6 canales, métricas medias

C3Combativo3 canales, más combativo, comentarios altos

10 / 18

AP

El cluster combativo: el hallazgo clave

Tres clusters. El tercero es el bombazo.

Apologética Capturing Christianity cluster 3: el más combativo

+

Ateísmo Rationality Rules & Paulogia cluster 3: el más combativo

Cluster 3 (n=3)	Capturing Christianity, Rationality Rules y Paulogia: la mayor proporción combativa (7-9 %) y la mediana más alta de comentarios.
Cluster 1 (n=6)	Vídeos largos, interacción menor. Mezcla las cuatro familias.
Cluster 2 (n=6)	Métricas intermedias. Familias otra vez mezcladas.

El encuadre combativo une más que la posición religiosa.

PCA de los clusters de canales — Apologética cristiana y ateísmo militante caen en el mismo cluster: comparten estilo, no doctrina.

11 / 18

AB

El ecosistema como red

Detectamos menciones cruzadas en los 9.746 títulos.

Dos diccionarios

Alias para los 15 canales del corpus (nombres, handles).
18 figuras externas frecuentes (W.L. Craig, Dawkins, Peterson, Trump, Shapiro…).

El resultado

54 aristas canal ↔ canal
105 aristas canal ↔ figura externa
Visualización interactiva con netCoin (el paquete del profesor).

12 / 18

AP

Hubs y figuras-pegamento

Centralidad: PageRank

Rank	Canal	PR
1	The Counsel of Trent	0,140
2	Alex O'Connor	0,122
3	Michael Knowles	0,112
4	Allie Beth Stuckey	0,106
5	Pints With Aquinas	0,082

Paulogia: cita a varios canales del corpus pero recibe pocas menciones de vuelta. Francotirador contraapologético que dispara hacia fuera.

Trenthub citado por las 4 familias

Paulogiamuchas salidas, pocas entradas

Petersonfigura externa transversal

Figura-pegamento

Jordan Peterson aparece en títulos de 13 de los 15 canales, de las cuatro familias.

Captura de YouTube: Jordan Peterson vs 20 Atheists

Figura	Nº canales
Jordan Peterson	13
Joe Rogan	12
Donald Trump	11
Bart Ehrman	10

13 / 18

AB

El ADN léxico de cada familia

TF-IDF sobre los títulos: qué palabras son distintivas de cada categoría.

Apologética
orthodox, protestants, akin, heschmeyer, dilemma

Ateísmo
william lane craig, bowen, faith, evolution

Divulgación
origin, earth, language, ancient, satan

Religión política
trump, media, riley, funding, meghan

14 / 18

AB

Nubes de palabras: el mismo retrato, en imagen

El mismo ejercicio del TF-IDF en formato visual: una nube por familia con las 80 palabras más frecuentes en sus títulos.

Cómo se han hecho

Tokenizamos los 9.746 títulos con tidytext.
Quitamos stopwords inglés, números, palabras cortas y los nombres de los propios canales (si no, "Knowles" o "Paulogia" dominaban su nube).
Las 80 palabras más frecuentes por familia → wordcloud con paleta propia de cada categoría.

Las versiones interactivas (wordcloud2) están en output/nubes/.

Lectura rápida

Apologética: god, jesus, bible, christianity, catholic.
Ateísmo: god, bible, christian, religion, evidence.
Divulgación: bible, jesus, biblical, claims, ancient.
Religión política: trump, christian, kids, people, charlie.

15 / 18

AP

Cómo escribe el público: 141.935 comentarios

Bajamos hasta 50 comentarios (por relevancia) de 3.500 vídeos. Tres métricas a nivel comentario:

Longitudpalabras

Shoutingmayúsculas / !!

Léxico calientelying, idiot, cope...

Métrica	Combativo	Normal	p
% con shouting	14,5 %	13,2 %	<0,001
% con léxico caliente	8,0 %	7,3 %	0,010
Longitud (palabras)	algo mayor	—	3·10⁻⁵

Lectura final La diferencia cruda es pequeña pero significativa; con efectos fijos por canal + cluster por vídeo se disuelve (palabras p = 0,40; shouting p = 0,60). El canal pesa más que el encuadre.

Longitud de comentarios por categoría — La longitud del comentario cambia mucho entre familias: el canal pesa más que el encuadre puro.

16 / 18

AB

Dos formas de calor

Las diferencias entre canales sí son rotundas y sociológicamente interpretables.

Calor léxico

Gen. Modified Skeptic 24 %
The Atheist Experience 11,7 %
Paulogia 10 %

El léxico más agresivo se concentra en el ateísmo contraapologético.

Calor visual

Allie Beth Stuckey: shouting 23,4 %
0,65 signos ! por comentario
Michael Knowles: 17,1 %

Religión política: intensidad por MAYÚSCULAS y exclamaciones, no por léxico.

Templanza

ReligionForBreakfast 2,0 %
Professor Dave 5,8 %

Divulgación académica: la templanza es del público, no del autor (Prof. Dave es muy contraapologético).

17 / 18

AP

Lo que nos llevamos

YouTube no solo ordena contenidos: ordena estilos de confrontación.

1

No es una prima, es un trueque

El conflicto sube comentarios (marginal) y baja likes (significativo): discusión, no aprobación.

2

El encuadre une más que la posición

Capturing Christianity, Rationality Rules y Paulogia —apologética y ateísmo— caen en el mismo cluster combativo.

3

Los comentarios añaden una capa

Dos formas de calor: léxico y visual.

4

Formato > etiqueta temática

La categoría no predice tan bien como el estilo de producción.

Repositorio público, reproducible desde data/raw/:

github.com/GalexY3/fe_razon_y_algoritmos

Ecosistema digital de debate y comentarios

18 / 18