@yo Buena pregunta.
Desde el punto de vista legal las situaciones son parecidas. Ambos están haciendo uso de datos que podemos presumir personales, y de contenido sujeto a derecho de autor. Sin embargo del bot seguramente no se entere nadie, porque si se limita a recolectar datos que serán después tratados en un modelo es difícil que lleguemos a saber que el tratamiento ha tenido lugar.
Legalmente el bot está habilitado para hacerlo salvo que nos opongamos a ello mediante medios susceptibles de leerse mecánicamente (art 4, apartados 1 y 3 de la Directiva (UE) 2019/790). Lo que me lleva a preguntarme si debería haber un atributo en los perfiles de ActivityPub para reservar este derecho.
El puente supone una intromisión mayor en la esfera de la autodeterminación digital del sujeto, porque pone a disposición una serie de datos a una audiencia a la cual en principio el sujeto no los había proyectado. Por ello, creo que tiene un impacto más relevante desde la perspectiva de protección de datos que de derechos de autor.
Aquí está el texto relevante de la Directiva:
Artículo 4. Excepción o limitación relativa a la minería de textos y datos
1. Los Estados miembros establecerán una excepción o limitación a los derechos previstos en el artículo 5, letra a), y el artículo 7, apartado1, de la Directiva 96/9/CE, el artículo2 de la Directiva 2001/29/CE, el artículo 4, apartado 1, letras a) y b), de la Directiva 2009/24/CE y el artículo 15, apartado 1, de la presente Directiva con respecto a las reproducciones y extracciones de obras y otras prestaciones accesibles de forma legítima para fines de minería de textos y datos.
3. La excepción o limitación establecida en el apartado 1 se aplicará a condición de que el uso de las obras y otras prestaciones a que se refiere dicho apartado no esté reservado expresamente por los titulares de derechos de manera adecuada, como medios de lectura mecánica en el caso del contenido puesto a la disposición del público en línea.