Acaba de ocurrírseme debido a mi anterior boost. ¿Qué pasaría si alguien, siendo público el fediverso como es usara todos los datos para entrenar una IA? Solo tendría que federar con el mayor número de instancias posibles y recopilar datos alegremente.
@jpavonabian para mí, de los mayores problemas de las empresas de IA es que creo que pasan de todo para agrandar su conjunto de entrenamiento. El robots.txt (que es voluntario y que no todos usan) apareció rápido para buscadores, pero ahora mismo mi asunción es que todo lo accesible públicamente acabará en conjunto de entrenamiento, queramos o no.
Ni siquiera hay que federar, con recorrer Internet como hace cualquier buscador hay suficiente.