Una de las cosas que me sacan de quicio de la programación orientada a objetos (aparte de la enorme longitud de línea) es que hace falta que el objeto se inicialice. Veamos un caso.
(Introducción larga, puedes saltar al siguiente mensaje).
Quiero dividir un mailbox de google que tiene 12 gigas.
Mi primera idea es usar sed, y buscar líneas que empiecen con "From ". Pero claro, con Sed es complicado exigir que haya dos saltos de línea antes del from o comprobar cuántos bytes llevamos, desisto y pienso en basic.
OpenOffice todavía permite leer ficheros con instrucciones basic directas. Pruebo un primer ejemplo para depurar si puedo leer un par de correos y ver el seek inicial, pero el hecho de que el print de libreoffice no vaya a una consola (en general, el hecho de que libreoffice no tenga un modo inmediato), me hacen reiniciar en windows y buscar una solución ya hecha.
Thunderbird tiene ya configurada una cuenta que no quiero mezclar con gmail, y tampoco quiero configurar gmail (¿no hay una opción mbox local?), así que descarto.
Veo dos scripts de python que pueden valerme, y ahí es donde encuentro el problema.
(+)