Gente que le sabe a Python, necesito ayuda. Estoy intentando instalar OcrMyPdf con este comando que tira la documentación:
python3 -m pip install ocrmypdf
Pero me tira este error:
No se encontr¾ Python; ejecuta sin argumentos para instalar desde Microsoft Store o deshabilita este acceso directo en C.
¿QUé hay que modificar en la sintaxis? O Si descargo los archivos desde github, cómo se instalaría utilizándolos?
@muchanchoasado el otro día nos pasó con @lara actualiza la terminal con winget upgrade --all
Si eso no te funcionase, prueba a meterte en los ajustes de configuración buscando una que se llama administrar los alias de ejecución de aplicaciones.
@muchanchoasado Python en Windows es algo raro. Prueba a ejecutar solo el comando py.
Hay mucha explicación en https://docs.python.org/3/using/windows.html#python-launcher-for-windows
@muchanchoasado ¿revisaste que tienes bien puesta la ruta de ejecución de python3 en la variable de entorno PATH? Ejecuta un python3 --version para verificar que es así.
@Dancli inserto el comando y me dice esto: Traceback (most recent call last): File "<python-input-5>", line 1, in <module> NameError: name 'python3' is not defined
@muchanchoasado curiosamente, eso no tiene pinta de ser que falte python3, sino que estás en un prompt y no en la línea de comandos. Puede que los tiros vayan por ahí. Abre un nuevo terminal de Windows (cmd o powershell) y repite el comando a ver.
@Dancli si lo abro desde python me dice lo mismo de antes, si lo abro desde CMD normal me dice No se encontr¾ Python; ejecuta sin argumentos para instalar desde Microsoft Store o deshabilita este acceso directo en Configuraci¾n > Administrar alias de ejecuci¾n de la aplicaci¾n.
@yo eso intenté hacer y ahora el error que tira es: SyntaxError: invalid syntax
Intenté con el comando pip install --user ocrmypdf y el comando python3 -m pip install ocrmypdf. Ambos tiran lo mismo
@muchanchoasado no, no, solo py, una pe y una y griega.
Estoy resucitando mi Windows, ahora intento probarlo todo y enviar un parche a la documentacion.
@muchanchoasado para instalar:
py -m pip install ocrmypdf
para ejecutar ocrmypdf:
py -m ocrmypdf
Tendrás que añadir los nombres de los PDF que quieras convertir al comando, ahora intento hacer alguna prueba con un PDF, aunque no sé cómo funciona esta herramienta.
@muchanchoasado sí, acabo de probar con uno de los ejemplos que vienen con OCRmyPDF y creo que funciona. (No podía copiar el texto del PDF original, después de pasarlo por OCRmyPDF, puedo copiar texto.)
Curioso programa.
Si tienes alguna dificultad avisa. Si prefieres usar un medio de comunicación que te sea más cómodo, lo que te vaya mejor.
@muchanchoasado si los ficheros tienen espacios en el nombre, seguramente tengas que entrecomillarlo.
También para simplificar, mueve los ficheros a la carpeta en la que estés en la línea de comandos, para no tener que pelearte con rutas relativas. De paso les puedes quitar los espacios del nombre.
Sin espacios y sin tener que especificar la carpeta debería ser más fácil.
@yo ahora sí pude, muchas gracias por toda la ayuda! Me generó un archivo txt ahislado con el texto. El resultado no fue tan bueno como esperaba, pero supongo que eso ya es por la mala calidad de las imágenes.
@muchanchoasado vaya. Yo jugué un poco con Tesseract (que es lo que usa OCRmyPDF) hace años y tampoco era 100% efectivo.
Yo le puedo decir a OCRmyPDF que genere un PDF en vez de un fichero de texto. Eso conservará la disposición del documento, pero la verdad ni idea de si eso te irá mejor o peor con el lector de pantalla.
@yo en realidad es mejor que sea PDF porque conserva las páginas, el TXT es una sola cosa enorme y resulta incómoda. ¿Cómo es el comando que usaste? EL mío fue py -m ocrmypdf manualredacciontomoa.pdf output_pdf --skip-text. Tuve que poner eso porque era documento híbrido, había algunos títulos hechos en word.
@muchanchoasado huy, con un comando así, el fichero que me produce es un PDF.
En el comando que has pegado, en vez de acabar en punto pdf, acaba en guion bajo (underscore) y luego PDF. prueba a ponerle output punto pdf y abrirlo con el visor de PDF más accesible que tengas.
@muchanchoasado qué curioso. ¿Entonces puedes "pasar por encima" del PDF con el lector de pantalla y te lee el texto por donde pasas?
(Sólo he jugado un poco con VoiceOver y TalkBack en dispositivos con pantalla táctil. Nunca he podido jugar con un lector de pantalla para ordenador tradicional. Me imagino que será bastante distinto a VoiceOver y TalkBack, pero me cuesta adivinar cómo funciona.)
@muchanchoasado ah, vale, nada de ratón (al menos en la demo que he visto con NVDA). Supongo que puedes ir navegando por los bloques de texto y te los irá leyendo. Bueno, ¡espero que te sirva el programa!
@yo @yo así es, no usamos ratón para nada, los comandos de teclado son el día a día.
En interfaces comunes usamos más que nada las flechas y el tabulador, arriba y abajo leen por línea en un documento, las flechas izquierda y derecha sirven para deletrear y expandir elementos en un árbol, la tecla aplicaciones hace de click derecho. La navegación web se hace con letras. H para encabezados, b para votones, k lara links, e para cuadros de edición.
@muchanchoasado ah, ahora he visto tu otro mensaje. "py" dos letras solo te abrira el terminal de Python, era para probar como tienes instalado python.
Es posible que el comando "py pip ..." te haga lo que el comando "pip ..." de la documentacion hace. Pero lo miro con un poco de cariño...
@ericdq @lara voy a intentarlo. Lo extraño es que no instalé ningún componente desde la store. Python, Tesseract y Ghostscript están descargados desde las páginas oficiales.
@muchanchoasado @lara no, si la store no tiene nada que ver. El problema es la actualización que se hizo de la terminal en la última de windows update.
@muchanchoasado desde que descubrí ese comando ya no busco en páginas de cada programa. Primero miro ahí a ver si está.
Cierra y abre la terminal de nuevo a ver. Si no te tocará mirar en los alias y ir desactivando los que tengan que ver con python hasta que encuentres el que funcione.
@ericdq probé ejecutando python con el comando py, se abre normalmente, pero ahora cuando pego cosas dice SyntaxError: invalid syntax
@muchanchoasado pero te las pega bien? Es raro, porque en principio te está funcionando bien.
@muchanchoasado @ericdq Vale. Si tu prompt (la última línea de la terminal) son tres signos de mayor que, sal de ahí.
exit()
Luego, en lo que has pegado al principio del hilo, cambia python3 por py y debería ir
@muchanchoasado @ericdq exit seguido de un símbolo de abrir paréntesis y otro de cerrar.
@sukiletxe @ericdq no podía leer los caracteres en el CMD, solo me dice que hay espacio. De todas formas hice lo que me indicaste pero nada, SyntaxError: invalid syntax
@muchanchoasado @ericdq Vale, y si escribes exit, sin paréntesis después, qué te dice?
@sukiletxe @ericdq no sé qué hice exactamente pero ya se instaló. Gracias a todos por la ayuda! @yo @Dancli
@muchanchoasado @sukiletxe @ericdq @yo pues no lo toques más si ya funciona jejeje. ¡Suerte en tus pythoventuras!
@Dancli @sukiletxe @ericdq @yo no será el último error, eso lo tengo por seguro. Espero que sea un OCR de calidad para que haya valido la pena todo este experimento.
@Dancli @sukiletxe @ericdq @yo ya pude hacer recuento de cómo se arregló. Estaba ejecutando los comandos desde la consola de Python, la que apareció en el menú inicio al instalarlo, cuando tenía que ser en el CMD normal sin estar enrutado a alguna carpeta. Cambié el python3 por py, de esa forma es que se instaló.