Hoy vamos a descansar de tanta ingeniería, tanto invento, y nos dedicaremos más a la palabrería (como reza el lema del blog). Buieeeeeno, y un poquito de software.
Resulta que estos días estamos haciendo limpieza en la oficina; así que estoy aprovechando, y estoy haciendo también limpieza de mis cosas, bueno, mis cosas que son de la empresa, o las cosas de la empresa que son mías, o ¡yo que sé! El caso es que ya tengo demasiado papeles y no me gusta ocupar tanto sitio, y además existe el agravante de que soy un enamorado de la información; bueno, realmente no os voy a hablar de esto, ya que es problema mío; pero de lo que sí os quiero hablar, es de cómo he dado con la solución a un asunto que ha ido creciendo hasta convertirse en un problema.
Esto viene, porque cuando encuentro una información interesante, ya sea en un catálogo, en una revista, un tríptico de una empresa o un libro que me prestan; me gusta guardarla, ya sea recortando, en fotocopias o fotos, como hacía hasta ahora. Pero claro, a estas alturas, el volumen físico de este archivo de papeles, ha sobrepasado los límites de mi mesa, y ya estaba poniendo carpetas y archivadores disimuladamente en las mesas de mis compañeros…nanino nino nierooooo.
Así que me he puesto manos a la obra, y me he propuesto digitalizar todo mi archivo ¡¡¡ppppfffffffff!!!
Por supuesto, lo más cómodo es crear PDF. Y por varias razones, pero sobre todo porque permiten combinar texto y fotografía, y dan como resultado archivos con pocos bytes, o sea que ocuparán poquito. Esto permite tener grandes cantidades de información ocupando poco sitio en nuestro disco duro. Aunque al ritmo de crecimiento de la capacidad de los discos, no será este el problema.
Entrando ya en el tema, os explico que he hecho. Y lo haré por pasos, así le doy un poco de categoría al artículo:
Primer paso. Buscar un dispositivo que permita escanear paquetes de hojas completos (con un escáner de sobremesa, simplemente ni me lo había planteado). Hoy en día se pueden encontrar escáneres de este tipo, en impresoras o fotocopiadoras, así que incluso me imagino que se podría acudir a alguna copistería, donde puedan ofrecer este servicio. Además, es importante a mi entender, que «nos cueste algo» hacer todo esto, y no me refiero sólo económicamente, sino también en tiempo y en esfuerzo, con el objetivo únicamente de ser selectivos a la hora de guardar información ¡lo siento por los nostálgicos! Tendréis que buscar otro método.
Segundo paso. Seleccionar toda la información que queremos escanear, y ponerse manos a la obra. Cuando he empezado el escaneo, me he encontrado pequeño problema, los equipos que yo conozco, tienen el problema de que al poner las hojas en el alimentador, primero escaneas todas las hojas por una cara, y luego, dándoles la vuelta, por la otra, y así obtenemos dos archivos, uno con las hojas pares, y otro con las impares (por poner un ejemplo). Así que tenía dos archivos y un problema. Pero ya tengo la solución, existe un programa de software libre (del que hago uso todo lo que puedo), que se llama PDF Split and merge. Si hacéis clic sobre el nombre, iréis a su web, y en la sección Download, lo podréis descargar. Se trata de una pequeña aplicación muy sencilla, en castellano, que permite «despiezar» un PDF, en PDF que corresponden a cada una de las hojas del principal. Así que despiezando los dos archivos, luego, estableciendo el orden que nosotros deseemos, podemos volver a montarlo en un solo archivo. Así que ya veis, mi solución es escanear las dos caras, obtengo dos archivos, los despiezo, y luego intercalo las hojas ¡chupao!
Aquí os dejo una captura de la aplicación. Podéis ver 3 pestañas. «Merge» para unir, «Split» para desmontar, y Settings para cambiar el idioma y el skin (te pierdes en estos settings). Realmente es un programa sin ningún misterio.
Tercer paso. No hay tercer paso, pero lo tenía que poner para aparentar…
Pero bueno, aprovechando y celebrando que no hay tercer paso, os hablaré de dos programas relacionados con los PDF.
El primero es el VISOR DE PDF. Todo el mundo tiene uno, y por estrategias de mercado, suele ser el Adobe Acrobat Reader ¡pues no! ¡Este programa es más lento que el caballo del malo! Me hierve la sangre cuando empiezo a ver que arranca, y venga mostrar licencias y logos y manifiestos ¡argh! Yo tengo un lector llamado Foxit Reader, que me abre un PDF, incluso antes de decirle que lo haga…Si hacéis clic sobre el nombre, descargaréis directamente el programa. Os recomiendo probarlo, y si os convence, podréis deshaceros del Adobe. Este es un producto de Foxit Software, que al igual que Adobe, posee un montón de aplicaciones al respecto (para hacer negocio vaya).
El segundo programa es otra aplicación de software libre, llamada PDF Creator, que si mi inglés y mi cabeza no me fallan, es para CREAR PDF. De nuevo, haciendo clic sobre el nombre, descargaréis directamente este programa. Con él os permitirá guardar cualquier documento en PDF, además lo hace de una manera muy sencilla, instala una impresora virtual, de manera que, cuando nosotros queremos guardar un archivo, le damos al botón «Imprimir» del programa en el que estemos, seleccionamos de las impresoras, una llamada PDF Creator, y Aceptar. Inmediatamente, aparece un menú donde darle nombre al archivo, autor, etc, y la ruta donde queremos guardarlo ¡et voilà! Ya hemos hecho un PDF. Este programa es un proyecto de software libre llamado pdfforge.org.
Espero que esto os sirva en algún momento, y ya me contaréis si alguno probáis cualquiera de estas aplicaciones. Ademas me darán una botella de lejía, sin casco y vacía, cada vez que alguien se instale cualquier programa de estos…
Buenas, amigo.
La verdad es que tenía pendiente escribirte sobre lo que aqui epxlicas, pero la vida loca que llevo no me había dejado hasta ahora. Y no es que no tenga nada que hacer, sino que no tengo ganas de hacerlo, y mira, procastino un poco en tu blog 😉
Yo ya llevo muchisimo tiempo intentando organizar lo que yo llamo mis «assets digitales», o sea, todo eso que puede estar archivado en un ordenador. He de decir que me he vuelto un «PC centric», todo lo tengo en mi ordenador, todo lo que se puede tener en el por supuesto. Tanto es así que a las reuinones no voy con libreta sino con portátil, y las notas las tomo directamente sobre el para tenerlas indexadas.
Lo que tu estás haciendo está regular, tiene un gran problema, y es que lo que tu guardas al final son mapas de bits de las páginas, eso quiere decir que no tienes posibilidad de búsqueda con los indexadores habituales, lease copernic desktop search que yo uso asiduamente. En el caso de la HBR no es tanto problema, porque los índices de la publicación está en la web, o sea que o te los bajas o consultar alli directamente.
Yo a veces uso también el onenote de microsoft que tiene un módulo OCR que dada una imagen me extrae el texto y lo deja de una forma que permita indexarlo. No es perfecto, pero algo es algo. Al menos me permite buscar con el copernic. Solo OCRizo el indice.
Mi estrategia se basa en todos los libros en PDF, copernic desktop search para indexar, Bullzip PDF printer para convertir impresiones en PDF, el Word para pegar textos por ejemplo de los RSS y convertirlos en PDF, y onenote para trozos de algo mucho mas gande, como párrafos de un PDF.
Seguro que no queda claro, pero lo hago a proposito para que vengais a mi blog.
¡¡¡Está clarísimo!!!
¡Que nadie se mueva!¡Quedaros en mi blog, traidores! jajajaja
Es broma, si hasta tengo un enlace para que de vez en cuando tengas alguna visita en tu blog…
Pues nada, me voy a poner a investigar, ya había pensado en ese problema, pero lo había dejado para que lo resolviera otro, como finalmente ha ocurrido…jejeje
Saludos
Un programita que me parece muy interesante es el asksam, una bd freeform, pero yo no la he probado. Te lo dejo para ti.
http://www.asksam.com/