{"id":351,"date":"2010-05-20T10:59:56","date_gmt":"2010-05-20T10:59:56","guid":{"rendered":"http:\/\/esferas.org\/msqlu\/2010\/05\/20\/documentos-pdf-en-los-que-se-puede-buscar\/"},"modified":"2016-04-17T08:59:01","modified_gmt":"2016-04-17T08:59:01","slug":"documentos-pdf-en-los-que-se-puede-buscar","status":"publish","type":"post","link":"https:\/\/esferas.org\/msqlu\/2010\/05\/20\/documentos-pdf-en-los-que-se-puede-buscar\/","title":{"rendered":"Documentos PDF en los que se puede buscar"},"content":{"rendered":"<p>No creas que existe una definici\u00f3n sencilla. Creo que es uno de esos aspectos t\u00e9cnicos que todos dan por sentado o que tienen varias soluciones y ninguna es absoluta. En cualquier caso tengo la sensaci\u00f3n de haber vivido esto antes, y no hace mucho.<\/p>\n<p><!--more--><\/p>\n<p>Da igual, el caso es que estoy creando la versi\u00f3n para imprimir del cat\u00e1logo web de mi empresa y estoy empleando un buen n\u00famero de peque\u00f1as herramientas para hacer el trabajo. Entre ellas est\u00e1 <\/p>\n<pre class=\"inline:true decode:1 \" >ps2pdf<\/pre>\n<p> del paquete <\/p>\n<pre class=\"inline:true decode:1 \" >ghostscript<\/pre>\n<p> y hasta ahora todo iba m\u00e1s o menos bien, pero me he dado cuenta de que no puedo buscar texto en los PDF y, oye, que es absurdo que pudiendo hacerse no se haga, \u00bf no ?.<\/p>\n<p>Tambi\u00e9n da lo mismo. Quiero hacerlo as\u00ed y he buscado por todas partes una respuesta clara y breve pero s\u00f3lo he encontrado algunas pistas que seguir. En una de las <a href=\"http:\/\/groups.google.com\/group\/comp.lang.postscript\/browse_thread\/thread\/b5eec2e0887c4489\">respuestas<\/a> de un foro de Google se hace incapi\u00e9 en que <\/p>\n<pre class=\"inline:true decode:1 \" >gs<\/pre>\n<p> debe incluir los textos como tales y no como mapas de bits, pero no explica cu\u00e1l es la opci\u00f3n para ello. Indica que tiene que ser una versi\u00f3n <em>moderna<\/em> del programa, lo que lo convierte en una respuesta correcta pero in\u00fatil.<\/p>\n<p>Sigo buscando por la red intentando encontrar la diferencia <em>interior<\/em> entre un PDF donde se puede buscar de otro que no, y c\u00f3mo crear el primer tipo.<\/p>\n<p>Y encuentro una referencia de esas que convierte mi vida casi en la de un arque\u00f3logo. Se trata de una p\u00e1gina con el <a href=\"http:\/\/www.pegasusinfocorp.com\/web_development_knowledgebase\/linuxman\/man1747.htm\">manual<\/a> del programa <\/p>\n<pre class=\"inline:true decode:1 \" >ps2pdf<\/pre>\n<p>, versi\u00f3n 5.50, en la que explica que, a excepci\u00f3n de las catorce tipograf\u00edas est\u00e1ndar<sup>[<a href=\"#pnote-108-1\" id=\"rev-pnote-108-1\">1<\/a>]<\/sup> de los PDF, todas las dem\u00e1s se convierten a mapas de bit y mezclan los c\u00f3digos de los caracteres de tal manera que la salida <strong>no es buscable<\/strong>. Tambi\u00e9n comentan que esperan arreglarlo para finales del a\u00f1o 1998.<\/p>\n<p>Jo. \u00bf Me toca ahora bucear entre los registros de cambios para ver si se lleg\u00f3 a arreglar o no ?. De momento veamos si podemos decirle que incluya los fuentes esos en nuestro cat\u00e1logo y lo mismo hasta podemos dejarlo en eso.<\/p>\n<p>Y otra b\u00fasqueda un poco m\u00e1s ajustada me lleva a la <acronym title=\"P\u00e1gina de Preguntas Frecuentes\">FAQ<\/acronym> de una publicaci\u00f3n cient\u00edfica especializada en f\u00edsica llamada <a href=\"http:\/\/iopscience.iop.org\/1742-6596\/page\/PDF guidelines\">IOPscience<\/a> en la que aconsejan emplear \u00abbuenas\u00bb tipograf\u00edas, concretamente hablan de emplear Tipo 1 en lugar de Tipo 3, de c\u00f3mo asegurarse de que las fuentes est\u00e1n insertas en el documento usando programas como <\/p>\n<pre class=\"inline:true decode:1 \" >pdffonts<\/pre>\n<p>, y de usar las opciones adecuadas en los programas <\/p>\n<pre class=\"inline:true decode:1 \" >ps2pdf<\/pre>\n<p> y familia.<\/p>\n<p>En mi caso he visto que me ponga como me ponga no hay manera. El documento PDF no tiene las tipograf\u00edas embebidas y no hay forma de buscar en \u00e9l.<\/p>\n<p>Por el momento &#8230;<\/p>\n<div class=\"footnotes\">\n<h4>Notes<\/h4>\n<p>[<a href=\"#rev-pnote-108-1\" id=\"pnote-108-1\">1<\/a>] Son la Courier, la Helvetica, la familia Times, la  Symbol y la ZapfDingbats<\/p>\n<\/div>\n","protected":false},"excerpt":{"rendered":"<p>No creas que existe una definici\u00f3n sencilla. Creo que es uno de esos aspectos t\u00e9cnicos que todos dan por sentado o que tienen varias soluciones y ninguna es absoluta. En cualquier caso tengo la sensaci\u00f3n de haber vivido esto antes, y no hace mucho.<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"_import_markdown_pro_load_document_selector":0,"_import_markdown_pro_submit_text_textarea":"","webmentions_disabled_pings":false,"webmentions_disabled":false,"footnotes":""},"categories":[2],"tags":[222],"class_list":["post-351","post","type-post","status-publish","format-standard","hentry","category-software","tag-pdf"],"_links":{"self":[{"href":"https:\/\/esferas.org\/msqlu\/wp-json\/wp\/v2\/posts\/351","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/esferas.org\/msqlu\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/esferas.org\/msqlu\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/esferas.org\/msqlu\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/esferas.org\/msqlu\/wp-json\/wp\/v2\/comments?post=351"}],"version-history":[{"count":0,"href":"https:\/\/esferas.org\/msqlu\/wp-json\/wp\/v2\/posts\/351\/revisions"}],"wp:attachment":[{"href":"https:\/\/esferas.org\/msqlu\/wp-json\/wp\/v2\/media?parent=351"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/esferas.org\/msqlu\/wp-json\/wp\/v2\/categories?post=351"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/esferas.org\/msqlu\/wp-json\/wp\/v2\/tags?post=351"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}