{"id":4480,"date":"2023-03-08T11:15:57","date_gmt":"2023-03-08T10:15:57","guid":{"rendered":"https:\/\/esferas.org\/msqlu\/?p=4480"},"modified":"2023-03-08T11:15:57","modified_gmt":"2023-03-08T10:15:57","slug":"100daystooffload-dia-7-organizando-entornos-y","status":"publish","type":"post","link":"https:\/\/esferas.org\/msqlu\/2023\/03\/08\/100daystooffload-dia-7-organizando-entornos-y\/","title":{"rendered":"100DaysToOffload: d\u00eda 7 &#8211; organizando entornos y &#8230;"},"content":{"rendered":"\n<p>&#8230; obteniendo los primeros datos. <\/p>\n\n\n\n<!--more-->\n\n\n\n<p>He creado un peque\u00f1o repositorio para ir guardando las diferentes herramientas que voy a utilizar en la recuperaci\u00f3n del banco de im\u00e1genes de la enana. Lo he llamado <em>rdioy<\/em> que es una acr\u00f3nimo para \u00abRecuperaci\u00f3n De Im\u00e1genes Ou Yeah\u00bb porque es algo completamente privado y <em>rdi<\/em> me parec\u00eda un poco soso. <\/p>\n\n\n\n<p>He creado otra copia m\u00e1s de las im\u00e1genes en un directorio de uno de los discos externos de 3Tb anclado al servidor principal de casa. En \u00e9l he puesto todo bajo la ruta <em>originales.d<\/em> y he a\u00f1adido <em>tmp<\/em> y <em>finales.d<\/em> para trabajar con el contenido y donde almacenar el resultado final.<\/p>\n\n\n\n<p>Como el total ocupa 111gb y tengo que mantener al menos un par de juegos de archivos no es posible meterlo en el ordenador de desarrollo. He creado un par de scripts para que seleccionen al azar un n\u00famero concreto de archivos (y directorios), los empaqueten en un <em>tar<\/em> y los pasen a mi m\u00e1quina. All\u00ed los he descomprimido y es lo que empleo para trabajar con los diferentes casos. <\/p>\n\n\n\n<p>El programa que sumariza los contenidos lo hace con el tipo MIME utilizando el paquete File::MimeInfo::Magic que me parece m\u00e1s completo que los otros, que ya te dicen que trabajan s\u00f3lo con la extensi\u00f3n de archivos. Algo est\u00fapido que hemos heredado de Windows y dem\u00e1s y que tiene muy poco valor. <\/p>\n\n\n\n<p>El sumario del contenido es el siguiente:<\/p>\n\n\n\n<pre class=\"wp-block-preformatted\">osr@matraz:~\/git\/rdioy$ find originales.d\/ | perl bin\/sumario\n   En total  28578\n   Im\ufffdgenes  25896\n     V\ufffddeos    883\nDirectorios   1095\nOtros tipos \n            1 application\/vnd.ms-powerpoint\n            3 text\/html\n            3 text\/x-python\n            4 application\/octet-stream\n            1 application\/smil+xml\n           12 application\/vnd.sqlite3\n          436 application\/xml\n          107 application\/gzip\n            1 application\/msword\n            2 application\/pdf\n            4 application\/zip\n          111 text\/plain\n            3 application\/x-sqlite2\n            1 application\/x-trash\n            2 application\/x-ole-storage\n            5 application\/x-perl\n            2 application\/x-theme\n            1 application\/x-compressed-tar\n            1 audio\/x-wav\n            1 application\/vnd.oasis.opendocument.text\n            3 application\/x-python-bytecode\n<\/pre>\n\n\n\n<p>Lo que ya me da una idea de todo lo que hay que limpiar y separar. Los archivos <em>xml<\/em> me parece que son metadatos de las im\u00e1genes que no pueden llevarlo. Tengo que ampliar los resultados para que me indique los tipos de im\u00e1genes y de v\u00eddeos. <\/p>\n\n\n\n<p>Seguir\u00e9 con el plan que ya describ\u00ed en la entrada anterior e ir\u00e9 anunciando los resultados aqu\u00ed. <\/p>\n","protected":false},"excerpt":{"rendered":"<p>&#8230; obteniendo los primeros datos.<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_import_markdown_pro_load_document_selector":0,"_import_markdown_pro_submit_text_textarea":"","webmentions_disabled_pings":false,"webmentions_disabled":false,"footnotes":""},"categories":[1205],"tags":[1249],"class_list":["post-4480","post","type-post","status-publish","format-standard","hentry","category-100daystooffload","tag-rdioy"],"_links":{"self":[{"href":"https:\/\/esferas.org\/msqlu\/wp-json\/wp\/v2\/posts\/4480","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/esferas.org\/msqlu\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/esferas.org\/msqlu\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/esferas.org\/msqlu\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/esferas.org\/msqlu\/wp-json\/wp\/v2\/comments?post=4480"}],"version-history":[{"count":2,"href":"https:\/\/esferas.org\/msqlu\/wp-json\/wp\/v2\/posts\/4480\/revisions"}],"predecessor-version":[{"id":4482,"href":"https:\/\/esferas.org\/msqlu\/wp-json\/wp\/v2\/posts\/4480\/revisions\/4482"}],"wp:attachment":[{"href":"https:\/\/esferas.org\/msqlu\/wp-json\/wp\/v2\/media?parent=4480"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/esferas.org\/msqlu\/wp-json\/wp\/v2\/categories?post=4480"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/esferas.org\/msqlu\/wp-json\/wp\/v2\/tags?post=4480"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}