Hice un código en PHP bastante rudimentario pero que logra el objetivo: convierte archivos HTML a texto y los deja en una única línea dentro de un .txt.
Copio abajo el código. La librería html2text_v3.php es esta:http://www.howtocreate.co.uk/php/html2texthowto.html; sólo que la modifiqué a conveniencia. En realidad, jugué con los parámetros.
__
ETIQUETA php de inicio
// INCLUDES
include 'html2text_v3.php';
//FUNCTIONS
/*
Convierte los contenidos de un HTML a texto y los agrega al target_file
Parámetros:
source_file_name: string que contiene el path al archivo de origen en formato html
target_file: archivo de destino
*/
function conversion($source_file_name, $target_file) {
$source_file = file_get_contents($source_file_name);
echo fwrite($target_file,html2text($source_file));
}
//BODY
//Nombre del archivo destino único
$target_file_name = "target/target_file.txt";
//Prepara el archivo destino para escritura
$target_file = fopen($target_file_name,"w");
//Listado de archivos origen
$source = array("source/MLA-433977790-celular-samsung-galaxy-y-pro-b5510-libre-de-fabrica-necxus-_JM.html",
"source/MLA-434142480-blackberry-8520-liberado-local-a-la-callelomas-de-zamora-_JM.html",
"source/MLA-434984962-apple-iphone-5-16gb-pantalla-4-wifi-liberado-chip-a6-ios6-_JM.html");
//Recorre el arreglo de archivos origen escribiendo los contenidos html convertidos a texto en el archivo destino
for ($i = 0; $i <= count($source)-1; $i++) {
conversion($source[$i], $target_file);
}
//Cierra el archivo destino
fclose($target_file);
ETIQUETA php de fin
No hay comentarios:
Publicar un comentario