А подскажите пожалуйста как с помощью PHP преобразовать html код в текст и сохранить в txt
Добавлено:
<?php
$search = array ("'<script[^>]*?>.*?</script>'si", // Вырезается javascript
"'<[\/\!]*?[^<>]*?>'si", // Вырезаются html-тэги
"'([\r\n])[\s]+'", // Вырезается пустое пространство
"'&(quot|#34);'i", // Замещаются html-элементы
"'&(amp|#38);'i",
"'&(lt|#60);'i",
"'&(gt|#62);'i",
"'&(nbsp|#160);'i",
"'&(iexcl|#161);'i",
"'&(cent|#162);'i",
"'&(pound|#163);'i",
"'&(copy|#169);'i"
);
$replace = array ("",
"",
"\\1",
"\"",
"&",
"<",
">",
" ",
chr(161),
chr(162),
chr(163),
chr(169)
);
$text = file_get_contents('http://adobe/union.txt');
$text = preg_replace('/message.*?">/i', '', $text);
$text = preg_replace('/<blockquote.*?<\/blockquote>/s', '', $text);
$text = preg_replace('/<cite>.*?<\/cite>/s', '', $text);
$text = preg_replace('/<strong>.*?<\/strong>/s', '', $text);
$text = preg_replace('/<strong>.*?<\/strong>/s', '', $text);
$text = preg_replace('/<div class="updated">.*?секунд/s', '', $text);
$text = preg_replace('/<p>,/s', '<p>', $text);
echo "$text";
$text = preg_replace($search, $replace, $text);
echo "$text";
$fp = fopen('twitts.txt', 'w');
fwrite($fp, $text);
fclose($fp);
?>
Добавлено:
<?php
$search = array ("'<script[^>]*?>.*?</script>'si", // Вырезается javascript
"'<[\/\!]*?[^<>]*?>'si", // Вырезаются html-тэги
"'([\r\n])[\s]+'", // Вырезается пустое пространство
"'&(quot|#34);'i", // Замещаются html-элементы
"'&(amp|#38);'i",
"'&(lt|#60);'i",
"'&(gt|#62);'i",
"'&(nbsp|#160);'i",
"'&(iexcl|#161);'i",
"'&(cent|#162);'i",
"'&(pound|#163);'i",
"'&(copy|#169);'i"
);
$replace = array ("",
"",
"\\1",
"\"",
"&",
"<",
">",
" ",
chr(161),
chr(162),
chr(163),
chr(169)
);
$text = file_get_contents('http://adobe/union.txt');
$text = preg_replace('/message.*?">/i', '', $text);
$text = preg_replace('/<blockquote.*?<\/blockquote>/s', '', $text);
$text = preg_replace('/<cite>.*?<\/cite>/s', '', $text);
$text = preg_replace('/<strong>.*?<\/strong>/s', '', $text);
$text = preg_replace('/<strong>.*?<\/strong>/s', '', $text);
$text = preg_replace('/<div class="updated">.*?секунд/s', '', $text);
$text = preg_replace('/<p>,/s', '<p>', $text);
echo "$text";
$text = preg_replace($search, $replace, $text);
echo "$text";
$fp = fopen('twitts.txt', 'w');
fwrite($fp, $text);
fclose($fp);
?>