SEO Tools - Indexed pages 搜尋系統(SE) 是否代表一切?
Oct 06

php中高效能清除html

1 Star2 Stars3 Stars4 Stars5 Stars (1 votes, average: 3 out of 5)
Loading ... Loading ...

在字符截取時常會因為HTML格式發生意外,ASP是,PHP也是,如果是可預見的簡單HTML格式用replace就行了,對於文章正文這一類裡面可能包含所有的HTML格式,想高效點還是用下面的的,已測試

  1. <span id="more-10"></span>
  2. $search = array ("’<script[^>]*?>.*?</script>’si",  // 去掉 javascript
  3.  
  4. "’<[/!]*?[^<>]*?>’si",           // 去掉 HTML 標記
  5.  
  6. "’([rn])[s]+’",                 // 去掉空白字符
  7.  
  8. "’&amp;(quot|#34);’i",                 // 替換 HTML 實體
  9.  
  10. "’&amp;(amp|#38);’i",
  11.  
  12. "’&amp;(lt|#60);’i",
  13.  
  14. "’&amp;(gt|#62);’i",
  15.  
  16. "’&amp;(nbsp|#160);’i",
  17.  
  18. "’&amp;(iexcl|#161);’i",
  19.  
  20. "’&amp;(cent|#162);’i",
  21.  
  22. "’&amp;(pound|#163);’i",
  23.  
  24. "’&amp;(copy|#169);’i",
  25.  
  26. "’&amp;#(d+);’e");                    // 作為 PHP 代碼運行<!–more–>
  27.  
  28. <strong>$replace = array ("",
  29.  
  30. "",
  31.  
  32. "\1",
  33.  
  34. "\"",
  35.  
  36. "&amp;",
  37.  
  38. "<",
  39.  
  40. ">",
  41.  
  42. " ",
  43.  
  44. chr(161),
  45.  
  46. chr(162),
  47.  
  48. chr(163),
  49.  
  50. chr(169),
  51.  
  52. "chr(\1)");
  53.  
  54. //$document為需要處理字符串,如果來源為文件可以$document = file_get_contents($filename);
  55.  
  56. $text = preg_replace($search, $replace, $document);
  57. ?></strong>

Written by 傻仔仔

光波24書網(http://www.24reader.com/) - 免費電子書

  

光波24書網(http://www.24reader.com/) - 新到電子書

  

光波24書網(http://www.24reader.com/) - 快將推出電子書




發表一條評論