DOMXpath je skvělý nástroj pro zpracování XML a HTML souborů. Umožňuje dle speciální syntaxe vypsat pouze požadované části souboru dle specifických tagů, identifikátorů, tříd nebo obsahu elementů.
Obsahuje však bug, díky kterému není korektně rozpoznáno UTF8 kódování zdrojového souboru. Výsledkem je pak špatná reprezentace diakritiky.
Tento problém je však možné celkem snadno obejít. Místo metody loadHTMLfile je nutné použít loadHTML. Požadovaný soubor je nutné předem načíst a provést úpravu hlavičky.
<?php
$file = file_get_contents('http://www.example.com');
$file = preg_replace('/<head[^>]*>/','<head><META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=utf-8">',$file);
$doc = new DOMDocument();
$doc->loadHTML($file);
?>

Poslední komentáře
5 dnů 6 hod zpět
6 dnů 9 hod zpět
6 dnů 9 hod zpět
1 týden 3 dny zpět
1 týden 3 dny zpět
1 týden 3 dny zpět
7 týdnů 5 dnů zpět
10 týdnů 2 dny zpět
1 rok 22 týdnů zpět
1 rok 26 týdnů zpět