Posted in: ,
By Unknown 0 comments

Parse html entities into perl string

原文在此

昨天遇到一個頁面,他把部分內容用javascript顯示,大概是這樣

addy7788 = addy7788 + 'ucxray' + '.' + 'berkeley' + '.' + 'edu';
很明顯的除了特殊符號之外,一般文字也在裏頭,但是HTML::Entities只能處理掉特殊符號,必須要再用Text::Unidecode把文字轉出來(你要把它手動轉成\x{101}這樣也是可以拉,不過有寫好的套件不用白不用),用法大概就是這樣:
unidecode(decode_entities($str));
 搞定

Leave a Reply