html - test - w3school regular expression




正則表達式從字符串中刪除HTML標記 (2)

可能重複:
正則表達式刪除HTML標記

是否有一個表達式可以獲取兩個HTML標記之間的值?

鑑於這種:

<td class="played">0</td>

我正在尋找一個表達式,它將返回0 ,剝離<td>標籤。


一個微不足道的方法是取代

<[^>]*>

一無所有。 但取決於你的輸入結構不合理,可能會失敗。


你可以用jsoup http://jsoup.org/做到這一點

Whitelist whitelist = Whitelist.none();
String cleanStr = Jsoup.clean(yourText, whitelist);






regex