Talvez haja um framework que faça isso, a implementação atual é manual. As tags que eu acredito serem importantes são as de tabela, li, ul e conseguir os links a partir de um
Toda a lógica utlizada pode ser mantida e expandida, mas acredito que seja melhor utilizar uma biblioteca de terceiros