2007年11月02日(金) 19:37

HTMLのドキュメントから繰り返し部分をみつける - bits and bytes/MSM

大量のデータを複数のページにわけて表示しているHTMLドキュメントを対象に、ドキュメント中に含まれる繰り返し部分のXPathを生成するブログラムをjavascriptで作りました。
複数ページのドキュメントからHTMLドキュメントを解析して繰り返しを見つける。
エントリーナビ