2008년 10월 29일 수요일

HTML Parsing in .Net


Html Agility Pack


HtmlDocument doc = new HtmlDocument();
HtmlAttribute attr = null;
String uri = "";

doc.Load(file, Encoding.UTF8);
if (doc.DocumentNode.SelectNodes("//img[@src]") != null)
{
foreach (HtmlNode node in doc.DocumentNode.SelectNodes("//img[@src]"))
{
uri = node.GetAttributeValue("src", "");
attr = node.SetAttributeValue("src", String.Format("{0}{1}", virtualPath, uri));
}
}
if (doc.DocumentNode.SelectNodes("//td[@background]") != null)
{
foreach (HtmlNode node in doc.DocumentNode.SelectNodes("//td[@background]"))
{
uri = node.GetAttributeValue("background", "");
attr = node.SetAttributeValue("background", String.Format("{0}{1}", virtualPath, uri));
}
}
doc.Save(file + ".htm", Encoding.UTF8);

댓글 없음: