This project has moved. For the latest updates, please go here.

Deprecated HTML

Topics: Developer Forum, User Forum
Feb 10, 2011 at 7:34 PM

Hello I am using HtmlAgilityPack to scrap an Html file which uses deprecated tags, <center> that is.  I manage to identify the HtmlNodes to a center tag's parent node by using its xpath, however, HtmlAgilityPack doesn't seem to handle deprecated tags because, by debugging i can see that the <center> tag's parent node doesn't possess  any children.  Here is the all the info on what im doing:


Html being parsed:(What you need to see)


<html>                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                 <body >
<form>                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                          <td id=myId>                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                              <center>                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                      <div>


My code:

HtmlNode.ElementsFlags.Remove("form")                                                                                                                                                                                                                                                                                                                                                                                                                                                          doc = new HtmlAgilityPack.HtmlDocument()                                                                                                                                                                                                                                                                                                                                                                                                                                                           doc.Load(myUrl)                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                Dim node As HtmlNodeCollection = doc.DocumentNode.SelectNodes("/html/body/form/td[@id='myId']")(0)


Its sort of a rushing issue, id appreciate and fast answer or clues thanks in advance!