- Хроники. - -
HTML парсинг (parsing).
Posted By Ikutsin On 29 июля 2008 @ 14:10 In .NET C#,HTML, AJAX, JS & CSS,Как? | Comments Disabled
Здесь [1] я уже говорил об одном из способов преобразовать HTML в XML для упрощения дальнейшей работы с ним. Теперь я расскажу еще об одной библиотеке под названием Html Agility Pack [2].
Архив проекта состоит из исходного кода, документации и нескольких примеров — как конвертировать HTML в текст, RSS или XML.
Вот — небольшой пример использования парсера:
HtmlWeb htmlWeb = new HtmlWeb();
HtmlDocument doc = htmlWeb.Load(«http://www.bbc.co.uk/»);HtmlNodeCollection links =
doc.DocumentNode.SelectNodes(«//a[@href]»);foreach (HtmlNode link in links)
{
Response.Write(link.Attributes[«href»].Value + »
«);
}
Article printed from Хроники.:
URL to article: /134-html-parsing-parsing
URLs in this post:
[1] Здесь: /132-ispravlyaem-html-dlya-chteniya-kak-xml
[2] Html Agility Pack: http://www.codeplex.com/htmlagilitypack/Release/ProjectReleases.aspx?ReleaseId=272
Click here to print.
Copyright © 2008 Все, что меня окружает. All rights reserved.