- Хроники. - -

HTML парсинг (parsing).

Posted By Ikutsin On 29 июля 2008 @ 14:10 In .NET C#,HTML, AJAX, JS & CSS,Как? | Comments Disabled

Здесь [1] я уже говорил об одном из способов преобразовать HTML в XML для упрощения дальнейшей работы с ним. Теперь я расскажу еще об одной библиотеке под названием Html Agility Pack [2].

Архив проекта состоит из исходного кода, документации и нескольких примеров — как конвертировать HTML в текст, RSS или XML.

Вот — небольшой пример использования парсера:

HtmlWeb htmlWeb = new HtmlWeb();
HtmlDocument doc = htmlWeb.Load(«http://www.bbc.co.uk/»);

HtmlNodeCollection links =
doc.DocumentNode.SelectNodes(«//a[@href]»);

foreach (HtmlNode link in links)
{
Response.Write(link.Attributes[«href»].Value + »
«
);
}


Article printed from Хроники.:

URL to article: /134-html-parsing-parsing

URLs in this post:

[1] Здесь: /132-ispravlyaem-html-dlya-chteniya-kak-xml

[2] Html Agility Pack: http://www.codeplex.com/htmlagilitypack/Release/ProjectReleases.aspx?ReleaseId=272

Copyright © 2008 Все, что меня окружает. All rights reserved.