号外号外: 原[图享网]更名为 码友网(codedefault.com) 啦,感谢大家一路上的陪伴与支持。代码的世界里,码友网与大家一起同行!

归纳整合一下.NET下各种可用的HTML解析组件(HtmlAgilityPack,Jumony,ScrapySharp,NSoup,Fizzler)

类库组件 作者: Rector 7843阅读 0评论 0收藏 收藏本文

郑重申明:本文未经许可,禁止任何形式转载

做数据抓取,网络爬虫方面的开发,自然少不了解析HTML源码的操作。那么问题来了,到底.NET如何来解析HTML,有哪些解析HTML源码的好用的,有效的组件呢?   作者在开始做这方面开发的时候就被这些问题困扰着,开始是使用的正则表达式来解析,但用正则的缺点在于你需要对正则表达式相当熟悉,并且解析过程非常烦琐,经过时间和实做的积累,现归纳整合一下.NET下各种可用的HTML解析组件,这其中包括:
  1. CsQuery
  2. AngleSharp
  3. Jumony
  4. HtmlAgilityPack
  5. Fizzler
  6. ScrapySharp
  7. NSoup
使用组件解析HTML,可以避免正则表达的烦琐,并高效得到需要的解析结果数据。

阅读了该文章的人还浏览了...

本文永久链接码友网 » 归纳整合一下.NET下各种可用的HTML解析组件(HtmlAgilityPack,Jumony,ScrapySharp,NSoup,Fizzler)

发布于: 2014-12-20 12:36:51
分享扩散:

文章评论

获取验证码