软件说明
IronWebScraper
IronWebScraper可以轻松地从C#中的网站中查找和阅读内容
它使Web Scraping在C#中变得容易,为您提供了一个擦除网站内容的工具。
C# 或 .Net 中的web擦除
IronWebScraper是一个用C#编写的高级Web 擦除库。它使用Web抓取算法从网站中读取结构化内容。这是从多个现有网站或Intranet应用程序中抓取内容以构建Web应用程序或存档内容的理想选择。 IronWebScraper可以提供您所需的工具,以索引您的内容供您的搜索应用程序或编目系统使用。IronWebScraper使用C#提供了一个可靠的企业级Web scraper来使用DLL库。
IronWebScraper API易于使用。大多数C#开发人将使用Visual Studio的Nuget安装程序立即启动并运行。
不会使用启动并运行。
将网站迁移到数据库
IronWebScraper提供了工具和方法,可以让您将网站重新设计成结构化数据库。将内容从旧版网站和内部网迁移到新的C#应用程序时,此技术非常有用。
填充搜索索引
IronWebScraper是一个理想的工具,可以为您的搜索索引抓取内容。IronSearch等搜索应用程序可以从IronWebScraper中读取结构化内容,构建强大的企业搜索系统。
IronWebScraper (4.0.4.2)新特征
- 通过域和IP地址自动节流
- 幕后大量多线程
- 使用XPath,JavaScript或jQuery样式的DOM查询解析HTML。
- 暂停和恢复功能