#网络爬虫# novel-plus 是一个多端(PC、WAP)阅读 、功能完善的小说 CMS 系统。包括小说推荐、小说检索、小说排行、小说阅读、小说书架、小说评论、小说爬虫、会员中心、作家专区、充值订阅、新闻发布等功能。
#网络爬虫# Flexible Node.js AI-assisted crawler library
The archivist's web crawler: WARC output, dashboard for all crawls, dynamic ignore patterns
翻译 - 档案管理员的网络爬虫:WARC输出,所有爬网的仪表板,动态忽略模式
#网络爬虫# Crawl telegra.ph searching for nudes!
Create a full-text search index by crawling your site
翻译 - 一个站点搜索引擎
#自然语言处理# HTML to Markdown converter and crawler.