首页
关于本站
推荐
挨踢路
Search
1
全球通用头像Gravatar申请教程
46,014 阅读
2
潮汕话一铺路是几公里?
30,763 阅读
3
什么是潮汕八音
22,159 阅读
4
广州地区常用的DNS解析服务器
19,683 阅读
5
如何查看 FileZilla 已存的FTP站点密码
16,350 阅读
在线知识
前端技术
电子商务
操作系统
应用软件
微知识
生活百科
登录
Search
标签搜索
windows
微信
mysql
dns
12306
对乙酰氨基酚
布洛芬
win10
腾讯
浏览器
数据库
excel
退烧药
2024
农村医保
新农合
车牌信息
vpn
l2tp
typecho
老狼知识库
累计撰写
164
篇文章
累计收到
26
条评论
首页
栏目
在线知识
前端技术
电子商务
操作系统
应用软件
微知识
生活百科
页面
关于本站
推荐
挨踢路
搜索到
1
篇与
larbin
有关的结果
2016-01-04
larbin是什么?
larbin是一种开源的网络爬虫/网络蜘蛛,由法国的年轻人Sébastien Ailleret独立开发,用c++语言实现。larbin目的是能够跟踪页面的url进行扩展的抓取,最后为搜索引擎提供广泛的数据来源。Larbin只是一个爬虫,也就是说larbin只抓取网页,至于如何parse的事情则由用户自己完成。另外,如何存储到数据库以及建立索引的事情 larbin也不提供。latbin最初的设计也是依据设计简单但是高度可配置性的原则,因此我们可以看到,一个简单的larbin的爬虫可以每天获取500万的网页,实在是非常高效。利用larbin,我们可以轻易的获取/确定单个网站的所有联结,甚至可以镜像一个网站;也可以用它建立url列表群,例如针对所有的网页进行 url retrive后,进行xml的联结的获取。或者是mp3,或者定制larbin,可以作为搜索引擎的信息的来源。
2016年01月04日
3,050 阅读
0 评论
0 点赞