用逗号分隔用户名
本帖由 小叶 于 2005-10-25 发布。版面名称:源码讨论
http://www.92key.com/s/ 老外做的开源系统, 国内汉化的一塌糊涂,,,除了界面外, 连编码都没转换.
过后研究。帝国搜索引擎也将不久面市
哦,
你可以对这个进行二次开发就不错了,, 开源的东西,,有一些技术已经很成熟, 一些缩略,快照没有,还有一些关键字区分不好,,
搜索好像不是很好。我主要研究蜘蛛织网。。。
好像就是OE技术,,而且速度和效率很低,, 我怀疑这个开源程序的官方自己用Exe这样的实体软件做爬行..
机器开着,影响不大,不过用exe可实现多线程,效果会更好
但数据库膨胀急剧厉害...一个站爬下就几百M了..
嗯,是个比较大的问题
以前落伍一个叫bigfoot的开发过一个独立引擎的搜索,, 还不是找人赞助带宽和服务器,, 数据膨胀太快了,蜘蛛都不敢随便放出去咬人.
只要摸透中文分词 下一个百度也就来鸟
主要要有钱砸。:)
关注学习中。。。 下回请教
拿下一个专利 钱马上跟着来 这东东喜欢的人多了