<?xml version="1.0" encoding="utf-8"?><?xml-stylesheet href='http://feeds.feedsky.com/styles/temp01.xsl' type='text/xsl' ?><!--这是一个由Feedsy提供技术支持的Feed，为了提高读者阅读的体验，以及满足用户美化自己Feed的需要，我们设计了多种精美的Feed模板，提供给大家选择，所有最终呈现出来的样式，皆由用户自愿选择使用，未经许可，任何团体和个人，请不要擅自修改样式或者盗用，这是对于用户选择权的尊重。--><rss xmlns:atom="http://www.w3.org/2005/Atom" xmlns:fs="http://www.feedsky.com/namespace/feed" xmlns:wfw="http://wellformedweb.org/CommentAPI/" xmlns:slash="http://purl.org/rss/1.0/modules/slash/" xmlns:trackback="http://madskills.com/public/xml/rss/module/trackback/" xmlns:dc="http://purl.org/dc/elements/1.1/" version="2.0"><channel><atom:link href="http://feeds.feedsky.com/csdn.net/wangkun9999" type="application/rss+xml" rel="self"></atom:link><fs:self_link href="http://feeds.feedsky.com/csdn.net/wangkun9999" type="application/rss+xml"></fs:self_link><lastBuildDate>Thu, 05 Jun 2008 09:38:00 GMT</lastBuildDate><title>西洋樱草的专栏</title><item><title>lucene 全文检索简介</title><link>http://blog.csdn.net/wangkun9999/archive/2008/06/05/2512806.aspx</link><wfw:comment>comments/2512806.aspx</wfw:comment><slash:comments>0</slash:comments><wfw:commentRss>comments/commentRss/2512806.aspx</wfw:commentRss><trackback:ping>http://tb.blog.csdn.net/TrackBack.aspx?PostId=2512806</trackback:ping><description>lucene 全文检索简介&lt;img src =&quot;aggbug/2512806.aspx&quot; width = &quot;1&quot; height = &quot;1&quot; /&gt;</description><pubDate>Thu, 05 Jun 2008 17:38:00 +0800</pubDate><author>西洋樱草</author><comments>http://blog.csdn.net/wangkun9999/archive/2008/06/05/2512806.aspx#Feedback</comments><guid isPermaLink="false">http://blog.csdn.net/wangkun9999/archive/2008/06/05/2512806.aspx</guid><dc:creator>西洋樱草</dc:creator></item><item><title>拆取 Web 页</title><link>http://blog.csdn.net/wangkun9999/archive/2007/05/06/1598162.aspx</link><wfw:comment>comments/1598162.aspx</wfw:comment><slash:comments>0</slash:comments><wfw:commentRss>comments/commentRss/1598162.aspx</wfw:commentRss><trackback:ping>http://tb.blog.csdn.net/TrackBack.aspx?PostId=1598162</trackback:ping><description>摘要： 本文讨论如何收集来自 Web 的信息，并借助 Internet Explorer 的可重用分析器组件，将它分布到其他 Web 页或数据库。现在，通过使用象 WinInet.dll 这样的 HTTP 组件或许多其他第三方组件，您就可以获取 Web 页，并利用几百种字符串处理功能来获得网页中您所感兴趣的部分。第一个组件 shdocvw.dll，包含称为 WebBrowser 的 Microsoft(R) ActiveX(R) 控件，它真实地显示 Web 页。第二个组件 mshtml.dll，含有能分析 WebBrowser 控件中所包含文档的 HTML 分析器。图 1. 在工具箱中，可看见 WebBrowser 组件。&lt;img src =&quot;aggbug/1598162.aspx&quot; width = &quot;1&quot; height = &quot;1&quot; /&gt;</description><pubDate>Sun, 06 May 2007 23:48:00 +0800</pubDate><author>西洋樱草</author><comments>http://blog.csdn.net/wangkun9999/archive/2007/05/06/1598162.aspx#Feedback</comments><guid isPermaLink="false">http://blog.csdn.net/wangkun9999/archive/2007/05/06/1598162.aspx</guid><dc:creator>西洋樱草</dc:creator></item><item><title>lucene.net 中htmlparser 的使用</title><link>http://blog.csdn.net/wangkun9999/archive/2007/05/06/1598157.aspx</link><wfw:comment>comments/1598157.aspx</wfw:comment><slash:comments>0</slash:comments><wfw:commentRss>comments/commentRss/1598157.aspx</wfw:commentRss><trackback:ping>http://tb.blog.csdn.net/TrackBack.aspx?PostId=1598157</trackback:ping><description>如果使用改api DemoLib.ll此api 有2个名字空间namespace Lucene.Net.Demonamespace Lucene.Net.Demo.Html我们要使用到该名字下 class HTMLParser比如我们要解析c:\test.htm 我们可以用如下的方法，protected.&lt;img src =&quot;aggbug/1598157.aspx&quot; width = &quot;1&quot; height = &quot;1&quot; /&gt;</description><pubDate>Sun, 06 May 2007 23:44:00 +0800</pubDate><author>西洋樱草</author><comments>http://blog.csdn.net/wangkun9999/archive/2007/05/06/1598157.aspx#Feedback</comments><guid isPermaLink="false">http://blog.csdn.net/wangkun9999/archive/2007/05/06/1598157.aspx</guid><dc:creator>西洋樱草</dc:creator></item><item><title>一个C#写的爬虫程序</title><link>http://blog.csdn.net/wangkun9999/archive/2007/05/02/1594496.aspx</link><wfw:comment>comments/1594496.aspx</wfw:comment><slash:comments>2</slash:comments><wfw:commentRss>comments/commentRss/1594496.aspx</wfw:commentRss><trackback:ping>http://tb.blog.csdn.net/TrackBack.aspx?PostId=1594496</trackback:ping><description>CodeProject上面C#的爬虫程序&lt;img src =&quot;aggbug/1594496.aspx&quot; width = &quot;1&quot; height = &quot;1&quot; /&gt;</description><pubDate>Wed, 02 May 2007 08:13:00 +0800</pubDate><author>西洋樱草</author><comments>http://blog.csdn.net/wangkun9999/archive/2007/05/02/1594496.aspx#Feedback</comments><guid isPermaLink="false">http://blog.csdn.net/wangkun9999/archive/2007/05/02/1594496.aspx</guid><dc:creator>西洋樱草</dc:creator></item><item><title>网络爬虫程序</title><link>http://blog.csdn.net/wangkun9999/archive/2007/05/01/1594467.aspx</link><wfw:comment>comments/1594467.aspx</wfw:comment><slash:comments>0</slash:comments><wfw:commentRss>comments/commentRss/1594467.aspx</wfw:commentRss><trackback:ping>http://tb.blog.csdn.net/TrackBack.aspx?PostId=1594467</trackback:ping><description>最近跟朋友开始研究搜索引擎的实现，下面是朋友参照jobo改的一个给予java的spider.&lt;img src =&quot;aggbug/1594467.aspx&quot; width = &quot;1&quot; height = &quot;1&quot; /&gt;</description><pubDate>Wed, 02 May 2007 07:12:00 +0800</pubDate><author>西洋樱草</author><comments>http://blog.csdn.net/wangkun9999/archive/2007/05/01/1594467.aspx#Feedback</comments><guid isPermaLink="false">http://blog.csdn.net/wangkun9999/archive/2007/05/01/1594467.aspx</guid><dc:creator>西洋樱草</dc:creator></item><item><title>聚焦爬虫技术研究综述</title><link>http://blog.csdn.net/wangkun9999/archive/2007/05/01/1594464.aspx</link><wfw:comment>comments/1594464.aspx</wfw:comment><slash:comments>0</slash:comments><wfw:commentRss>comments/commentRss/1594464.aspx</wfw:commentRss><trackback:ping>http://tb.blog.csdn.net/TrackBack.aspx?PostId=1594464</trackback:ping><description>搜索引擎(Search Engine)，例如传统的通用搜索引擎AltaVista，Yahoo!和Google等，作为一个辅助人们检索信息的工具成为用户访问万维网的入口和指南。&lt;img src =&quot;aggbug/1594464.aspx&quot; width = &quot;1&quot; height = &quot;1&quot; /&gt;</description><pubDate>Wed, 02 May 2007 07:08:00 +0800</pubDate><author>西洋樱草</author><comments>http://blog.csdn.net/wangkun9999/archive/2007/05/01/1594464.aspx#Feedback</comments><guid isPermaLink="false">http://blog.csdn.net/wangkun9999/archive/2007/05/01/1594464.aspx</guid><dc:creator>西洋樱草</dc:creator></item><item><title>用Lucene.net对数据库建立索引及搜索</title><link>http://blog.csdn.net/wangkun9999/archive/2007/05/01/1594041.aspx</link><wfw:comment>comments/1594041.aspx</wfw:comment><slash:comments>1</slash:comments><wfw:commentRss>comments/commentRss/1594041.aspx</wfw:commentRss><trackback:ping>http://tb.blog.csdn.net/TrackBack.aspx?PostId=1594041</trackback:ping><description>最近我一直在研究 Lucene.net ,觉得Lucene.net对数据库方面建索引的功能在网上很少见,其实它是可以对数据库进行索引的,我闲着没事,写了个测试程序,竟然成功了, 可以实现对数据另类查询的一种方式(通过建索引查询),发表出来,和大家共享.&lt;img src =&quot;aggbug/1594041.aspx&quot; width = &quot;1&quot; height = &quot;1&quot; /&gt;</description><pubDate>Tue, 01 May 2007 19:34:00 +0800</pubDate><author>西洋樱草</author><comments>http://blog.csdn.net/wangkun9999/archive/2007/05/01/1594041.aspx#Feedback</comments><guid isPermaLink="false">http://blog.csdn.net/wangkun9999/archive/2007/05/01/1594041.aspx</guid><dc:creator>西洋樱草</dc:creator></item><item><title>Lucene的包结构</title><link>http://blog.csdn.net/wangkun9999/archive/2007/04/29/1591921.aspx</link><wfw:comment>comments/1591921.aspx</wfw:comment><slash:comments>0</slash:comments><wfw:commentRss>comments/commentRss/1591921.aspx</wfw:commentRss><trackback:ping>http://tb.blog.csdn.net/TrackBack.aspx?PostId=1591921</trackback:ping><description>本文主要讨论Lucene的系统结构，希望对其结构的初步分析，更深入的了解Lucene的运作机制，从而实现对Lucene的功能扩展。&lt;img src =&quot;aggbug/1591921.aspx&quot; width = &quot;1&quot; height = &quot;1&quot; /&gt;</description><pubDate>Mon, 30 Apr 2007 00:29:00 +0800</pubDate><author>西洋樱草</author><comments>http://blog.csdn.net/wangkun9999/archive/2007/04/29/1591921.aspx#Feedback</comments><guid isPermaLink="false">http://blog.csdn.net/wangkun9999/archive/2007/04/29/1591921.aspx</guid><dc:creator>西洋樱草</dc:creator></item><item><title>使用蜘蛛程序来实现电影资料库中的自动填写功能</title><link>http://blog.csdn.net/wangkun9999/archive/2007/04/23/1575161.aspx</link><wfw:comment>comments/1575161.aspx</wfw:comment><slash:comments>0</slash:comments><wfw:commentRss>comments/commentRss/1575161.aspx</wfw:commentRss><trackback:ping>http://tb.blog.csdn.net/TrackBack.aspx?PostId=1575161</trackback:ping><description>所谓蜘蛛程序，是一个自动在网络上抓取页面内容的程序，这项技术被广泛使用于搜索引擎中，类似google的蜘蛛程序在你的网站上从index开始抓取html内容，遇到连接在按照原先设置好的规则进入下一级页面抓取内容。关于自动填写电影数据表单，是用户提供一个电影imdb编码，用户点一个连接来使用客户端的js方法来调用一个webservice，页面的内容抓取和分析都依靠webservice中的服务器端方法。&lt;img src =&quot;aggbug/1575161.aspx&quot; width = &quot;1&quot; height = &quot;1&quot; /&gt;</description><pubDate>Mon, 23 Apr 2007 08:46:00 +0800</pubDate><author>西洋樱草</author><comments>http://blog.csdn.net/wangkun9999/archive/2007/04/23/1575161.aspx#Feedback</comments><guid isPermaLink="false">http://blog.csdn.net/wangkun9999/archive/2007/04/23/1575161.aspx</guid><dc:creator>西洋樱草</dc:creator></item><item><title>搜索引擎研究---网络蜘蛛程序算法相关资料</title><link>http://blog.csdn.net/wangkun9999/archive/2007/04/22/1575107.aspx</link><wfw:comment>comments/1575107.aspx</wfw:comment><slash:comments>0</slash:comments><wfw:commentRss>comments/commentRss/1575107.aspx</wfw:commentRss><trackback:ping>http://tb.blog.csdn.net/TrackBack.aspx?PostId=1575107</trackback:ping><description>何用C#语言构造蜘蛛程序 　&quot;蜘蛛&quot;（Spider）是Internet上一种很有用的程序，搜索引擎利用蜘蛛程序将Web页面收集到数据库，企业利用蜘蛛程序监视竞争对手的网站并跟踪变动，个人用户用蜘蛛程序下载Web页面以便脱机使用，开发者利用蜘蛛程序扫描自己的Web检查无效的链接……对于不同的用户，蜘蛛程序有不同的用途。蜘蛛程序之所以是半自动的，是因为它总是需要一个初始链接（出发点），但此后的运行情况就要由它自己决定了，蜘蛛程序会扫描起始页面包含的链接，然后访问这些链接指向的页面，再分析和追踪那些页面包含的链接。&lt;img src =&quot;aggbug/1575107.aspx&quot; width = &quot;1&quot; height = &quot;1&quot; /&gt;</description><pubDate>Mon, 23 Apr 2007 07:18:00 +0800</pubDate><author>西洋樱草</author><comments>http://blog.csdn.net/wangkun9999/archive/2007/04/22/1575107.aspx#Feedback</comments><guid isPermaLink="false">http://blog.csdn.net/wangkun9999/archive/2007/04/22/1575107.aspx</guid><dc:creator>西洋樱草</dc:creator></item></channel></rss>