![搜索引擎技术与发展](https://wfqqreader-1252317822.image.myqcloud.com/cover/53/35011053/b_35011053.jpg)
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人
1.3 你也可以做搜索引擎
由于开源软件的发展,可以借助开源软件简化搜索引擎开发工作。Java开源软件的开发环境除了JDK和Eclipse,常用的还有版本管理工具Git与构建源代码工程工具Ant和Maven。
Ant和Maven都与项目管理软件make类似。Solr本身就是用Ant构建的。从http://ant.apache.org/bindownload.cgi可以下载Ant的最新版本。
在Windows操作系统中,ant.bat与ANT_HOME、CLASSPATH 和JAVA_HOME这3个环境变量有关。需要用路径设置ANT_HOME和JAVA_HOME环境变量,并且路径不要以“\”或“/”结束,不要设置CLASSPATH。如果把Ant解压到C:\apache-ant-1.10.7,则修改环境变量PATH,增加当前路径C:\apache-ant-1.10.7\bin。
大部分用Ant构建的项目只需要如下命令:
![](https://epubservercos.yuewen.com/50C77E/18685354608165406/epubprivate/OEBPS/Images/39803_33_1.jpg?sign=1739288444-QqG8EafVO0tFSterFS46AJ5XheLUtWEN-0-2e4ceb482c42ec40e4c71ab84993493c)
可以从http://maven.apache.org/download.html下载最新版本的Maven。以maven-2.2.1版本为例,将下载的Maven压缩文件解压到C:根路径下,创建一个C:\apache-maven-2.2.1路径。修改 Windows 操作系统中的环境变量PATH,增加当前路径 C:\apache-maven-2.2.1\bin。
为了快速下载依赖项,可以修改settings.xml文件,配置Maven镜像地址:
![](https://epubservercos.yuewen.com/50C77E/18685354608165406/epubprivate/OEBPS/Images/39803_33_2.jpg?sign=1739288444-j5eGuritD7td7x0TbdwU2bkWaty1MYoS-0-d7e3f6314d732a88e8b77863756eafd2)
大部分用Maven构建的项目只需要如下命令:
![](https://epubservercos.yuewen.com/50C77E/18685354608165406/epubprivate/OEBPS/Images/39803_33_3.jpg?sign=1739288444-pmsdHYbq9ccq1QmdWz20yXw1kBa3aUn6-0-262a3d71c3e00dc3e3ca824f5c2328c9)
一个最简单的搜索引擎由索引和搜索界面两部分组成,其简单结构如图1-1所示。
![](https://epubservercos.yuewen.com/50C77E/18685354608165406/epubprivate/OEBPS/Images/39803_34_1.jpg?sign=1739288444-3THls3k40pYVdh7rZsfrKAGPce6Ypq17-0-a00a5c7b446eaf35ade70ce5ea939667)
图1-1 搜索引擎的简单结构
搜索的数据来源可以是Web或数据库,也可以是本地路径等。